2024年3月11日发(作者:连晓瑶)
ISSN1009-3044
Computer
Knowledge
Knowledge
and
and
Technology
Technology
电脑知识
电脑知识
与技术
Computer
与技术
Vol.17,No.15
May
2021
E-mail:*************.cn
第17卷第15期(2021年5月)
http://
Tel:+86-551-6569
基于TINYYOLO2神经网络视觉翻译棒
刘潇元,任钊婷,杨晨
(西北民族大学,甘肃兰州730030)
摘要:2015年10月,AlphaGo在没有任何让子的情况下,以5:0的悬殊比分击溃欧洲围棋冠军樊麾二段。随即第二年六月
战胜第一围棋手柯洁。人工智能初露锋芒,而在当今人工智能的发展下各个产业出现了新的转变,人脸识别,视网膜识
别,虹膜识别,掌纹识别,专家系统,无人驾驶,智能搜索,定理证明,博弈等人工智能逐渐改变着人们的生活,神经网络在
图像处理的运用上更加广泛,常应用于车辆检测、目标分类识别。本项目意在通过YOLO2的剪枝算法TINYyolo2实现在
嵌入式soc上进行目标检测达到图像转文字的目的。再尔,通过云服务实现文字转语音的服务。完成整个项目的目的,即
图像转文字的过程,适用于幼儿教学市场。
关键词:TINYYOLO2;云服务;视觉翻译
中图分类号:TP311文献标识码:A
开放科学(资源服务)标识码(OSID):
文章编号:1009-3044(2021)15-0182-02
1神经网络单元TPU介绍
在芯片集成度方面,勘智K210采用视听一体化设计。在
机器视觉上,芯片基于自主研发的神经网络加速器KPU,可完成
基于神经网络的图像分类任务,进行人脸识别与检测,以及实时
获取被检测目标的分类。在听觉能力上,芯片自带APU语音处
理单元,最高可支持8路音频数据及16个方向,无须占用CPU即
可实现声源定向、声场成像、波束形成、语音识别与唤醒等
功能。
在算法定制化方面,勘智K210在可编程能力上呈现出更
高的灵活性。首先,相比ARM等架构,勘智K210采用RISC-V
架构,拥有更强的可定制化能力,便于开发者根据具体应用场景
定制算法。其次,芯片搭载FPIOA现场可编程IO阵列,支持
TensorFlow、Keras、Darknet、PaddlePaddle和Caffe等主流AI编程
框架,以及全面的开发文档,对开发者十分友好。
示,YOLO通过对输入图像进行推测,得到图中所有物体的位置
及其所属类别的相应概率。
YOLO的网络模型结构包含有24个卷积层和2个全链接
层,其具体结构如下:
2摄像头
OV7670,本设计采用自带FiFo的模组,使用FIFO模组可
以大大减少K210的计算量,数字摄像头的构成主要是由镜头、
基座、红外滤波片、图像传感器。部分数字摄像头可能带有马
达用以调节像距。本设计中为了提高处理速度,使用CIF格式
的图像格式传输到K210中进行计算,经过实际的测试,空载的
帧率可以达到80FPS。在实际加载上TINYYOLO2的程序测试
可以达到60FPS左右,达到了实际使用的需求。
图1yolo网络模型
4百度云语音合成API
为了减小内存的使用,本项目采用了百度语音合成python
接口,只需要使用http请求的RESTAPI接口,将文本转换为可
以播放的音频文件。再通过K210的播放器进行输出。由于
k210的性能限制,本项目使用内存占用极小的PCM编码,声音
经过采集和处理装置的抽样、量化和编码就实现了脉冲编码调
制。本系统中使用K210的I2S总线连接麦克风模块,模拟声音
信号经过麦克风抽样采集。传送到K210端口,经过K210通过
DAC发送音频放大器,最后由扬声器将PCM编码的声音量播
报出来,实现了语音播报。
PCM以采样技术为定理。采样定理:如果在规定的时间
内,以有效信号最高频率的二倍或二倍以上的速率对该信号进
3识别算法TINYYOLO2
相较于RCNN系列算法,YOLO算法最大的创新在于将物
体检测作为回归问题来求解,而RCNN系列算法是将目标检测
用一个regionproposal+CNN来作为分类问题求解。如下图所
收稿日期:2021-02-11
基金项目:西北民族大学2020年度实验室开放(项目编号:SYSKF-2020029)
作者简介:刘潇元(1999—),男,重庆人,现就读于西北民族大学本科2017级,研究方向:电子信息过程;任钊婷(1989—),女,甘肃平
凉人,实验师,硕士研究生,研究方向:计算机技术;杨晨(1990—),女,甘肃天水人,本科,实验师,研究方向:物理实验创
新教学、大学生实践创新教学。
182
人工智能及识别技术
本栏目责任编辑:唐一东
第17卷第15期(2021年5月)
行采样,则这些采样信息值中包含了全部原始信号信息。再进
行实际实验时Tinyyolo2在k210平台上帧率能达到60fps+。
5系统菜单设计
为了完成该项目的多个功能需要设计一个菜单搭配按键
进行功能的选择,这里我们采用了有限状态机。也称为FSM,
其特点是任意状态在任意时刻都有对应的下一状态。每个状
态具有同样的属性,当其属性进行转移时,FSM将一直保持消
亡状态。状态转移图中还有两个特殊状态:状态1状态被称为
“起始状态”,表示FSM的初始化状态,状态6称为“结束状态”。
表示成功识别了所有属性而后进入下一流程。使用编程思维
理解,建立结构体数组成员变量使用UP、DOWN、ENTER,来表
示每个状态对应的属性操作。建立Index成员表示当前的序列
号,函数指针表示当前状态所需要执行的函数。通过Index序
号根据用户的操作UP、DOWN或是ENTER来进入下一个所需
要执行的函数。达到逻辑清晰、代码量简洁高效的目的。
图2有限状态机原理图式。
Index
然后我们开始程序设计。CurrerIndex表示当前标号,
入的菜单标号,
表示按下上键跳入的菜单标号,DnIndex表示按下下键跳
Up⁃
(*CurOperate)表示这个菜单对应的函数指针。
EnterIndex表示按下确认键跳入的菜单标号,
图3菜单结构体定义
图4按键扫描函数
本栏目责任编辑:唐一东
ComputerKnowledgeandTechnology
电脑知识
与技术
函数,
Encoder_EC11_Scan()
AA
由于体积大小原因,
函数这个本来是编码器
将旋转编码器替换成了三个按键。
EC11的扫描
下对应引脚接地,
代表上键,BB代表下键,Keyenter键代表确认键。当按键按
lay5ms()
是因为抖动而是人为按下。置
这个函数延迟
引脚电平为
5ms如果这时按键还是低电平,
0。为了消除抖动使用了De⁃
ScanResult返回值为0
就说明不
,1,2,3分
别代表按键没有按下,上键,下键,确认键的按下标志位并作为
函数的返回值返回。
图5菜单执行函数
状态机从0开始,通过Encoder_EC11_Scan()函数来返回用
户的操作键码,通过Switch语句跳转到各个键码对应的操作中
去。如按下上键Encoder_EC11_Scan()函数会返回1。并把此时
菜单上键对应的键码赋值给Fun_index全局变量。然后将对应
的函数指针赋值给CurOperate_Ptr。而后执行函数完成函数的
跳转。
6基本流程
1
2
)k210通过摄像头获取图像;
3
)图像输入变换进入模型比对;
扬声器进行播报。否则返回获取图像继续搜索目标物体。
4
)
)
图像中是否存在目标物体;
存在物体,文本信息送入百度云api进行转化然后送入
图6
7项目总结
本项目将神经网络识别技术与物联网技术结合在一起。
意在通过图像得到语音的输出,适用于早教市场,幼儿外语的
学习。项目的不足,因为是通过网络进行语音转化,所以本项
目离不开网络,必须通过手机开启热点或连接家中wifi使用,本
项目将会继续研究离线的文字语音转化技术。(下转第189页)
人工智能及识别技术
183
第17卷第15期(2021年5月)
[2]QUY,LIC,tDetectionBaseonSupport
VectorMachinefromASingleImage[C]//FifthInternational
ConferenceonInformation,CommunicationsandSignalPro⁃
cessing.IEEE,2006:546-549.
[3]张浩,赵云胜,陈冠宇,等.基于支持向量机的遥感图像建筑物
识别与分类方法研究[J].地质科技情报,2016,35(6):194-199.
[4]BelgiuM,Drăguţforestinremotesensing:areview
ofapplicationsandfuturedirections[J].ISPRSJournalofPhoto⁃
grammetryandRemoteSensing,2016,114:24-31.
[5]马鑫,汪西原,胡博.基于ENVI的CART自动决策树多源遥感
影像分类——以北京市为例[J].宁夏工程技术,2017,16(1):
63-66.
[6]ChengG,MaCC,ZhouPC,lassificationofhigh
resolutionremotesensingimagesusingconvolutionalneural
networks[C]//2016IEEEInternationalGeoscienceandRemote
SensingSymposium(IGARSS).July10-15,2016,Beijing,China.
IEEE,2016:767-770.
[7]ScottGJ,EnglandMR,StarmsWA,ngdeepconvo⁃
lutionalneuralnetworksforland–coverclassificationofhigh-
resolutionimagery[J].IEEEGeoscienceandRemoteSensing
Letters,2017,14(4):549-553.
[8]NogueiraK,PenattiOAB,sbetterex⁃
ploitingconvolutionalneuralnetworksforremotesensing
sceneclassification[J].PatternRecognition,2017,61:539-556.
[9]ZhouZ,ZhengYB,YeH,iteimagesceneclassifica⁃
tionviaConvNetwithcontextaggregation[EB/OL].2018:arXiv:
1802.00631[]./abs/1802.00631
[10]XuKJ,HuangH,DengPF,-streamfeatureaggrega⁃
tiondeepneuralnetworkforsceneclassificationofremote
sensingimages[J].InformationSciences,2020,539:250-268.
[11]ShawkyOA,HagagA,El-DahshanESA,sens⁃
ingimagesceneclassificationusingCNN-MLPwithdataaug⁃
mentation[J].Optik,2020,221:165356.
[12]RéjichiS,eextractionusingPCAforVHR
satelliteimagetimeseriesspatio-temporalclassification[C]//
2015IEEEInternationalGeoscienceandRemoteSensingSym⁃
posium(IGARSS).July26-31,2015,Milan,,2015:485-
488.
[13]ZhuQQ,ZhongYF,ZhaoB,-of-visual-words
sceneclassifiercombininglocalandglobalfeaturesforhigh
spatialresolutionimagery[C]//201512thInternationalConfer⁃
enceonFuzzySystemsandKnowledgeDiscovery(FSKD).Au⁃
ComputerKnowledgeandTechnology
电脑知识
与技术
gust15-17,2015,Zhangjiajie,,2015:717-721.
[14]WuSL,ChenHD,BaiY,esensingimageclassi⁃
ficationmethodbasedonsparserepresentation[J].Multimedia
ToolsandApplications,2016,75(19):12137-12154.
[15]曲建岭,杜辰飞,邸亚洲,等.深度自动编码器的研究与展望
[J].计算机与现代化,2014(8):128-134.
[16]LinDY,FuK,WangY,ANs:unsupervisedrep⁃
resentationlearningforremotesensingimageclassification[J].
IEEEGeoscienceandRemoteSensingLetters,2017,14(11):
2092-2096.
[17]ZhangF,DuB,cy-guidedunsupervisedfea⁃
turelearningforsceneclassification[J].IEEETransactionson
GeoscienceandRemoteSensing,2015,53(4):2175-2184.
[18]arspace,knowledge-encodeddeeplearning
architectureandremotesensingimageclassification[J].Engi⁃
neeringApplicationsofArtificialIntelligence,2020,92:103647.
[19]XuSH,MuXD,ChaiD,sensingimagescene
classificationbasedongenerativeadversarialnetworks[J].Re⁃
moteSensingLetters,2018,9(7):617-626.
[20]BruzzoneL,ChiM,transductiveSVM
forsemisupervisedclassificationofremote-sensingimages[J].
IEEETransactionsonGeoscienceandRemoteSensing,2006,
44(11):3363-3373.
[21]PATRAS,GHOSHS,detectionofremote
sensingimageswithsemi-supervisedmultilayerperceptron[J].
FundamentaInformaticae,2008,84(3,4):429-442.
[22]Camps-VallsG,BandosMarshevaTV,-super⁃
visedgraph-basedhyperspectralimageclassification[J].IEEE
TransactionsonGeoscienceandRemoteSensing,2007,45(10):
3044-3054.
[23]MaulikU,-trainedensemblewithsemis⁃
upervisedSVM:anapplicationtopixelclassificationofremote
sensingimagery[J].PatternRecognition,2011,44(3):615-623.
[24]HanW,FengRY,WangLZ,-supervisedgenera⁃
tiveframeworkwithdeeplearningfeaturesforhigh-resolution
remotesensingimagesceneclassification[J].ISPRSJournalof
PhotogrammetryandRemoteSensing,2018,145:23-43.
[25]XuJD,FengGZ,ZhaoT,sensingimageclassifi⁃
cationbasedonsemi-supervisedadaptiveintervaltype-2
fuzzyc-meansalgorithm[J].Computers&Geosciences,2019,
131:132-143.
【通联编辑:唐一东】
(上接第183页)
参考文献:
[1]Real-TimePattern-RecognitionofGPRImageswithYOLO
v3ImplementedbyTensorflow.10.3390/s20226476.
[2]谢兄,杨金鹏.YOLO-wLU:考虑定位不确定性的目标检测算
本栏目责任编辑:唐一东
法[J].计算机工程与应用.
[3]黄凤琪,陈明,冯国富,基于可变形卷积改进的yolo目标检测
算法[J].计算机工程./10.19678/.1000-
3428.0059096.
【通联编辑:李雅琪】
人工智能及识别技术
189
2024年3月11日发(作者:连晓瑶)
ISSN1009-3044
Computer
Knowledge
Knowledge
and
and
Technology
Technology
电脑知识
电脑知识
与技术
Computer
与技术
Vol.17,No.15
May
2021
E-mail:*************.cn
第17卷第15期(2021年5月)
http://
Tel:+86-551-6569
基于TINYYOLO2神经网络视觉翻译棒
刘潇元,任钊婷,杨晨
(西北民族大学,甘肃兰州730030)
摘要:2015年10月,AlphaGo在没有任何让子的情况下,以5:0的悬殊比分击溃欧洲围棋冠军樊麾二段。随即第二年六月
战胜第一围棋手柯洁。人工智能初露锋芒,而在当今人工智能的发展下各个产业出现了新的转变,人脸识别,视网膜识
别,虹膜识别,掌纹识别,专家系统,无人驾驶,智能搜索,定理证明,博弈等人工智能逐渐改变着人们的生活,神经网络在
图像处理的运用上更加广泛,常应用于车辆检测、目标分类识别。本项目意在通过YOLO2的剪枝算法TINYyolo2实现在
嵌入式soc上进行目标检测达到图像转文字的目的。再尔,通过云服务实现文字转语音的服务。完成整个项目的目的,即
图像转文字的过程,适用于幼儿教学市场。
关键词:TINYYOLO2;云服务;视觉翻译
中图分类号:TP311文献标识码:A
开放科学(资源服务)标识码(OSID):
文章编号:1009-3044(2021)15-0182-02
1神经网络单元TPU介绍
在芯片集成度方面,勘智K210采用视听一体化设计。在
机器视觉上,芯片基于自主研发的神经网络加速器KPU,可完成
基于神经网络的图像分类任务,进行人脸识别与检测,以及实时
获取被检测目标的分类。在听觉能力上,芯片自带APU语音处
理单元,最高可支持8路音频数据及16个方向,无须占用CPU即
可实现声源定向、声场成像、波束形成、语音识别与唤醒等
功能。
在算法定制化方面,勘智K210在可编程能力上呈现出更
高的灵活性。首先,相比ARM等架构,勘智K210采用RISC-V
架构,拥有更强的可定制化能力,便于开发者根据具体应用场景
定制算法。其次,芯片搭载FPIOA现场可编程IO阵列,支持
TensorFlow、Keras、Darknet、PaddlePaddle和Caffe等主流AI编程
框架,以及全面的开发文档,对开发者十分友好。
示,YOLO通过对输入图像进行推测,得到图中所有物体的位置
及其所属类别的相应概率。
YOLO的网络模型结构包含有24个卷积层和2个全链接
层,其具体结构如下:
2摄像头
OV7670,本设计采用自带FiFo的模组,使用FIFO模组可
以大大减少K210的计算量,数字摄像头的构成主要是由镜头、
基座、红外滤波片、图像传感器。部分数字摄像头可能带有马
达用以调节像距。本设计中为了提高处理速度,使用CIF格式
的图像格式传输到K210中进行计算,经过实际的测试,空载的
帧率可以达到80FPS。在实际加载上TINYYOLO2的程序测试
可以达到60FPS左右,达到了实际使用的需求。
图1yolo网络模型
4百度云语音合成API
为了减小内存的使用,本项目采用了百度语音合成python
接口,只需要使用http请求的RESTAPI接口,将文本转换为可
以播放的音频文件。再通过K210的播放器进行输出。由于
k210的性能限制,本项目使用内存占用极小的PCM编码,声音
经过采集和处理装置的抽样、量化和编码就实现了脉冲编码调
制。本系统中使用K210的I2S总线连接麦克风模块,模拟声音
信号经过麦克风抽样采集。传送到K210端口,经过K210通过
DAC发送音频放大器,最后由扬声器将PCM编码的声音量播
报出来,实现了语音播报。
PCM以采样技术为定理。采样定理:如果在规定的时间
内,以有效信号最高频率的二倍或二倍以上的速率对该信号进
3识别算法TINYYOLO2
相较于RCNN系列算法,YOLO算法最大的创新在于将物
体检测作为回归问题来求解,而RCNN系列算法是将目标检测
用一个regionproposal+CNN来作为分类问题求解。如下图所
收稿日期:2021-02-11
基金项目:西北民族大学2020年度实验室开放(项目编号:SYSKF-2020029)
作者简介:刘潇元(1999—),男,重庆人,现就读于西北民族大学本科2017级,研究方向:电子信息过程;任钊婷(1989—),女,甘肃平
凉人,实验师,硕士研究生,研究方向:计算机技术;杨晨(1990—),女,甘肃天水人,本科,实验师,研究方向:物理实验创
新教学、大学生实践创新教学。
182
人工智能及识别技术
本栏目责任编辑:唐一东
第17卷第15期(2021年5月)
行采样,则这些采样信息值中包含了全部原始信号信息。再进
行实际实验时Tinyyolo2在k210平台上帧率能达到60fps+。
5系统菜单设计
为了完成该项目的多个功能需要设计一个菜单搭配按键
进行功能的选择,这里我们采用了有限状态机。也称为FSM,
其特点是任意状态在任意时刻都有对应的下一状态。每个状
态具有同样的属性,当其属性进行转移时,FSM将一直保持消
亡状态。状态转移图中还有两个特殊状态:状态1状态被称为
“起始状态”,表示FSM的初始化状态,状态6称为“结束状态”。
表示成功识别了所有属性而后进入下一流程。使用编程思维
理解,建立结构体数组成员变量使用UP、DOWN、ENTER,来表
示每个状态对应的属性操作。建立Index成员表示当前的序列
号,函数指针表示当前状态所需要执行的函数。通过Index序
号根据用户的操作UP、DOWN或是ENTER来进入下一个所需
要执行的函数。达到逻辑清晰、代码量简洁高效的目的。
图2有限状态机原理图式。
Index
然后我们开始程序设计。CurrerIndex表示当前标号,
入的菜单标号,
表示按下上键跳入的菜单标号,DnIndex表示按下下键跳
Up⁃
(*CurOperate)表示这个菜单对应的函数指针。
EnterIndex表示按下确认键跳入的菜单标号,
图3菜单结构体定义
图4按键扫描函数
本栏目责任编辑:唐一东
ComputerKnowledgeandTechnology
电脑知识
与技术
函数,
Encoder_EC11_Scan()
AA
由于体积大小原因,
函数这个本来是编码器
将旋转编码器替换成了三个按键。
EC11的扫描
下对应引脚接地,
代表上键,BB代表下键,Keyenter键代表确认键。当按键按
lay5ms()
是因为抖动而是人为按下。置
这个函数延迟
引脚电平为
5ms如果这时按键还是低电平,
0。为了消除抖动使用了De⁃
ScanResult返回值为0
就说明不
,1,2,3分
别代表按键没有按下,上键,下键,确认键的按下标志位并作为
函数的返回值返回。
图5菜单执行函数
状态机从0开始,通过Encoder_EC11_Scan()函数来返回用
户的操作键码,通过Switch语句跳转到各个键码对应的操作中
去。如按下上键Encoder_EC11_Scan()函数会返回1。并把此时
菜单上键对应的键码赋值给Fun_index全局变量。然后将对应
的函数指针赋值给CurOperate_Ptr。而后执行函数完成函数的
跳转。
6基本流程
1
2
)k210通过摄像头获取图像;
3
)图像输入变换进入模型比对;
扬声器进行播报。否则返回获取图像继续搜索目标物体。
4
)
)
图像中是否存在目标物体;
存在物体,文本信息送入百度云api进行转化然后送入
图6
7项目总结
本项目将神经网络识别技术与物联网技术结合在一起。
意在通过图像得到语音的输出,适用于早教市场,幼儿外语的
学习。项目的不足,因为是通过网络进行语音转化,所以本项
目离不开网络,必须通过手机开启热点或连接家中wifi使用,本
项目将会继续研究离线的文字语音转化技术。(下转第189页)
人工智能及识别技术
183
第17卷第15期(2021年5月)
[2]QUY,LIC,tDetectionBaseonSupport
VectorMachinefromASingleImage[C]//FifthInternational
ConferenceonInformation,CommunicationsandSignalPro⁃
cessing.IEEE,2006:546-549.
[3]张浩,赵云胜,陈冠宇,等.基于支持向量机的遥感图像建筑物
识别与分类方法研究[J].地质科技情报,2016,35(6):194-199.
[4]BelgiuM,Drăguţforestinremotesensing:areview
ofapplicationsandfuturedirections[J].ISPRSJournalofPhoto⁃
grammetryandRemoteSensing,2016,114:24-31.
[5]马鑫,汪西原,胡博.基于ENVI的CART自动决策树多源遥感
影像分类——以北京市为例[J].宁夏工程技术,2017,16(1):
63-66.
[6]ChengG,MaCC,ZhouPC,lassificationofhigh
resolutionremotesensingimagesusingconvolutionalneural
networks[C]//2016IEEEInternationalGeoscienceandRemote
SensingSymposium(IGARSS).July10-15,2016,Beijing,China.
IEEE,2016:767-770.
[7]ScottGJ,EnglandMR,StarmsWA,ngdeepconvo⁃
lutionalneuralnetworksforland–coverclassificationofhigh-
resolutionimagery[J].IEEEGeoscienceandRemoteSensing
Letters,2017,14(4):549-553.
[8]NogueiraK,PenattiOAB,sbetterex⁃
ploitingconvolutionalneuralnetworksforremotesensing
sceneclassification[J].PatternRecognition,2017,61:539-556.
[9]ZhouZ,ZhengYB,YeH,iteimagesceneclassifica⁃
tionviaConvNetwithcontextaggregation[EB/OL].2018:arXiv:
1802.00631[]./abs/1802.00631
[10]XuKJ,HuangH,DengPF,-streamfeatureaggrega⁃
tiondeepneuralnetworkforsceneclassificationofremote
sensingimages[J].InformationSciences,2020,539:250-268.
[11]ShawkyOA,HagagA,El-DahshanESA,sens⁃
ingimagesceneclassificationusingCNN-MLPwithdataaug⁃
mentation[J].Optik,2020,221:165356.
[12]RéjichiS,eextractionusingPCAforVHR
satelliteimagetimeseriesspatio-temporalclassification[C]//
2015IEEEInternationalGeoscienceandRemoteSensingSym⁃
posium(IGARSS).July26-31,2015,Milan,,2015:485-
488.
[13]ZhuQQ,ZhongYF,ZhaoB,-of-visual-words
sceneclassifiercombininglocalandglobalfeaturesforhigh
spatialresolutionimagery[C]//201512thInternationalConfer⁃
enceonFuzzySystemsandKnowledgeDiscovery(FSKD).Au⁃
ComputerKnowledgeandTechnology
电脑知识
与技术
gust15-17,2015,Zhangjiajie,,2015:717-721.
[14]WuSL,ChenHD,BaiY,esensingimageclassi⁃
ficationmethodbasedonsparserepresentation[J].Multimedia
ToolsandApplications,2016,75(19):12137-12154.
[15]曲建岭,杜辰飞,邸亚洲,等.深度自动编码器的研究与展望
[J].计算机与现代化,2014(8):128-134.
[16]LinDY,FuK,WangY,ANs:unsupervisedrep⁃
resentationlearningforremotesensingimageclassification[J].
IEEEGeoscienceandRemoteSensingLetters,2017,14(11):
2092-2096.
[17]ZhangF,DuB,cy-guidedunsupervisedfea⁃
turelearningforsceneclassification[J].IEEETransactionson
GeoscienceandRemoteSensing,2015,53(4):2175-2184.
[18]arspace,knowledge-encodeddeeplearning
architectureandremotesensingimageclassification[J].Engi⁃
neeringApplicationsofArtificialIntelligence,2020,92:103647.
[19]XuSH,MuXD,ChaiD,sensingimagescene
classificationbasedongenerativeadversarialnetworks[J].Re⁃
moteSensingLetters,2018,9(7):617-626.
[20]BruzzoneL,ChiM,transductiveSVM
forsemisupervisedclassificationofremote-sensingimages[J].
IEEETransactionsonGeoscienceandRemoteSensing,2006,
44(11):3363-3373.
[21]PATRAS,GHOSHS,detectionofremote
sensingimageswithsemi-supervisedmultilayerperceptron[J].
FundamentaInformaticae,2008,84(3,4):429-442.
[22]Camps-VallsG,BandosMarshevaTV,-super⁃
visedgraph-basedhyperspectralimageclassification[J].IEEE
TransactionsonGeoscienceandRemoteSensing,2007,45(10):
3044-3054.
[23]MaulikU,-trainedensemblewithsemis⁃
upervisedSVM:anapplicationtopixelclassificationofremote
sensingimagery[J].PatternRecognition,2011,44(3):615-623.
[24]HanW,FengRY,WangLZ,-supervisedgenera⁃
tiveframeworkwithdeeplearningfeaturesforhigh-resolution
remotesensingimagesceneclassification[J].ISPRSJournalof
PhotogrammetryandRemoteSensing,2018,145:23-43.
[25]XuJD,FengGZ,ZhaoT,sensingimageclassifi⁃
cationbasedonsemi-supervisedadaptiveintervaltype-2
fuzzyc-meansalgorithm[J].Computers&Geosciences,2019,
131:132-143.
【通联编辑:唐一东】
(上接第183页)
参考文献:
[1]Real-TimePattern-RecognitionofGPRImageswithYOLO
v3ImplementedbyTensorflow.10.3390/s20226476.
[2]谢兄,杨金鹏.YOLO-wLU:考虑定位不确定性的目标检测算
本栏目责任编辑:唐一东
法[J].计算机工程与应用.
[3]黄凤琪,陈明,冯国富,基于可变形卷积改进的yolo目标检测
算法[J].计算机工程./10.19678/.1000-
3428.0059096.
【通联编辑:李雅琪】
人工智能及识别技术
189