最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

基于TINY YOLO2神经网络视觉翻译棒

IT圈 admin 25浏览 0评论

2024年3月11日发(作者:连晓瑶)

ISSN1009-3044

Computer

Knowledge

Knowledge

and

and

Technology

Technology

电脑知识

电脑知识

与技术

Computer

与技术

Vol.17,No.15

May

2021

E-mail:*************.cn

第17卷第15期(2021年5月)

http://

Tel:+86-551-6569

基于TINYYOLO2神经网络视觉翻译棒

刘潇元,任钊婷,杨晨

(西北民族大学,甘肃兰州730030)

摘要:2015年10月,AlphaGo在没有任何让子的情况下,以5:0的悬殊比分击溃欧洲围棋冠军樊麾二段。随即第二年六月

战胜第一围棋手柯洁。人工智能初露锋芒,而在当今人工智能的发展下各个产业出现了新的转变,人脸识别,视网膜识

别,虹膜识别,掌纹识别,专家系统,无人驾驶,智能搜索,定理证明,博弈等人工智能逐渐改变着人们的生活,神经网络在

图像处理的运用上更加广泛,常应用于车辆检测、目标分类识别。本项目意在通过YOLO2的剪枝算法TINYyolo2实现在

嵌入式soc上进行目标检测达到图像转文字的目的。再尔,通过云服务实现文字转语音的服务。完成整个项目的目的,即

图像转文字的过程,适用于幼儿教学市场。

关键词:TINYYOLO2;云服务;视觉翻译

中图分类号:TP311文献标识码:A

开放科学(资源服务)标识码(OSID):

文章编号:1009-3044(2021)15-0182-02

1神经网络单元TPU介绍

在芯片集成度方面,勘智K210采用视听一体化设计。在

机器视觉上,芯片基于自主研发的神经网络加速器KPU,可完成

基于神经网络的图像分类任务,进行人脸识别与检测,以及实时

获取被检测目标的分类。在听觉能力上,芯片自带APU语音处

理单元,最高可支持8路音频数据及16个方向,无须占用CPU即

可实现声源定向、声场成像、波束形成、语音识别与唤醒等

功能。

在算法定制化方面,勘智K210在可编程能力上呈现出更

高的灵活性。首先,相比ARM等架构,勘智K210采用RISC-V

架构,拥有更强的可定制化能力,便于开发者根据具体应用场景

定制算法。其次,芯片搭载FPIOA现场可编程IO阵列,支持

TensorFlow、Keras、Darknet、PaddlePaddle和Caffe等主流AI编程

框架,以及全面的开发文档,对开发者十分友好。

示,YOLO通过对输入图像进行推测,得到图中所有物体的位置

及其所属类别的相应概率。

YOLO的网络模型结构包含有24个卷积层和2个全链接

层,其具体结构如下:

2摄像头

OV7670,本设计采用自带FiFo的模组,使用FIFO模组可

以大大减少K210的计算量,数字摄像头的构成主要是由镜头、

基座、红外滤波片、图像传感器。部分数字摄像头可能带有马

达用以调节像距。本设计中为了提高处理速度,使用CIF格式

的图像格式传输到K210中进行计算,经过实际的测试,空载的

帧率可以达到80FPS。在实际加载上TINYYOLO2的程序测试

可以达到60FPS左右,达到了实际使用的需求。

图1yolo网络模型

4百度云语音合成API

为了减小内存的使用,本项目采用了百度语音合成python

接口,只需要使用http请求的RESTAPI接口,将文本转换为可

以播放的音频文件。再通过K210的播放器进行输出。由于

k210的性能限制,本项目使用内存占用极小的PCM编码,声音

经过采集和处理装置的抽样、量化和编码就实现了脉冲编码调

制。本系统中使用K210的I2S总线连接麦克风模块,模拟声音

信号经过麦克风抽样采集。传送到K210端口,经过K210通过

DAC发送音频放大器,最后由扬声器将PCM编码的声音量播

报出来,实现了语音播报。

PCM以采样技术为定理。采样定理:如果在规定的时间

内,以有效信号最高频率的二倍或二倍以上的速率对该信号进

3识别算法TINYYOLO2

相较于RCNN系列算法,YOLO算法最大的创新在于将物

体检测作为回归问题来求解,而RCNN系列算法是将目标检测

用一个regionproposal+CNN来作为分类问题求解。如下图所

收稿日期:2021-02-11

基金项目:西北民族大学2020年度实验室开放(项目编号:SYSKF-2020029)

作者简介:刘潇元(1999—),男,重庆人,现就读于西北民族大学本科2017级,研究方向:电子信息过程;任钊婷(1989—),女,甘肃平

凉人,实验师,硕士研究生,研究方向:计算机技术;杨晨(1990—),女,甘肃天水人,本科,实验师,研究方向:物理实验创

新教学、大学生实践创新教学。

182

人工智能及识别技术

本栏目责任编辑:唐一东

第17卷第15期(2021年5月)

行采样,则这些采样信息值中包含了全部原始信号信息。再进

行实际实验时Tinyyolo2在k210平台上帧率能达到60fps+。

5系统菜单设计

为了完成该项目的多个功能需要设计一个菜单搭配按键

进行功能的选择,这里我们采用了有限状态机。也称为FSM,

其特点是任意状态在任意时刻都有对应的下一状态。每个状

态具有同样的属性,当其属性进行转移时,FSM将一直保持消

亡状态。状态转移图中还有两个特殊状态:状态1状态被称为

“起始状态”,表示FSM的初始化状态,状态6称为“结束状态”。

表示成功识别了所有属性而后进入下一流程。使用编程思维

理解,建立结构体数组成员变量使用UP、DOWN、ENTER,来表

示每个状态对应的属性操作。建立Index成员表示当前的序列

号,函数指针表示当前状态所需要执行的函数。通过Index序

号根据用户的操作UP、DOWN或是ENTER来进入下一个所需

要执行的函数。达到逻辑清晰、代码量简洁高效的目的。

图2有限状态机原理图式。

Index

然后我们开始程序设计。CurrerIndex表示当前标号,

入的菜单标号,

表示按下上键跳入的菜单标号,DnIndex表示按下下键跳

Up⁃

(*CurOperate)表示这个菜单对应的函数指针。

EnterIndex表示按下确认键跳入的菜单标号,

图3菜单结构体定义

图4按键扫描函数

本栏目责任编辑:唐一东

ComputerKnowledgeandTechnology

电脑知识

与技术

函数,

Encoder_EC11_Scan()

AA

由于体积大小原因,

函数这个本来是编码器

将旋转编码器替换成了三个按键。

EC11的扫描

下对应引脚接地,

代表上键,BB代表下键,Keyenter键代表确认键。当按键按

lay5ms()

是因为抖动而是人为按下。置

这个函数延迟

引脚电平为

5ms如果这时按键还是低电平,

0。为了消除抖动使用了De⁃

ScanResult返回值为0

就说明不

,1,2,3分

别代表按键没有按下,上键,下键,确认键的按下标志位并作为

函数的返回值返回。

图5菜单执行函数

状态机从0开始,通过Encoder_EC11_Scan()函数来返回用

户的操作键码,通过Switch语句跳转到各个键码对应的操作中

去。如按下上键Encoder_EC11_Scan()函数会返回1。并把此时

菜单上键对应的键码赋值给Fun_index全局变量。然后将对应

的函数指针赋值给CurOperate_Ptr。而后执行函数完成函数的

跳转。

6基本流程

1

2

)k210通过摄像头获取图像;

3

)图像输入变换进入模型比对;

扬声器进行播报。否则返回获取图像继续搜索目标物体。

4

图像中是否存在目标物体;

存在物体,文本信息送入百度云api进行转化然后送入

图6

7项目总结

本项目将神经网络识别技术与物联网技术结合在一起。

意在通过图像得到语音的输出,适用于早教市场,幼儿外语的

学习。项目的不足,因为是通过网络进行语音转化,所以本项

目离不开网络,必须通过手机开启热点或连接家中wifi使用,本

项目将会继续研究离线的文字语音转化技术。(下转第189页)

人工智能及识别技术

183

第17卷第15期(2021年5月)

[2]QUY,LIC,tDetectionBaseonSupport

VectorMachinefromASingleImage[C]//FifthInternational

ConferenceonInformation,CommunicationsandSignalPro⁃

cessing.IEEE,2006:546-549.

[3]张浩,赵云胜,陈冠宇,等.基于支持向量机的遥感图像建筑物

识别与分类方法研究[J].地质科技情报,2016,35(6):194-199.

[4]BelgiuM,Drăguţforestinremotesensing:areview

ofapplicationsandfuturedirections[J].ISPRSJournalofPhoto⁃

grammetryandRemoteSensing,2016,114:24-31.

[5]马鑫,汪西原,胡博.基于ENVI的CART自动决策树多源遥感

影像分类——以北京市为例[J].宁夏工程技术,2017,16(1):

63-66.

[6]ChengG,MaCC,ZhouPC,lassificationofhigh

resolutionremotesensingimagesusingconvolutionalneural

networks[C]//2016IEEEInternationalGeoscienceandRemote

SensingSymposium(IGARSS).July10-15,2016,Beijing,China.

IEEE,2016:767-770.

[7]ScottGJ,EnglandMR,StarmsWA,ngdeepconvo⁃

lutionalneuralnetworksforland–coverclassificationofhigh-

resolutionimagery[J].IEEEGeoscienceandRemoteSensing

Letters,2017,14(4):549-553.

[8]NogueiraK,PenattiOAB,sbetterex⁃

ploitingconvolutionalneuralnetworksforremotesensing

sceneclassification[J].PatternRecognition,2017,61:539-556.

[9]ZhouZ,ZhengYB,YeH,iteimagesceneclassifica⁃

tionviaConvNetwithcontextaggregation[EB/OL].2018:arXiv:

1802.00631[]./abs/1802.00631

[10]XuKJ,HuangH,DengPF,-streamfeatureaggrega⁃

tiondeepneuralnetworkforsceneclassificationofremote

sensingimages[J].InformationSciences,2020,539:250-268.

[11]ShawkyOA,HagagA,El-DahshanESA,sens⁃

ingimagesceneclassificationusingCNN-MLPwithdataaug⁃

mentation[J].Optik,2020,221:165356.

[12]RéjichiS,eextractionusingPCAforVHR

satelliteimagetimeseriesspatio-temporalclassification[C]//

2015IEEEInternationalGeoscienceandRemoteSensingSym⁃

posium(IGARSS).July26-31,2015,Milan,,2015:485-

488.

[13]ZhuQQ,ZhongYF,ZhaoB,-of-visual-words

sceneclassifiercombininglocalandglobalfeaturesforhigh

spatialresolutionimagery[C]//201512thInternationalConfer⁃

enceonFuzzySystemsandKnowledgeDiscovery(FSKD).Au⁃

ComputerKnowledgeandTechnology

电脑知识

与技术

gust15-17,2015,Zhangjiajie,,2015:717-721.

[14]WuSL,ChenHD,BaiY,esensingimageclassi⁃

ficationmethodbasedonsparserepresentation[J].Multimedia

ToolsandApplications,2016,75(19):12137-12154.

[15]曲建岭,杜辰飞,邸亚洲,等.深度自动编码器的研究与展望

[J].计算机与现代化,2014(8):128-134.

[16]LinDY,FuK,WangY,ANs:unsupervisedrep⁃

resentationlearningforremotesensingimageclassification[J].

IEEEGeoscienceandRemoteSensingLetters,2017,14(11):

2092-2096.

[17]ZhangF,DuB,cy-guidedunsupervisedfea⁃

turelearningforsceneclassification[J].IEEETransactionson

GeoscienceandRemoteSensing,2015,53(4):2175-2184.

[18]arspace,knowledge-encodeddeeplearning

architectureandremotesensingimageclassification[J].Engi⁃

neeringApplicationsofArtificialIntelligence,2020,92:103647.

[19]XuSH,MuXD,ChaiD,sensingimagescene

classificationbasedongenerativeadversarialnetworks[J].Re⁃

moteSensingLetters,2018,9(7):617-626.

[20]BruzzoneL,ChiM,transductiveSVM

forsemisupervisedclassificationofremote-sensingimages[J].

IEEETransactionsonGeoscienceandRemoteSensing,2006,

44(11):3363-3373.

[21]PATRAS,GHOSHS,detectionofremote

sensingimageswithsemi-supervisedmultilayerperceptron[J].

FundamentaInformaticae,2008,84(3,4):429-442.

[22]Camps-VallsG,BandosMarshevaTV,-super⁃

visedgraph-basedhyperspectralimageclassification[J].IEEE

TransactionsonGeoscienceandRemoteSensing,2007,45(10):

3044-3054.

[23]MaulikU,-trainedensemblewithsemis⁃

upervisedSVM:anapplicationtopixelclassificationofremote

sensingimagery[J].PatternRecognition,2011,44(3):615-623.

[24]HanW,FengRY,WangLZ,-supervisedgenera⁃

tiveframeworkwithdeeplearningfeaturesforhigh-resolution

remotesensingimagesceneclassification[J].ISPRSJournalof

PhotogrammetryandRemoteSensing,2018,145:23-43.

[25]XuJD,FengGZ,ZhaoT,sensingimageclassifi⁃

cationbasedonsemi-supervisedadaptiveintervaltype-2

fuzzyc-meansalgorithm[J].Computers&Geosciences,2019,

131:132-143.

【通联编辑:唐一东】

(上接第183页)

参考文献:

[1]Real-TimePattern-RecognitionofGPRImageswithYOLO

v3ImplementedbyTensorflow.10.3390/s20226476.

[2]谢兄,杨金鹏.YOLO-wLU:考虑定位不确定性的目标检测算

本栏目责任编辑:唐一东

法[J].计算机工程与应用.

[3]黄凤琪,陈明,冯国富,基于可变形卷积改进的yolo目标检测

算法[J].计算机工程./10.19678/.1000-

3428.0059096.

【通联编辑:李雅琪】

人工智能及识别技术

189

2024年3月11日发(作者:连晓瑶)

ISSN1009-3044

Computer

Knowledge

Knowledge

and

and

Technology

Technology

电脑知识

电脑知识

与技术

Computer

与技术

Vol.17,No.15

May

2021

E-mail:*************.cn

第17卷第15期(2021年5月)

http://

Tel:+86-551-6569

基于TINYYOLO2神经网络视觉翻译棒

刘潇元,任钊婷,杨晨

(西北民族大学,甘肃兰州730030)

摘要:2015年10月,AlphaGo在没有任何让子的情况下,以5:0的悬殊比分击溃欧洲围棋冠军樊麾二段。随即第二年六月

战胜第一围棋手柯洁。人工智能初露锋芒,而在当今人工智能的发展下各个产业出现了新的转变,人脸识别,视网膜识

别,虹膜识别,掌纹识别,专家系统,无人驾驶,智能搜索,定理证明,博弈等人工智能逐渐改变着人们的生活,神经网络在

图像处理的运用上更加广泛,常应用于车辆检测、目标分类识别。本项目意在通过YOLO2的剪枝算法TINYyolo2实现在

嵌入式soc上进行目标检测达到图像转文字的目的。再尔,通过云服务实现文字转语音的服务。完成整个项目的目的,即

图像转文字的过程,适用于幼儿教学市场。

关键词:TINYYOLO2;云服务;视觉翻译

中图分类号:TP311文献标识码:A

开放科学(资源服务)标识码(OSID):

文章编号:1009-3044(2021)15-0182-02

1神经网络单元TPU介绍

在芯片集成度方面,勘智K210采用视听一体化设计。在

机器视觉上,芯片基于自主研发的神经网络加速器KPU,可完成

基于神经网络的图像分类任务,进行人脸识别与检测,以及实时

获取被检测目标的分类。在听觉能力上,芯片自带APU语音处

理单元,最高可支持8路音频数据及16个方向,无须占用CPU即

可实现声源定向、声场成像、波束形成、语音识别与唤醒等

功能。

在算法定制化方面,勘智K210在可编程能力上呈现出更

高的灵活性。首先,相比ARM等架构,勘智K210采用RISC-V

架构,拥有更强的可定制化能力,便于开发者根据具体应用场景

定制算法。其次,芯片搭载FPIOA现场可编程IO阵列,支持

TensorFlow、Keras、Darknet、PaddlePaddle和Caffe等主流AI编程

框架,以及全面的开发文档,对开发者十分友好。

示,YOLO通过对输入图像进行推测,得到图中所有物体的位置

及其所属类别的相应概率。

YOLO的网络模型结构包含有24个卷积层和2个全链接

层,其具体结构如下:

2摄像头

OV7670,本设计采用自带FiFo的模组,使用FIFO模组可

以大大减少K210的计算量,数字摄像头的构成主要是由镜头、

基座、红外滤波片、图像传感器。部分数字摄像头可能带有马

达用以调节像距。本设计中为了提高处理速度,使用CIF格式

的图像格式传输到K210中进行计算,经过实际的测试,空载的

帧率可以达到80FPS。在实际加载上TINYYOLO2的程序测试

可以达到60FPS左右,达到了实际使用的需求。

图1yolo网络模型

4百度云语音合成API

为了减小内存的使用,本项目采用了百度语音合成python

接口,只需要使用http请求的RESTAPI接口,将文本转换为可

以播放的音频文件。再通过K210的播放器进行输出。由于

k210的性能限制,本项目使用内存占用极小的PCM编码,声音

经过采集和处理装置的抽样、量化和编码就实现了脉冲编码调

制。本系统中使用K210的I2S总线连接麦克风模块,模拟声音

信号经过麦克风抽样采集。传送到K210端口,经过K210通过

DAC发送音频放大器,最后由扬声器将PCM编码的声音量播

报出来,实现了语音播报。

PCM以采样技术为定理。采样定理:如果在规定的时间

内,以有效信号最高频率的二倍或二倍以上的速率对该信号进

3识别算法TINYYOLO2

相较于RCNN系列算法,YOLO算法最大的创新在于将物

体检测作为回归问题来求解,而RCNN系列算法是将目标检测

用一个regionproposal+CNN来作为分类问题求解。如下图所

收稿日期:2021-02-11

基金项目:西北民族大学2020年度实验室开放(项目编号:SYSKF-2020029)

作者简介:刘潇元(1999—),男,重庆人,现就读于西北民族大学本科2017级,研究方向:电子信息过程;任钊婷(1989—),女,甘肃平

凉人,实验师,硕士研究生,研究方向:计算机技术;杨晨(1990—),女,甘肃天水人,本科,实验师,研究方向:物理实验创

新教学、大学生实践创新教学。

182

人工智能及识别技术

本栏目责任编辑:唐一东

第17卷第15期(2021年5月)

行采样,则这些采样信息值中包含了全部原始信号信息。再进

行实际实验时Tinyyolo2在k210平台上帧率能达到60fps+。

5系统菜单设计

为了完成该项目的多个功能需要设计一个菜单搭配按键

进行功能的选择,这里我们采用了有限状态机。也称为FSM,

其特点是任意状态在任意时刻都有对应的下一状态。每个状

态具有同样的属性,当其属性进行转移时,FSM将一直保持消

亡状态。状态转移图中还有两个特殊状态:状态1状态被称为

“起始状态”,表示FSM的初始化状态,状态6称为“结束状态”。

表示成功识别了所有属性而后进入下一流程。使用编程思维

理解,建立结构体数组成员变量使用UP、DOWN、ENTER,来表

示每个状态对应的属性操作。建立Index成员表示当前的序列

号,函数指针表示当前状态所需要执行的函数。通过Index序

号根据用户的操作UP、DOWN或是ENTER来进入下一个所需

要执行的函数。达到逻辑清晰、代码量简洁高效的目的。

图2有限状态机原理图式。

Index

然后我们开始程序设计。CurrerIndex表示当前标号,

入的菜单标号,

表示按下上键跳入的菜单标号,DnIndex表示按下下键跳

Up⁃

(*CurOperate)表示这个菜单对应的函数指针。

EnterIndex表示按下确认键跳入的菜单标号,

图3菜单结构体定义

图4按键扫描函数

本栏目责任编辑:唐一东

ComputerKnowledgeandTechnology

电脑知识

与技术

函数,

Encoder_EC11_Scan()

AA

由于体积大小原因,

函数这个本来是编码器

将旋转编码器替换成了三个按键。

EC11的扫描

下对应引脚接地,

代表上键,BB代表下键,Keyenter键代表确认键。当按键按

lay5ms()

是因为抖动而是人为按下。置

这个函数延迟

引脚电平为

5ms如果这时按键还是低电平,

0。为了消除抖动使用了De⁃

ScanResult返回值为0

就说明不

,1,2,3分

别代表按键没有按下,上键,下键,确认键的按下标志位并作为

函数的返回值返回。

图5菜单执行函数

状态机从0开始,通过Encoder_EC11_Scan()函数来返回用

户的操作键码,通过Switch语句跳转到各个键码对应的操作中

去。如按下上键Encoder_EC11_Scan()函数会返回1。并把此时

菜单上键对应的键码赋值给Fun_index全局变量。然后将对应

的函数指针赋值给CurOperate_Ptr。而后执行函数完成函数的

跳转。

6基本流程

1

2

)k210通过摄像头获取图像;

3

)图像输入变换进入模型比对;

扬声器进行播报。否则返回获取图像继续搜索目标物体。

4

图像中是否存在目标物体;

存在物体,文本信息送入百度云api进行转化然后送入

图6

7项目总结

本项目将神经网络识别技术与物联网技术结合在一起。

意在通过图像得到语音的输出,适用于早教市场,幼儿外语的

学习。项目的不足,因为是通过网络进行语音转化,所以本项

目离不开网络,必须通过手机开启热点或连接家中wifi使用,本

项目将会继续研究离线的文字语音转化技术。(下转第189页)

人工智能及识别技术

183

第17卷第15期(2021年5月)

[2]QUY,LIC,tDetectionBaseonSupport

VectorMachinefromASingleImage[C]//FifthInternational

ConferenceonInformation,CommunicationsandSignalPro⁃

cessing.IEEE,2006:546-549.

[3]张浩,赵云胜,陈冠宇,等.基于支持向量机的遥感图像建筑物

识别与分类方法研究[J].地质科技情报,2016,35(6):194-199.

[4]BelgiuM,Drăguţforestinremotesensing:areview

ofapplicationsandfuturedirections[J].ISPRSJournalofPhoto⁃

grammetryandRemoteSensing,2016,114:24-31.

[5]马鑫,汪西原,胡博.基于ENVI的CART自动决策树多源遥感

影像分类——以北京市为例[J].宁夏工程技术,2017,16(1):

63-66.

[6]ChengG,MaCC,ZhouPC,lassificationofhigh

resolutionremotesensingimagesusingconvolutionalneural

networks[C]//2016IEEEInternationalGeoscienceandRemote

SensingSymposium(IGARSS).July10-15,2016,Beijing,China.

IEEE,2016:767-770.

[7]ScottGJ,EnglandMR,StarmsWA,ngdeepconvo⁃

lutionalneuralnetworksforland–coverclassificationofhigh-

resolutionimagery[J].IEEEGeoscienceandRemoteSensing

Letters,2017,14(4):549-553.

[8]NogueiraK,PenattiOAB,sbetterex⁃

ploitingconvolutionalneuralnetworksforremotesensing

sceneclassification[J].PatternRecognition,2017,61:539-556.

[9]ZhouZ,ZhengYB,YeH,iteimagesceneclassifica⁃

tionviaConvNetwithcontextaggregation[EB/OL].2018:arXiv:

1802.00631[]./abs/1802.00631

[10]XuKJ,HuangH,DengPF,-streamfeatureaggrega⁃

tiondeepneuralnetworkforsceneclassificationofremote

sensingimages[J].InformationSciences,2020,539:250-268.

[11]ShawkyOA,HagagA,El-DahshanESA,sens⁃

ingimagesceneclassificationusingCNN-MLPwithdataaug⁃

mentation[J].Optik,2020,221:165356.

[12]RéjichiS,eextractionusingPCAforVHR

satelliteimagetimeseriesspatio-temporalclassification[C]//

2015IEEEInternationalGeoscienceandRemoteSensingSym⁃

posium(IGARSS).July26-31,2015,Milan,,2015:485-

488.

[13]ZhuQQ,ZhongYF,ZhaoB,-of-visual-words

sceneclassifiercombininglocalandglobalfeaturesforhigh

spatialresolutionimagery[C]//201512thInternationalConfer⁃

enceonFuzzySystemsandKnowledgeDiscovery(FSKD).Au⁃

ComputerKnowledgeandTechnology

电脑知识

与技术

gust15-17,2015,Zhangjiajie,,2015:717-721.

[14]WuSL,ChenHD,BaiY,esensingimageclassi⁃

ficationmethodbasedonsparserepresentation[J].Multimedia

ToolsandApplications,2016,75(19):12137-12154.

[15]曲建岭,杜辰飞,邸亚洲,等.深度自动编码器的研究与展望

[J].计算机与现代化,2014(8):128-134.

[16]LinDY,FuK,WangY,ANs:unsupervisedrep⁃

resentationlearningforremotesensingimageclassification[J].

IEEEGeoscienceandRemoteSensingLetters,2017,14(11):

2092-2096.

[17]ZhangF,DuB,cy-guidedunsupervisedfea⁃

turelearningforsceneclassification[J].IEEETransactionson

GeoscienceandRemoteSensing,2015,53(4):2175-2184.

[18]arspace,knowledge-encodeddeeplearning

architectureandremotesensingimageclassification[J].Engi⁃

neeringApplicationsofArtificialIntelligence,2020,92:103647.

[19]XuSH,MuXD,ChaiD,sensingimagescene

classificationbasedongenerativeadversarialnetworks[J].Re⁃

moteSensingLetters,2018,9(7):617-626.

[20]BruzzoneL,ChiM,transductiveSVM

forsemisupervisedclassificationofremote-sensingimages[J].

IEEETransactionsonGeoscienceandRemoteSensing,2006,

44(11):3363-3373.

[21]PATRAS,GHOSHS,detectionofremote

sensingimageswithsemi-supervisedmultilayerperceptron[J].

FundamentaInformaticae,2008,84(3,4):429-442.

[22]Camps-VallsG,BandosMarshevaTV,-super⁃

visedgraph-basedhyperspectralimageclassification[J].IEEE

TransactionsonGeoscienceandRemoteSensing,2007,45(10):

3044-3054.

[23]MaulikU,-trainedensemblewithsemis⁃

upervisedSVM:anapplicationtopixelclassificationofremote

sensingimagery[J].PatternRecognition,2011,44(3):615-623.

[24]HanW,FengRY,WangLZ,-supervisedgenera⁃

tiveframeworkwithdeeplearningfeaturesforhigh-resolution

remotesensingimagesceneclassification[J].ISPRSJournalof

PhotogrammetryandRemoteSensing,2018,145:23-43.

[25]XuJD,FengGZ,ZhaoT,sensingimageclassifi⁃

cationbasedonsemi-supervisedadaptiveintervaltype-2

fuzzyc-meansalgorithm[J].Computers&Geosciences,2019,

131:132-143.

【通联编辑:唐一东】

(上接第183页)

参考文献:

[1]Real-TimePattern-RecognitionofGPRImageswithYOLO

v3ImplementedbyTensorflow.10.3390/s20226476.

[2]谢兄,杨金鹏.YOLO-wLU:考虑定位不确定性的目标检测算

本栏目责任编辑:唐一东

法[J].计算机工程与应用.

[3]黄凤琪,陈明,冯国富,基于可变形卷积改进的yolo目标检测

算法[J].计算机工程./10.19678/.1000-

3428.0059096.

【通联编辑:李雅琪】

人工智能及识别技术

189

发布评论

评论列表 (0)

  1. 暂无评论