人工智能算法赋能视觉导航清洁机器人-USB迷|专注于互联网分享

2024年3月29日发(作者：裴俊郎)

7■

胃

卜

VIEW

2020

产业应用

人工智能算法赋能

视觉导航清洁机器人

口文/李丰果1,俞浩2

(1.追觅科技家用机器人研发中心，江苏省苏州市215000; 2.追觅科技，江苏省苏州市215000)

李丰果

追觅高级算法工程师，毕业于清华大学，参与追觅扫地机器

人导航规划前沿算法研发及应用落地，研究方向包括机器人

导航规划、智能控制、SLAM、机器学习、强化学习等，已

授权或公开的专利5项。

追觅科技创始人兼公司CEO。专注于数字马达、空气动力

学和人工智能领域，拥有多项发明技术和专利，是中国最早

的四旋翼开发者之一，同时也是三旋翼飞行器的发明者。

摘要：

市面上的中高端扫地机器人基本都具备依靠导航规划清扫路径的能力，当前实际落

地的导航技术包括视觉导航和激光导航两类。相比于激光导航，视觉导航的扫地机器人具

有成本更低、体积更小、感知信息维度更丰富的优势。然而，现阶段视觉导航在实际应用中，

仍然存在识别精度低、暗光环境下无法正常使用等问题。本文基于人工智能算法的发展，

针对上述问题进行了技术解决思路的分析，并对视觉导航扫地机器人的应用场景进行了更

多展望。

关键词：

扫地机器人；人工智能；VSLAM

中图分类号：

TP24; TP242.6

文献标志码：

文章编号：

2096-5036(2020)05-0068-08

人工智能算法赋能视觉导航清洁机器人

1扫地机机器人主流导航历史与介绍

扫地机器人作为目前家用电器中唯一具备自主移动能力和环境感知能力的品类，

一直是新技术应用的先锋。2002年，军事机器人出身的美国

iRobot

公司推出了第一

款真正意义上的家用扫地机器人

Roomba

,正式幵启了智能扫地机器人时代。

目前，市场上的扫地机器人的细分品类非常多，按照导航规划方式，可以划分为

随机清扫和导航规划清扫（弓字型行走）两大类，导航规划清扫是中高端扫地机器人的

标配，可以为室内环境建图，以此规划清扫路线，工作起来既节能又高效。

现阶段实际落地的导航技术有两种（如图1所示），一种是视觉导航（

vSLAM

，

visual

Simultaneous

Localization

And

Mapping

)，另一种是激光导航

（Lidar

SLAM

)。前者用普通的摄像头采集环境中的特征点信息，利用视觉算法确定机器人的

位姿；而后者则采用安装在机器人顶部的可以发射接收激光的模组，通过360度多点

位激光测距，实现二维地图建图，同时确定扫地机器人自身的位置。

图1激光导航扫地机器人机器人（左）对比视觉导航扫地机器人（右）

2两种导航技术应用于扫地机器人的优劣势对比

在目前市场上的高端机器中，激光导航方案占比非常高，这主要是因为采用激光

导航的扫地机器人在建图速度和精度上略高于采用视觉导航的扫地机器人，且激光导航

对于光线的要求较低。加之导航技术的方案成本较高，因此采用激光导航方案的扫地机

器人售价也相对较高。

表1视觉导航与激光导航的优势对比

激光导航方案视觉导航方案

建图精度局

中（碰撞建图）

建图速度

高（远程扫描建图）低（碰撞建图）

环境光线要求

可在全黑暗环境工作无法在黑暗环境工作

传感器体积

大（顶部凸起）

小

传感器成本中高低

处理器算力需求

低局

智能可扩展性

低（二维点阵房间识别）

高（可扩展图像识别）

TiSM

Al-VIEW 2020

年第

期

产业应用

视觉导航方案仅

需要普通的摄像头配

合一定的处理器算力

即可工作，成本上远

低于需要激光收发装

置和机械旋转马达的

激光导航方案，且在

空间占用上，视觉导

航方案小于激光导航

视觉惯性里程计

图2

vSLAM

工作原理

方案。这些优势对于

成本和体积都受限制的家用扫地机机器人非常重要。所以，采用视觉导航的扫地机器人

一般主打超薄机身概念，并且均价也相对较低。

但在智能可扩展性方面，视觉导航方案的潜力则远高于纯激光导航方案。采用视

觉导航方案的扫地机器人输入的信息是维度更加丰富的二维图像信息，而激光雷达采集

的仅仅是激光测距的一维距离信息。虽然目前由于算法和算力的原因，视觉导航方案仅

仅提取了其中的点/线等有限信息用于导航定位，但随着算力的提升，结合图像识别等

人工智能算法的迭代，视觉导航方案能够基于对环境的理解，提供更加智能的清扫体验。

而由于嵌入式芯片的超摩尔定律和软件算法研发的极低边际成本，未来将会出现成本和

性能均超越激光导航方案的视觉导航解决方案。

图3米家扫拖机器人1

高级地图功能（左）与

iRobot

APP

高级地图功能（右）

人工智能算法赋能视觉导航清洁机器人

所以，在技术路线选择上

，Neato

(俐拓）、石头科技等厂家选择了激光导航方案，

以确保在高端扫地机器人上的体验优势；而

iRobot

、追觅科技则选择押注视觉方案的

长期扩展性，希望通过软件算法的升级迭代，提升扫地机器人的用户体验。其代表性的

产品

iRobot

Roomba

9、米家扫拖机器人1

都在通过远程

OTA

(

The

Air

，远

程在线升级）逐步增加产品功能体验。

3目前视觉导航技术在扫地机器人的应用中仍然存在挑战

3.1建图效率低，只能通过碰撞确定边界

vSLAM

是同时定位与导航技术，在实际应用中，视觉导航方案被分为前端和后端，

并分别在不同线程下工作。前端实时采集图像数据并进行粗略的位姿估计，后端对前端

的结果进行非线性优化，从而保证精度。因此造成建图效率低下，导致用

vSLAM

建立

的地图是稀疏地图，不能做到覆盖所有的边和角落；而对扫地机的清扫任务来说，边边

角角的全覆盖清扫往往是用户最为关注的指标之一。因此，目前视觉导航扫地机器人在

清扫一些边和角落时，仍然需要通过撞板碰撞以建立完整的地图边界，造成实际展示给

用户的地图不够精确（存在10

左右精度误差）。

3.2暗光环境下视觉导航失效问题

视觉导航方案的前端以相机采集的图像作为初始处理数据，从图像中提取少量特征

点，然后提供给后端进行非线性优化，从而得到相机位姿的最优估计。特征点是图像中

比较特殊的点，在一定的度量下，它们与周围图像有明显的不同，并能够在相机小范围

位姿变化时便于在不同图片中进行匹配。在暗光环境中，图片整体信息趋同，特征点检

测算法难以有效捕捉特征点提供给后端，因此导致后端无法有效对前端的估计位姿进行

非线性优化，最终导致视觉导航失效。虽然在视觉失效的情况下，扫地机器人的其他传

感器（惯性陀螺仪、光流传感器等）依然能够维持短时间的机器人导航，但是长时间后

累积误差加大，依然会引发地图错位等问题，影响用户体验。

4基于人工智能算法的优化赋能视觉导航

4.1机器学习辅助建图

视觉导航方法是一系列优化综合的结果，其中很多步骤都可以由人工调参改为用机

器学习和深度学习方法自动完成。前端和后端的优化基于相机位姿连续变化时相邻图片

之间的关联关系，并进一步利用相机回到同一个位姿时图像的相似性，即回环检测，加

X^kB

胃£

C I AI-VIEW 2020

产业应用

72 •

入更多的约束条件以提高估计精度。如何判断图片之间的相似性，对于人类是非常简单

的事情，但对于计算机却非常困难，因为它看到的只是一些数值而已。传统回环检测采

用词袋模型，需要人工提取图片特征，不易操作且容易受到研究者对图片理解的限制。

近年来，深度学习技术获得快速的发展，图像处理方面的进展尤为显著，可以进一步替

代人工调参。

Xiang

Gao

和

Tao

Zhang

111把深度学习中的堆叠降噪自动编码器应用到

vSLAM

的回环检测中，该方法先用类似的数据和参数配置训练一个堆叠降噪自动编码

器，然后用该自动编码器从相机采集的原始图片中自动提取特征，这样就可以学习到图

片数据中复杂的内部结构，而不需要人工去设置视觉特征。不仅如此，

vSLAM

前端优

化中的特征提取也可以由机器学习代劳。

Cheein

等121在橄榄果园的视觉导航定位应用

场景中，使用

HOG

方法把采集的图片分离成低维度特征空间，然后利用支持向量机方

法，从特征空间中提取出橄榄茎特征，该特征提取方法在实际应用中被证明是非常有效

的。

4.2图像识别与深度估算辅助沿边和避障

沿边和避障是扫地机器人清扫任务中两个互相矛盾的优化策略。一方面，清洁覆盖

率的目标要求扫地机器人尽可能贴近房屋边缘和角落清扫，以增加清扫覆盖率，防止漏

扫；另一方面，用户体验的目标又要求扫地机器人尽可能远离障碍物，以减少碰撞次数，

特别是一些敏感或贵重物体。通过结合

vSLAM

和图像识别技术，能够构建带有物体标

签的三维语义地图1

，提升房间边缘和角落的建图精度和识别效率，并应用不同的清

扫策略。在三维语义地图下，对重点对象和复杂的地图轮廓设计专用的避障和沿边算法，

从而解决“只能通过碰撞确定边界”的问题，解决沿边和避障的优化矛盾。同时，在三

维语义地图下设计规划策略，可以轻松解决扫地机器人的绕线、卡床底等问题。利用图

像识别技术的目标动态跟随和快速检测特性，可以辅助构建复杂场景下的动态地图，使

得规划策略的局部实时优化成为可能。

4.3利用图像处理算法提升暗光环境的定位表现

针对暗光环境下视觉定位问题，学者们开展了很多有前景的研究。

Yali

Zheng

等151

从

RGB-D

相机成对采集的深度照片和红外照片序列，在词袋框架下创建的数据库中，

搜索匹配出最相近的照片，实验验证了该方法在室内暗光线条件下的较好的重定位结

果。

Zhexiao

Zhang

等w提出了基于0

SLAM

2和融合红外照片与可见光照片的重

定位方法，提高

vSLAM

使用红外照片的鲁棒性。室内环境有很多特殊的信息有待进一

步挖掘利用，如墙体和家具的边线，新的图像处理算法正在不断提升暗光环境的定位表

现，结合新型的暗光

CMOS

组件，未来有希望在微光环境下实现视觉导航完全生效。

人工智能算法赋能视觉导航清洁机器人

5人工智能技术在视觉导航扫地机器人的应用展望

5.1稳定高效的室内导航规划

单一的导航规划策略在复杂情况下可能会出现未预期的结果，扫地机器人的任一单

元一旦出现问题，就会降低整体的性能。视觉导航扫地机器人融合了

IMU

、里程计、

相机等多个传感器的数据，提高了导航定位算法的稳定性，但仍会出现一些不尽如人意

的结果，例如光线不足时定位精度下降的问题。因此，应该为扫地机器人配备多种备选

方案，互相促进，整体达到更好的效果。追觅慧目

9扫地机器人在搭载先锋2.0光学

视觉导航系统的同时，还配备了高性能光流传感器，可以辅助视觉导航更精准地锁定坐

标信息，在光线不足的环境下，辅助校正路线。

追觅慧目

9扫地机器人为用户提供地图记忆和自动分区的功能。地图记忆允许扫

地机器人保存以往的清扫地图，并在下一次清扫开始时先对当前清扫环境与以往清扫地

图进行匹配，匹配成功后将会复用以往的清扫地图并完成自动分区。随后，机器人仅需

对有变化的区域局部更新即可，而不用每次清扫都进行一次房间的全面探测，提高了导

航规划的效率。

同时，针对现有扫地机器人在实际环境中的物理特性，追觅的技术团队也尝试搭建

了全仿真的软件测试环境（如图4所示），可以模拟物理世界中地面打滑、镜面干扰、

暗光失效等真实情况，利用强化学习的算法，在软件环境中模拟扫地机器人的实际运动，

•.M 0

button

k •UT

brutfl

reH

—

l_brutf<

w*tn.9ump

•

ve«

〇

dvwt* pr«(i

(

(]

rMargAQ

-Mat，- 7

r<#«n n

tun

dr 0

««u>b〇* ajt* o

〇

oU**"

BflO *(*»!■*

I***.W

utw» o

VKW

* 0

*» >«

was

M%w

•〇«! tin* us

U"* ttn» w»

图4追觅虚拟现实全仿真软件测试环境

ATgggf

IHC I A

卜

产业应用

峰值速度可以达到每分钟几万平方米的清扫强度，代替人工测试进行算法优化。在特定

环境中，相比工程师人工编写的算法，效率提升30%以上。基于这种思路，未来扫地

机器人可能实现针对特定家居环境的算法自动更迭，真正实现“扫地机器人越用越聪

明”。

5.2基于室内布局场景的清扫策略

同样的清扫策略，在不同室内环境下的清扫结果可能差异很大。这是因为清扫策

略中不可避免地加入了人为选择的先验知识，而这些先验知识很难做到对所有情况都适

用。例如，为了做到高效的全覆盖清扫，扫地机器人普遍采用弓形清扫路线，这种策略

在幵阔区域能够得到很高的清扫效率并避免重复清扫，但是在相对狭窄的户型或区域

内，就会容易造成重复清扫和耗时过长。

一方面，由于室内布局场景的差异，用人工分类的方法很难设置分类规则，而通

过机器学习方法对视觉导航机器人获取的环境信息进行筛选分类，则能够获取信息内部

的隐藏特征，取得明显高于人工的分类质量。这样就可以在不同的场景下采取多样化、

定制化的清扫策略。另一方面，视觉导航扫地机器人建立房间的三维语义地图，为多样

化的清扫策略提供了更多的可能性，提前针对不同场景和场景内的具体物体定制适合的

清扫策略，形成策略库，对应机器学习对室内布局场景的分类结果，匹配出最适合的清

扫策略（这个清扫策略甚至可以是不同子场景的组合），从而做到智能化的策略选择。

同时，新的、有效的室内布局场景的清扫策略可以不断丰富和更新策略库，形成稳定的

闭环。

5.3基于宠物和人行为邢解的协同清扫策略

扫地机器人作为家用机器人/智能家电的一种，高效率、无死角的清扫结果仅仅是

基本要求。家是温暖的港湾，家用机器人应该同时关注自身服务给用户带来的舒适度和

满意度。例如，养宠物的用户绝对不愿意看到扫地机器人在家里“横冲直撞”，把宠物

吓得到处乱跑。相反，根据追觅长期以来收到的用户反馈，扫地机器人与宠物之间的互

动，能够明显提高用户对清扫任务的满意度。另一个典型场景是主人在家清扫时，在探

测清扫边界时很容易与人体发生碰撞。这样很可能会降低用户的使用体验。上述案例并

没有统一的评价指标，更没有相关的行业标准，主要有以下三个原因：一是智能家电行

业在我国兴起时间还不长，很多智能家电厂商没有考虑到扫地机器人与宠物和人之间的

交互；二是用户舒适度和满意度等指标很难准确衡量，而且通常因人而异；三是传统的

清扫策略很难融入这些指标。

视觉导航扫地机器人能够获取并解读出丰富多样的信息，而其清扫环境长期变化

人工智能算法赋能视觉导航清洁机器人

不明显，如果对这些信息

加以合理利用并融入到清

扫策略当中，将使其越来

越智能，与主人的“合作”

越来越“心有灵犀”。应

用强化学习方法可以完美

达成上述目标，为三维语

义地图中的每个网格点设

置奖励函数，完成一次清

扫过程即完成了一次策略

的迭代。用图像识别算法

获得宠物和人行为理解并融入到奖励函数和价值函数中，该过程代表了扫地机器人与宠

物和人之间的交互。

用强化学习迭代更新清扫策略的优势主要有：第一，对于不好量化的优化指标，如

用户满意度，可以通过在已有策略经验基础上逐步尝试，以获取最契合每一个用户的量

化函数；第二，统一的价值函数使得优化目标更加明确，摒弃了间接优化目标和经验参

数过多造成的优化目标混乱问题；第三，好的清扫策略能够得到正反馈，进而在以后的

清扫过程中进一步加强这种策略，反之，不好的清扫策略则会在一次次清扫的迭代优化

中被逐渐摒弃；第四，清扫环境长期变化不大，使得环境和状态信息的复用成本很低；

第五，使用户更有参与感，真正做到了“以服务客户为导向”。在实际应用时，可能会

存在计算量大的问题，可以通过在线学习模型和离线模型结合使用的策略——清扫时使

环境

图5执行者-评价者算法原理

-------------------------翁

用离线模型，保证任务执行效率；清扫完成后进行在线学习，更新清扫策略，完成迭代。

另外，5

和云计算技术的不断成熟，也为大规模计算优化问题提供了新的部署途径。

参考文献

[1] Xiang Zhang. Unsupervised learning to detect loops using deep neural networks for visual SLAM system|J], Autonomous robots,2017,

41(1):卜 18.

(2] Cheein.G. Steiner,G. Perez al. Optimized E1F-SLAM algorithm for precision agriculture mapping based on stems detection[J].

Computers and electronics in agriculture,2011,78⑵:195-207.

[3| R. F. Salas-Moreno^R. A. Newcombe.H. Strasdat.P. H. J. Kelly and A. J. Davison. SLAM++-.Simultaneous Localisation and Mapping at the Level of

Objects[C]. //2013 IEEE Conference on Computer Vision and Pattern Recognition,Portland,2013： 1352-1359.

[4] C. Tao.Z. GaoJ. Yan.C. Li and G. Cui. Indoor 3D Semantic Robot VSLAM Based on Mask Regional Convolutional Neural Networkp). IEEE

Access,2020,8:52906-52916.

[5] Yali al. Visual search based indoor localization in low light via rgb-d camera|J|. World Academy of ering and Technology,

International Journal of Computer,Electrical,Automation,Control and Information Engineeringm,2017,ll(3)：349-352.

[6] Z. Zhang,Z. Cheng,G. Wang and J. Xu. A VSLAM Fusing Visible Images and Infrared Images from RGB-D camera for Indoor Mobile Robot[C].

//2018 IEEE CSAA tion and Control Conference(CGNCC),Xiamen,China,2018：l--l.

[7] Sutton,R ichard S.,et al. Policy gradient methods for reinforcement learning with function approximationUI. Advances in neural information processing

systems, 2000.

在线阅读（节选)

•

2024年3月29日发(作者：裴俊郎)

7■

胃

卜

VIEW

2020

产业应用

人工智能算法赋能

视觉导航清洁机器人

口文/李丰果1,俞浩2

(1.追觅科技家用机器人研发中心，江苏省苏州市215000; 2.追觅科技，江苏省苏州市215000)

李丰果

追觅高级算法工程师，毕业于清华大学，参与追觅扫地机器

人导航规划前沿算法研发及应用落地，研究方向包括机器人

导航规划、智能控制、SLAM、机器学习、强化学习等，已

授权或公开的专利5项。

追觅科技创始人兼公司CEO。专注于数字马达、空气动力

学和人工智能领域，拥有多项发明技术和专利，是中国最早

的四旋翼开发者之一，同时也是三旋翼飞行器的发明者。

摘要：

市面上的中高端扫地机器人基本都具备依靠导航规划清扫路径的能力，当前实际落

地的导航技术包括视觉导航和激光导航两类。相比于激光导航，视觉导航的扫地机器人具

有成本更低、体积更小、感知信息维度更丰富的优势。然而，现阶段视觉导航在实际应用中，

仍然存在识别精度低、暗光环境下无法正常使用等问题。本文基于人工智能算法的发展，

针对上述问题进行了技术解决思路的分析，并对视觉导航扫地机器人的应用场景进行了更

多展望。

关键词：

扫地机器人；人工智能；VSLAM

中图分类号：

TP24; TP242.6

文献标志码：

文章编号：

2096-5036(2020)05-0068-08

人工智能算法赋能视觉导航清洁机器人

1扫地机机器人主流导航历史与介绍

扫地机器人作为目前家用电器中唯一具备自主移动能力和环境感知能力的品类，

一直是新技术应用的先锋。2002年，军事机器人出身的美国

iRobot

公司推出了第一

款真正意义上的家用扫地机器人

Roomba

,正式幵启了智能扫地机器人时代。

目前，市场上的扫地机器人的细分品类非常多，按照导航规划方式，可以划分为

随机清扫和导航规划清扫（弓字型行走）两大类，导航规划清扫是中高端扫地机器人的

标配，可以为室内环境建图，以此规划清扫路线，工作起来既节能又高效。

现阶段实际落地的导航技术有两种（如图1所示），一种是视觉导航（

vSLAM

，

visual

Simultaneous

Localization

And

Mapping

)，另一种是激光导航

（Lidar

SLAM

)。前者用普通的摄像头采集环境中的特征点信息，利用视觉算法确定机器人的

位姿；而后者则采用安装在机器人顶部的可以发射接收激光的模组，通过360度多点

位激光测距，实现二维地图建图，同时确定扫地机器人自身的位置。

图1激光导航扫地机器人机器人（左）对比视觉导航扫地机器人（右）

2两种导航技术应用于扫地机器人的优劣势对比

在目前市场上的高端机器中，激光导航方案占比非常高，这主要是因为采用激光

导航的扫地机器人在建图速度和精度上略高于采用视觉导航的扫地机器人，且激光导航

对于光线的要求较低。加之导航技术的方案成本较高，因此采用激光导航方案的扫地机

器人售价也相对较高。

表1视觉导航与激光导航的优势对比

激光导航方案视觉导航方案

建图精度局

中（碰撞建图）

建图速度

高（远程扫描建图）低（碰撞建图）

环境光线要求

可在全黑暗环境工作无法在黑暗环境工作

传感器体积

大（顶部凸起）

小

传感器成本中高低

处理器算力需求

低局

智能可扩展性

低（二维点阵房间识别）

高（可扩展图像识别）

TiSM

Al-VIEW 2020

年第

期

产业应用

视觉导航方案仅

需要普通的摄像头配

合一定的处理器算力

即可工作，成本上远

低于需要激光收发装

置和机械旋转马达的

激光导航方案，且在

空间占用上，视觉导

航方案小于激光导航

视觉惯性里程计

图2

vSLAM

工作原理

方案。这些优势对于

成本和体积都受限制的家用扫地机机器人非常重要。所以，采用视觉导航的扫地机器人

一般主打超薄机身概念，并且均价也相对较低。

但在智能可扩展性方面，视觉导航方案的潜力则远高于纯激光导航方案。采用视

觉导航方案的扫地机器人输入的信息是维度更加丰富的二维图像信息，而激光雷达采集

的仅仅是激光测距的一维距离信息。虽然目前由于算法和算力的原因，视觉导航方案仅

仅提取了其中的点/线等有限信息用于导航定位，但随着算力的提升，结合图像识别等

人工智能算法的迭代，视觉导航方案能够基于对环境的理解，提供更加智能的清扫体验。

而由于嵌入式芯片的超摩尔定律和软件算法研发的极低边际成本，未来将会出现成本和

性能均超越激光导航方案的视觉导航解决方案。

图3米家扫拖机器人1

高级地图功能（左）与

iRobot

APP

高级地图功能（右）

人工智能算法赋能视觉导航清洁机器人

所以，在技术路线选择上

，Neato

(俐拓）、石头科技等厂家选择了激光导航方案，

以确保在高端扫地机器人上的体验优势；而

iRobot

、追觅科技则选择押注视觉方案的

长期扩展性，希望通过软件算法的升级迭代，提升扫地机器人的用户体验。其代表性的

产品

iRobot

Roomba

9、米家扫拖机器人1

都在通过远程

OTA

(

The

Air

，远

程在线升级）逐步增加产品功能体验。

3目前视觉导航技术在扫地机器人的应用中仍然存在挑战

3.1建图效率低，只能通过碰撞确定边界

vSLAM

是同时定位与导航技术，在实际应用中，视觉导航方案被分为前端和后端，

并分别在不同线程下工作。前端实时采集图像数据并进行粗略的位姿估计，后端对前端

的结果进行非线性优化，从而保证精度。因此造成建图效率低下，导致用

vSLAM

建立

的地图是稀疏地图，不能做到覆盖所有的边和角落；而对扫地机的清扫任务来说，边边

角角的全覆盖清扫往往是用户最为关注的指标之一。因此，目前视觉导航扫地机器人在

清扫一些边和角落时，仍然需要通过撞板碰撞以建立完整的地图边界，造成实际展示给

用户的地图不够精确（存在10

左右精度误差）。

3.2暗光环境下视觉导航失效问题

视觉导航方案的前端以相机采集的图像作为初始处理数据，从图像中提取少量特征

点，然后提供给后端进行非线性优化，从而得到相机位姿的最优估计。特征点是图像中

比较特殊的点，在一定的度量下，它们与周围图像有明显的不同，并能够在相机小范围

位姿变化时便于在不同图片中进行匹配。在暗光环境中，图片整体信息趋同，特征点检

测算法难以有效捕捉特征点提供给后端，因此导致后端无法有效对前端的估计位姿进行

非线性优化，最终导致视觉导航失效。虽然在视觉失效的情况下，扫地机器人的其他传

感器（惯性陀螺仪、光流传感器等）依然能够维持短时间的机器人导航，但是长时间后

累积误差加大，依然会引发地图错位等问题，影响用户体验。

4基于人工智能算法的优化赋能视觉导航

4.1机器学习辅助建图

视觉导航方法是一系列优化综合的结果，其中很多步骤都可以由人工调参改为用机

器学习和深度学习方法自动完成。前端和后端的优化基于相机位姿连续变化时相邻图片

之间的关联关系，并进一步利用相机回到同一个位姿时图像的相似性，即回环检测，加

X^kB

胃£

C I AI-VIEW 2020

产业应用

72 •

入更多的约束条件以提高估计精度。如何判断图片之间的相似性，对于人类是非常简单

的事情，但对于计算机却非常困难，因为它看到的只是一些数值而已。传统回环检测采

用词袋模型，需要人工提取图片特征，不易操作且容易受到研究者对图片理解的限制。

近年来，深度学习技术获得快速的发展，图像处理方面的进展尤为显著，可以进一步替

代人工调参。

Xiang

Gao

和

Tao

Zhang

111把深度学习中的堆叠降噪自动编码器应用到

vSLAM

的回环检测中，该方法先用类似的数据和参数配置训练一个堆叠降噪自动编码

器，然后用该自动编码器从相机采集的原始图片中自动提取特征，这样就可以学习到图

片数据中复杂的内部结构，而不需要人工去设置视觉特征。不仅如此，

vSLAM

前端优

化中的特征提取也可以由机器学习代劳。

Cheein

等121在橄榄果园的视觉导航定位应用

场景中，使用

HOG

方法把采集的图片分离成低维度特征空间，然后利用支持向量机方

法，从特征空间中提取出橄榄茎特征，该特征提取方法在实际应用中被证明是非常有效

的。

4.2图像识别与深度估算辅助沿边和避障

沿边和避障是扫地机器人清扫任务中两个互相矛盾的优化策略。一方面，清洁覆盖

率的目标要求扫地机器人尽可能贴近房屋边缘和角落清扫，以增加清扫覆盖率，防止漏

扫；另一方面，用户体验的目标又要求扫地机器人尽可能远离障碍物，以减少碰撞次数，

特别是一些敏感或贵重物体。通过结合

vSLAM

和图像识别技术，能够构建带有物体标

签的三维语义地图1

，提升房间边缘和角落的建图精度和识别效率，并应用不同的清

扫策略。在三维语义地图下，对重点对象和复杂的地图轮廓设计专用的避障和沿边算法，

从而解决“只能通过碰撞确定边界”的问题，解决沿边和避障的优化矛盾。同时，在三

维语义地图下设计规划策略，可以轻松解决扫地机器人的绕线、卡床底等问题。利用图

像识别技术的目标动态跟随和快速检测特性，可以辅助构建复杂场景下的动态地图，使

得规划策略的局部实时优化成为可能。

4.3利用图像处理算法提升暗光环境的定位表现

针对暗光环境下视觉定位问题，学者们开展了很多有前景的研究。

Yali

Zheng

等151

从

RGB-D

相机成对采集的深度照片和红外照片序列，在词袋框架下创建的数据库中，

搜索匹配出最相近的照片，实验验证了该方法在室内暗光线条件下的较好的重定位结

果。

Zhexiao

Zhang

等w提出了基于0

SLAM

2和融合红外照片与可见光照片的重

定位方法，提高

vSLAM

使用红外照片的鲁棒性。室内环境有很多特殊的信息有待进一

步挖掘利用，如墙体和家具的边线，新的图像处理算法正在不断提升暗光环境的定位表

现，结合新型的暗光

CMOS

组件，未来有希望在微光环境下实现视觉导航完全生效。

人工智能算法赋能视觉导航清洁机器人

5人工智能技术在视觉导航扫地机器人的应用展望

5.1稳定高效的室内导航规划

单一的导航规划策略在复杂情况下可能会出现未预期的结果，扫地机器人的任一单

元一旦出现问题，就会降低整体的性能。视觉导航扫地机器人融合了

IMU

、里程计、

相机等多个传感器的数据，提高了导航定位算法的稳定性，但仍会出现一些不尽如人意

的结果，例如光线不足时定位精度下降的问题。因此，应该为扫地机器人配备多种备选

方案，互相促进，整体达到更好的效果。追觅慧目

9扫地机器人在搭载先锋2.0光学

视觉导航系统的同时，还配备了高性能光流传感器，可以辅助视觉导航更精准地锁定坐

标信息，在光线不足的环境下，辅助校正路线。

追觅慧目

9扫地机器人为用户提供地图记忆和自动分区的功能。地图记忆允许扫

地机器人保存以往的清扫地图，并在下一次清扫开始时先对当前清扫环境与以往清扫地

图进行匹配，匹配成功后将会复用以往的清扫地图并完成自动分区。随后，机器人仅需

对有变化的区域局部更新即可，而不用每次清扫都进行一次房间的全面探测，提高了导

航规划的效率。

同时，针对现有扫地机器人在实际环境中的物理特性，追觅的技术团队也尝试搭建

了全仿真的软件测试环境（如图4所示），可以模拟物理世界中地面打滑、镜面干扰、

暗光失效等真实情况，利用强化学习的算法，在软件环境中模拟扫地机器人的实际运动，

•.M 0

button

k •UT

brutfl

reH

—

l_brutf<

w*tn.9ump

•

ve«

〇

dvwt* pr«(i

(

(]

rMargAQ

-Mat，- 7

r<#«n n

tun

dr 0

««u>b〇* ajt* o

〇

oU**"

BflO *(*»!■*

I***.W

utw» o

VKW

* 0

*» >«

was

M%w

•〇«! tin* us

U"* ttn» w»

图4追觅虚拟现实全仿真软件测试环境

ATgggf

IHC I A

卜

产业应用

峰值速度可以达到每分钟几万平方米的清扫强度，代替人工测试进行算法优化。在特定

环境中，相比工程师人工编写的算法，效率提升30%以上。基于这种思路，未来扫地

机器人可能实现针对特定家居环境的算法自动更迭，真正实现“扫地机器人越用越聪

明”。

5.2基于室内布局场景的清扫策略

同样的清扫策略，在不同室内环境下的清扫结果可能差异很大。这是因为清扫策

略中不可避免地加入了人为选择的先验知识，而这些先验知识很难做到对所有情况都适

用。例如，为了做到高效的全覆盖清扫，扫地机器人普遍采用弓形清扫路线，这种策略

在幵阔区域能够得到很高的清扫效率并避免重复清扫，但是在相对狭窄的户型或区域

内，就会容易造成重复清扫和耗时过长。

一方面，由于室内布局场景的差异，用人工分类的方法很难设置分类规则，而通

过机器学习方法对视觉导航机器人获取的环境信息进行筛选分类，则能够获取信息内部

的隐藏特征，取得明显高于人工的分类质量。这样就可以在不同的场景下采取多样化、

定制化的清扫策略。另一方面，视觉导航扫地机器人建立房间的三维语义地图，为多样

化的清扫策略提供了更多的可能性，提前针对不同场景和场景内的具体物体定制适合的

清扫策略，形成策略库，对应机器学习对室内布局场景的分类结果，匹配出最适合的清

扫策略（这个清扫策略甚至可以是不同子场景的组合），从而做到智能化的策略选择。

同时，新的、有效的室内布局场景的清扫策略可以不断丰富和更新策略库，形成稳定的

闭环。

5.3基于宠物和人行为邢解的协同清扫策略

扫地机器人作为家用机器人/智能家电的一种，高效率、无死角的清扫结果仅仅是

基本要求。家是温暖的港湾，家用机器人应该同时关注自身服务给用户带来的舒适度和

满意度。例如，养宠物的用户绝对不愿意看到扫地机器人在家里“横冲直撞”，把宠物

吓得到处乱跑。相反，根据追觅长期以来收到的用户反馈，扫地机器人与宠物之间的互

动，能够明显提高用户对清扫任务的满意度。另一个典型场景是主人在家清扫时，在探

测清扫边界时很容易与人体发生碰撞。这样很可能会降低用户的使用体验。上述案例并

没有统一的评价指标，更没有相关的行业标准，主要有以下三个原因：一是智能家电行

业在我国兴起时间还不长，很多智能家电厂商没有考虑到扫地机器人与宠物和人之间的

交互；二是用户舒适度和满意度等指标很难准确衡量，而且通常因人而异；三是传统的

清扫策略很难融入这些指标。

视觉导航扫地机器人能够获取并解读出丰富多样的信息，而其清扫环境长期变化

人工智能算法赋能视觉导航清洁机器人

不明显，如果对这些信息

加以合理利用并融入到清

扫策略当中，将使其越来

越智能，与主人的“合作”

越来越“心有灵犀”。应

用强化学习方法可以完美

达成上述目标，为三维语

义地图中的每个网格点设

置奖励函数，完成一次清

扫过程即完成了一次策略

的迭代。用图像识别算法

获得宠物和人行为理解并融入到奖励函数和价值函数中，该过程代表了扫地机器人与宠

物和人之间的交互。

用强化学习迭代更新清扫策略的优势主要有：第一，对于不好量化的优化指标，如

用户满意度，可以通过在已有策略经验基础上逐步尝试，以获取最契合每一个用户的量

化函数；第二，统一的价值函数使得优化目标更加明确，摒弃了间接优化目标和经验参

数过多造成的优化目标混乱问题；第三，好的清扫策略能够得到正反馈，进而在以后的

清扫过程中进一步加强这种策略，反之，不好的清扫策略则会在一次次清扫的迭代优化

中被逐渐摒弃；第四，清扫环境长期变化不大，使得环境和状态信息的复用成本很低；

第五，使用户更有参与感，真正做到了“以服务客户为导向”。在实际应用时，可能会

存在计算量大的问题，可以通过在线学习模型和离线模型结合使用的策略——清扫时使

环境

图5执行者-评价者算法原理

-------------------------翁

用离线模型，保证任务执行效率；清扫完成后进行在线学习，更新清扫策略，完成迭代。

另外，5

和云计算技术的不断成熟，也为大规模计算优化问题提供了新的部署途径。

参考文献

[1] Xiang Zhang. Unsupervised learning to detect loops using deep neural networks for visual SLAM system|J], Autonomous robots,2017,

41(1):卜 18.

(2] Cheein.G. Steiner,G. Perez al. Optimized E1F-SLAM algorithm for precision agriculture mapping based on stems detection[J].

Computers and electronics in agriculture,2011,78⑵:195-207.

[3| R. F. Salas-Moreno^R. A. Newcombe.H. Strasdat.P. H. J. Kelly and A. J. Davison. SLAM++-.Simultaneous Localisation and Mapping at the Level of

Objects[C]. //2013 IEEE Conference on Computer Vision and Pattern Recognition,Portland,2013： 1352-1359.

[4] C. Tao.Z. GaoJ. Yan.C. Li and G. Cui. Indoor 3D Semantic Robot VSLAM Based on Mask Regional Convolutional Neural Networkp). IEEE

Access,2020,8:52906-52916.

[5] Yali al. Visual search based indoor localization in low light via rgb-d camera|J|. World Academy of ering and Technology,

International Journal of Computer,Electrical,Automation,Control and Information Engineeringm,2017,ll(3)：349-352.

[6] Z. Zhang,Z. Cheng,G. Wang and J. Xu. A VSLAM Fusing Visible Images and Infrared Images from RGB-D camera for Indoor Mobile Robot[C].

//2018 IEEE CSAA tion and Control Conference(CGNCC),Xiamen,China,2018：l--l.

[7] Sutton,R ichard S.,et al. Policy gradient methods for reinforcement learning with function approximationUI. Advances in neural information processing

systems, 2000.

在线阅读（节选)

•

USB迷 | 专注于互联网分享

人工智能算法赋能视觉导航清洁机器人

与本文相关的文章

评论列表 (0)