随着社会经济的发展水平和人们消费观念的改变,更具科技属性的智能规划扫地机器人成为最受消费者欢迎的智能家居产品。数据显示,智能规划扫地机器人的市场份额从17年的10个增加到18年的59个,其中激光导航76个,视觉导航系统24个。随着视觉导航系统在iRobot、戴森等扫地机器人头部阵营的持续发酵,单目和双目视觉导航的技术问题也受到了扫地机器人厂商的广泛关注。
众所周知,扫地机器人的视觉导航系统是通过对机器周围环境的连续拍摄和记录,根据特征点或标记建立地图,实现导航定位或路线规划,单目和双目方案都是如此。不同的是,在单幅图像中,单目相机无法确定与物体的真实距离,只能通过相机的运动形成视差来测量物体的相对深度。也就是说,单目视觉导航方案实际上无法映射物体的真实大小。这个物体可能是一个很小但很近的物体,也可能是一个很大但很远的东西。此外,由单目SLAM估计的轨迹和地图与真实的轨迹和地图有一个重要的因素-比例。即使结合里程表和IMU进行导航,仍然达不到双目精度水平。
真实尺度无法确定,也意味着基于测距的三维解算在单目传感器中的应用无法得到有力支持,影响了搭载单目视觉导航系统的扫地机的智能避障、语义地图等功能。另一方面,单目SLAM在运动过程中更易受噪声影响,稳定性低于双目SLAM,对复杂环境的适应能力较弱,不能长时间保持定位和规划的精度。这也是为什么单品成本较低,但市场对其反应平平的原因。
双目硬件结构更接近人眼,距离由左右图像的视差决定,这就是立体视觉。在工作原理上,双目是通过3D立体将左右眼拍摄的2D环境图像解算成具有深度信息的3D空间结构,更适合扫地机器人实现导航定位效果,精度和稳定性极佳。而且基于三维空间的三维解算,扫地机器人识别障碍物时可以解算障碍物距离、大小、属性,障碍物识别范围更广。类似于多线激光雷达,后续的避障会有更大的操作空间。另一方面,结合语义识别,双目视觉导航扫地机器人可以更好地获取语义地图,理解房屋的布局和空间结构,使扫地机器人实现跟踪人的目标、清扫特定语义区域等智能人机交互。甚至在没有人的情况下充当家庭保安工作的一部分。
当然,双目视觉实现这些功能是有前提条件的。双目视觉导航的难点之一是摄像机的同步。如上所述,双目测距是基于左右图像的视差。所以理论上左右摄像头应该是一模一样的,这就需要两个摄像头同步。如果两个摄像头在拍摄时不能做到完全同步,那么测距的参照物就会错位,造成不可逆的连锁误差。
为了解决这个问题,中国新的计算机视觉制造商INDEMIND开始优化其软件和硬件。首先,通过硬件同步和高精度标定算法,实现摄像机与其他传感器之间的微秒级时间同步,实现硬件侧的低误差测距。算法方面,搭载自研Vi-SLAM算法,通过构建全局SLAM地图,实现精确稳定的空间定位,进而掌握清扫路径和未清扫区域,自主智能完成“追赶式”清扫。此外,基于全局地图,还可以实现SLAM丢失后或启动后的重定位,提高机器人系统的鲁棒性。
在完成扫地机器人的基本工作后,结合语义识别建立的语义地图,扫地机器人不仅能“看到”,还能“理解”障碍物是什么,从而实现最优路径规划和全局/选择性避障,避免漏扫和漏扫。此外,根据语义地图,扫地机器人与人之间可以产生更多的交互,如语音命令扫地机器人清扫特定区域,重点清扫人群活动密集的区域等。从而可以更有效地执行家庭清洁任务。
总的来说,双目视觉导航是一种定位精度更高、系统鲁棒性更强、更加智能的扫地机器人导航方案,可以更好地引领扫地机器人向家居清洁的智能助手转型。随着技术的不断进步,可以预见双目视觉导航系统将逐渐成为扫地机器人的主流导航定位方案。