用“眼睛”去看,来提高计算和处理系统的效率!

   自动化那些事        

引入计算机视觉(CV)范式,通过视觉输入提高计算和处理系统的效率。这些视觉输入采用先进的技术进行处理,以提高人机交互(HMI)的可靠性。视觉输入的处理需要进行多层次的数据计算,以实现特定应用的可靠性。


因此,该研究介绍了一种两级视觉信息处理(2LVIP)方法,以满足HMI应用的可靠性要求。2LVIP方法通过分类学习来处理结构化数据和非结构化数据,从输入中提取最大增益。本文以“A two-level computer vision-based information processing method for improving the performance of human–machine interaction-aided applications”为题于2020年10月8日发布于《Complex & Intelligent Systems》杂志上。

用“眼睛”去看,来提高计算和处理系统的效率!


研究背景


计算机视觉(Computer Vision,简称CV)是一种人工智能辅助的范式,它通过摄像头、视频和深度学习方法来检测数字世界。它以适当的方式对物体进行分类,并自动做出反应。CV专注于物体的三维建模、多摄像机几何分析、云处理和基于运动的推断。它从机器上获取输入,并根据特定的知识处理输出,即对象标签和同步。


它还包括开发特定的技术,如图像识别、视觉识别和面部识别等。大多数情况下,CV是用来实现对数字处理的高级理解。CV的任务是在更高的维度上捕捉、检查和识别数字对象和提取物。这一任务使其能够为几何学、物理学、统计学和学习理论中使用的图像转换提供所需的科学或代表性信息。


人机交互(HMI)涉及通过用户界面与机器进行交流和合作。这些交互是在用户和机器之间进行的,以控制机器的直观行为。近年来,特定的传感器被用来捕捉控制机器所需的正常、异常和神经姿态。在HMI中,CV用于获取高级别的照片和视频,用于理解这图像。CV与HMI的关系在于,它们既能检测和监视物体,也能通过确定物体的运行条件来控制它们。


CV的升级应用之一是手势识别,它监测HMI中使用的姿势,并与它们进行交互。该应用的目标是获得有力的非特定视觉。它被应用于自动停车、用手势控制音乐、多次触摸的眼球跟踪等。在虚拟现实应用中,CV和HMI通常一起使用。与其他基线技术相比,CV与HMI结合产生的误差最小。


CV中的数据处理是通过获取图像,然后提取需要处理的信息。CV使用高级方法获取输入图像;基于这种方法,获得分类,呈现相应的结果。因此,开发了识别方法来检测图像。获得的图像通过人机界面应用与机器进行交互,例如依靠语音和听觉的辅助设备,针对特定平台开发。许多基于预测的方法和机器学习算法已经被开发出来,用于与HMI相关的CV检测。目前的工作是针对结构化数据和非结构化数据结合时出现的错误。它采用树法进行分类,使其达到最大的收益,并采用回归法来降低结构化数据和非结构化数据结合时的误差,最大限度地提高精度。


单目机器人视觉(MRV)用于与发现预测并行进行的不可见显着对象检测。无监督觅食对象(UFO)是最快速和最准确的方法,值得注意的对象发现。这是通过对机器人的真实世界的感知来完成的。主要目的是提高自主性和解决机器人的挑战,同时参与一个突出的对象发现过程。


CV以自动检测的方式学习语义对象的实例。该研究的目的是提高结构化和非结构化数据的分类精度,从而减少这些分类方法带来的误差。

用“眼睛”去看,来提高计算和处理系统的效率!


图为两级视觉信息处理

用“眼睛”去看,来提高计算和处理系统的效率!


图为输入数据处理


利用离散有限值导出结构化数据和非结构化数据的分类。它基于在特定时间获取的数据,并指示两组数据,例如有限值。

用“眼睛”去看,来提高计算和处理系统的效率!


图为分类过程

用“眼睛”去看,来提高计算和处理系统的效率!


图为回归过程说明

用“眼睛”去看,来提高计算和处理系统的效率!


图为基于回归的检测过程


通过对不同度量指标的比较研究,讨论了该方法的性能评价。在此评估中,所考虑的度量包括精度、增益比、误差和处理时间。


在精度分析中,采用了前人的数据和即将得到的数据。通过与其它三种方法的分类比较,发现当信息增益减小时,得到的精度值较小。因此,如果分类得到改进,那么增益也会增加。这样,错误就减少了。

用“眼睛”去看,来提高计算和处理系统的效率!


图中a为精度与分类实例。b为精度与信息增益%

用“眼睛”去看,来提高计算和处理系统的效率!


图为增益%与分类实例

用“眼睛”去看,来提高计算和处理系统的效率!


图中a为错误与分类实例。b为误差与信息增益%


尽管在使用2 LVIP方法时有大量的分类数据,但它的处理时间最小,如图所示。

用“眼睛”去看,来提高计算和处理系统的效率!


图为a处理时间与分类实例。b处理时间与信息增益%


累积结果表明,该方法的精度和增益分别提高了3.61%和9.42%。它还使误差和处理时间分别减少了6.51%和21.75%。


研究结论


该研究讨论了一种提高人机交互系统精度的两级视觉信息处理方法。根据现有的信息,将从成像设备获得的输入分为结构化数据和非结构化数据。然后提取最大的信息增益,利用回归法来减小所获信息的误差。回归过程利用训练集数据,通过递归离散值和有限值估计来减少误差和处理时间。回归分析采用预测成本估计进行递归处理。


训练是为了减少从视觉输入中提取有用信息的处理时间。通过对分类和回归过程的调整,发现所提出的方法可以最大限度地提高检测对象的精度和信息增益,并减少错误和处理时间。在未来,基于优化的回归方法将被应用于物体的分类。


参考文献:Osama Alfarraj & Amr Tolba A two-level computer vision-based information processing method for improving the performance of human–machine interaction-aided applications   Complex & Intelligent Systems (2020)



最新评论(0)条评论
不吐不快,我来说两句

还没有人评论哦,抢沙发吧~

相关新闻推荐