用“眼睛”去看,来提高计算和处理系统的效率!
引入计算机视觉(CV)范式,通过视觉输入提高计算和处理系统的效率。这些视觉输入采用先进的技术进行处理,以提高人机交互(HMI)的可靠性。视觉输入的处理需要进行多层次的数据计算,以实现特定应用的可靠性。
因此,该研究介绍了一种两级视觉信息处理(2LVIP)方法,以满足HMI应用的可靠性要求。2LVIP方法通过分类学习来处理结构化数据和非结构化数据,从输入中提取最大增益。本文以“A two-level computer vision-based information processing method for improving the performance of human–machine interaction-aided applications”为题于2020年10月8日发布于《Complex & Intelligent Systems》杂志上。
研究背景
计算机视觉(Computer Vision,简称CV)是一种人工智能辅助的范式,它通过摄像头、视频和深度学习方法来检测数字世界。它以适当的方式对物体进行分类,并自动做出反应。CV专注于物体的三维建模、多摄像机几何分析、云处理和基于运动的推断。它从机器上获取输入,并根据特定的知识处理输出,即对象标签和同步。
它还包括开发特定的技术,如图像识别、视觉识别和面部识别等。大多数情况下,CV是用来实现对数字处理的高级理解。CV的任务是在更高的维度上捕捉、检查和识别数字对象和提取物。这一任务使其能够为几何学、物理学、统计学和学习理论中使用的图像转换提供所需的科学或代表性信息。
人机交互(HMI)涉及通过用户界面与机器进行交流和合作。这些交互是在用户和机器之间进行的,以控制机器的直观行为。近年来,特定的传感器被用来捕捉控制机器所需的正常、异常和神经姿态。在HMI中,CV用于获取高级别的照片和视频,用于理解这图像。CV与HMI的关系在于,它们既能检测和监视物体,也能通过确定物体的运行条件来控制它们。
CV的升级应用之一是手势识别,它监测HMI中使用的姿势,并与它们进行交互。该应用的目标是获得有力的非特定视觉。它被应用于自动停车、用手势控制音乐、多次触摸的眼球跟踪等。在虚拟现实应用中,CV和HMI通常一起使用。与其他基线技术相比,CV与HMI结合产生的误差最小。
CV中的数据处理是通过获取图像,然后提取需要处理的信息。CV使用高级方法获取输入图像;基于这种方法,获得分类,呈现相应的结果。因此,开发了识别方法来检测图像。获得的图像通过人机界面应用与机器进行交互,例如依靠语音和听觉的辅助设备,针对特定平台开发。许多基于预测的方法和机器学习算法已经被开发出来,用于与HMI相关的CV检测。目前的工作是针对结构化数据和非结构化数据结合时出现的错误。它采用树法进行分类,使其达到最大的收益,并采用回归法来降低结构化数据和非结构化数据结合时的误差,最大限度地提高精度。
单目机器人视觉(MRV)用于与发现预测并行进行的不可见显着对象检测。无监督觅食对象(UFO)是最快速和最准确的方法,值得注意的对象发现。这是通过对机器人的真实世界的感知来完成的。主要目的是提高自主性和解决机器人的挑战,同时参与一个突出的对象发现过程。
CV以自动检测的方式学习语义对象的实例。该研究的目的是提高结构化和非结构化数据的分类精度,从而减少这些分类方法带来的误差。
图为两级视觉信息处理
图为输入数据处理
利用离散有限值导出结构化数据和非结构化数据的分类。它基于在特定时间获取的数据,并指示两组数据,例如有限值。
图为分类过程
图为回归过程说明
图为基于回归的检测过程
通过对不同度量指标的比较研究,讨论了该方法的性能评价。在此评估中,所考虑的度量包括精度、增益比、误差和处理时间。
在精度分析中,采用了前人的数据和即将得到的数据。通过与其它三种方法的分类比较,发现当信息增益减小时,得到的精度值较小。因此,如果分类得到改进,那么增益也会增加。这样,错误就减少了。
图中a为精度与分类实例。b为精度与信息增益%
图为增益%与分类实例
图中a为错误与分类实例。b为误差与信息增益%
尽管在使用2 LVIP方法时有大量的分类数据,但它的处理时间最小,如图所示。
图为a处理时间与分类实例。b处理时间与信息增益%
累积结果表明,该方法的精度和增益分别提高了3.61%和9.42%。它还使误差和处理时间分别减少了6.51%和21.75%。
研究结论
该研究讨论了一种提高人机交互系统精度的两级视觉信息处理方法。根据现有的信息,将从成像设备获得的输入分为结构化数据和非结构化数据。然后提取最大的信息增益,利用回归法来减小所获信息的误差。回归过程利用训练集数据,通过递归离散值和有限值估计来减少误差和处理时间。回归分析采用预测成本估计进行递归处理。
训练是为了减少从视觉输入中提取有用信息的处理时间。通过对分类和回归过程的调整,发现所提出的方法可以最大限度地提高检测对象的精度和信息增益,并减少错误和处理时间。在未来,基于优化的回归方法将被应用于物体的分类。
参考文献:Osama Alfarraj & Amr Tolba A two-level computer vision-based information processing method for improving the performance of human–machine interaction-aided applications Complex & Intelligent Systems (2020)
相关新闻推荐
-
在无人监管的区域中,对协同道路场景进行“重建”
-
能检查出渔场中渔网的破洞的“超级检查眼”!
-
一“双”能分辨出杂草和农作物的“火眼金睛”
-
由人工开发的纳米复眼,在各个领域都起到了极大的作用!
-
新一代多姿态人脸识别技术,可在不受限制的场景中使用!
-
视力障碍人士的第二双“眼睛”!
-
让手势更加丰富花哨,识别的更为精准和有效!
-
生成对抗网络降低机器人操作延迟,减小远程手术的风险!
-
原来虚拟人脸和人一样,人类主观地都会先认出积极的表情
-
传递多种信息的智能传感器,健康监控的小能手!
-
无线智能设备检测环境信息,准确度高还是精准!
-
对土壤反应研究,这种方式更快速更廉价!
-
利用人工智能来合成高附加值甲藻毒素
-
基于机器学习的原油流量估计模型,准确率达到96.99%!
-
研究人员开发新型氨曝气控制系统,能大大降低能源消耗!
-
对安卓手机的定位进行超级精确的校准!
-
利用边缘特征来识别目标,大大减少人工去辨别的时间
-
模具智能监控系统:远程监控,可以缩短工艺周期节省成本
-
对于曲线行径轨迹的虚拟行人,怎么让他避障呢?
-
用导航来测量数据,分析农用拖拉机的动力学特性
-
把传感器穿在身上吧,让它来检测你的生命体征!
-
新研发的自动控制器,可应用于电机防死锁系统!
-
人工智能使“智能”应用更安全、更快、更节能
-
科学家使用人工智能来更准确地预测大规模交通模式
-
管住超音速飞行器,对其进行控制设计!
-
智能识别人脸上的微表情,你的情绪,它会懂
-
智能系统中,更好的控制事情触发
-
高度有效的瞳孔定位方法!可以更精准的定位瞳孔位置
-
为残疾幼儿培育社会技能做出贡献的移动装置
-
新的机器学习算法可预测森林火灾,AI助力减少火灾损害
还没有人评论哦,抢沙发吧~