对行人智能检测的技术运用在智能建筑上,成功率直逼百分百!

   自动化那些事        

行人检测与跟踪是智能建筑监控领域的一项重要课题。由于传感器的进步,建筑师们集中精力建造智能建筑。智能建筑中的行人检测受到各种外部环境参数的图像噪声的影响。


传统的基于滤波器的图像分类技术,如定向梯度直方图、梯度滤波器和机器学习算法,对于大量行人输入图像效果不佳。深度学习算法在处理海量图像数据时表现出指数级的优势。该研究提出一种基于深度卷积神经网络(CNN)的行人检测模型,用于从输入图像中对行人进行分类。


在INRIA基准测试数据集(227×227像素图像)上评估了所提出的vga -16架构的优化版本,用于行人检测。该模型的精度达到98.5%。研究者发现,所提出的模型比其他预训练的CNN架构和其他机器学习模型表现得更好。通过对行人的合理检测,验证了算法的有效性。本文以“Enhanced pedestrian detection using optimized deep convolution neural network for smart building surveillance”为题于发布于《Soft Computing》杂志上。

对行人智能检测的技术运用在智能建筑上,成功率直逼百分百!


研究背景


近年来,研究的重点是将人工智能传授给机器,用于许多与人类无关的活动。它包括目标检测、动物跟踪、天气预报、监测、土木结构健康监测等。智能建筑监控包括识别可疑物体和可疑活动。


智能建筑集成了传感器技术和物联网处理,为建筑整体管理提供解决方案。最大的汽车和IT公司在自动驾驶汽车上投入巨资引起了人们的关注。他们还参与了机器和人机交互应用程序的开发。


在开发自动驾驶汽车的过程中,除了设计机器之外,还需要对环境的学习。最近的研究表明,超过5000名行人死于交通事故。它还补充道,在车祸中,行人比乘客更有可能死亡。重要的是,自动驾驶汽车应该根据动态环境采取行动,在那里,在它的行动范围内,任何人都有很高的风险。因此,有必要检测任何人并跟踪他们的活动。


行人检测是确定图像或视频中是否包含人,识别其位置并跟踪活动方向的过程。计算机视觉的发展扩展了其在智能辅助驾驶、行人检测和智能分析机器人中的应用。行人检测在机器人、监控、自动车辆驾驶系统、道路场景理解系统等领域都有大量应用。


然而,由于实时环境的复杂性、行人姿态的多样性和视觉捕捉角度的差异,行人检测是一项具有挑战性的任务。实际上,行人检测系统需要非常高的准确性和实时速度两个主要方面。


行人检测器应该在计算能力有限的系统下提供事实和非常准确的识别。尽管行人检测的算法很多,但可靠的人体形状检测仍处于研究阶段。探测人的困难是由于多种原因造成的,比如人的姿势不同,可能被其他的人或物体遮挡,背景中可能有人形物体导致错误的探测。


在检测器范围内的很多物品,如灭火器、椅子、玩偶等,都可能具有与人相同的特征,会被错误地与行人联系在一起。


虽然深度学习有各种独特的优点,但也有各种缺点。深度学习算法在很大程度上是黑盒子,可解释性很低。此外,深度学习算法严重依赖数据和计算要求。处理深度学习算法的主要挑战是它的超参数。


在众多超参数中,找到它们的最佳配置仍然很困难。在卷积神经网络(CNN)中,需要对数字、形状、步幅和滤波器的超参数进行配置。当深度学习算法的深度增加时,与架构相关的超参数数量也呈指数增长。


这项工作的主要贡献集中在从深度学习模型中提取最佳超参数,以提高行人检测的准确性。VGG-16是一种基于卷积神经网络(CNN)的工作架构,通过对其超参数进行优化。通过优化超参数,不仅可以提高深度学习模型的准确性,还可以帮助降低用于执行的计算能力。

对行人智能检测的技术运用在智能建筑上,成功率直逼百分百!


图为行人检测的HMPD模型


HMPD从支持向量机和遗传算法(GA)中提取出最优的支持向量机。

对行人智能检测的技术运用在智能建筑上,成功率直逼百分百!


图为卷积层工作原理

对行人智能检测的技术运用在智能建筑上,成功率直逼百分百!


图为VGG-16体系结构


VGG-16是一种16层深层次的体系结构,对图像数据的处理是有效的.VGG体系结构面临的主要挑战是,它从不专注于其超参数的优化工作。大多数深度学习体系结构都涉及到各种超参数。深层结构的性能优化可以通过对深度、步长、填充和参数共享等超参数进行微调,在DL结构优化中起主要作用。

对行人智能检测的技术运用在智能建筑上,成功率直逼百分百!


图为OVGG-16体系结构


为了提高行人检测的有效性,提出了一种优化的VGG-16(OVGG-16)结构。对OVGG-16的空间布局进行了优化,并与VGG-16的建筑布局进行了比较。

对行人智能检测的技术运用在智能建筑上,成功率直逼百分百!


图为OVGG-16配置过程


研究者数据集共有6817幅图像,包括3578幅行人图像和3239幅非行人图像。给定数据集中每幅图像的大小为227×227。在数据集中的总图像中,80%的输入数据用于训练模型,20%的数据用于模型验证。所建议的OVGG-16的体系结构和实现步骤如图所示。

对行人智能检测的技术运用在智能建筑上,成功率直逼百分百!


图为OVGG-16行人检测模型的工作结构


通过测试数据验证了模型的有效性,并与现有的机器学习和深度学习模型进行了性能比较。该研究采用HMPD作为ML模型,VGG-16作为DL模型来验证所提出的OVGG-16深度学习体系结构的性能。

对行人智能检测的技术运用在智能建筑上,成功率直逼百分百!


图为准确度比较

对行人智能检测的技术运用在智能建筑上,成功率直逼百分百!


图为精度比较

对行人智能检测的技术运用在智能建筑上,成功率直逼百分百!


图为回忆比较

对行人智能检测的技术运用在智能建筑上,成功率直逼百分百!


图为F-计量比较


OVGG-16总准确度为98.8%,VGG-16为97.2%,HMPD为90.4%。除了精确性外,OVGG-16在精确度、召回性和HMPD方面均优于VGG-16和HMPD。

对行人智能检测的技术运用在智能建筑上,成功率直逼百分百!


图为OVGG-16性能比较

对行人智能检测的技术运用在智能建筑上,成功率直逼百分百!


图为VGG-16性能比较

对行人智能检测的技术运用在智能建筑上,成功率直逼百分百!


图为准确度比较

对行人智能检测的技术运用在智能建筑上,成功率直逼百分百!


图为损失比较

对行人智能检测的技术运用在智能建筑上,成功率直逼百分百!


图为时代性与准确性比较

对行人智能检测的技术运用在智能建筑上,成功率直逼百分百!


图为时代与损失比较


算法的性能在每个时代值都得到了测量。EIRCH也是深度学习体系结构的一个超参数值,需要在训练模型之前定义它。一个时代值是一种度量,当整个数据集通过深度神经网络向前和向后传递一次时。


OVGG-16的精度值开始稳定在8,而VGG-16的精度值开始稳定在14。同样,OVGG-16的丢失值在10时开始稳定,而VGG-16在15的时值开始稳定,从上面的图形表示可以看出,VGG-16结构的优化版本在检测行人时产生了最大的精度值。超参数的优化对于提高深层建筑模型的效率具有重要的意义。


研究结论


该研究提出了一种基于视觉的基于CNN的行人检测模型。采用vgg16优化版本(ovgg16)作为行人检测的核心架构,性能优于vgg16和混合机器学习模型。


利用一组新的行人图像对该行人模型进行了验证,训练和验证的平均准确率达到98.5%。该模型的训练和验证损失平均降低到0.015。该模型能够在给定的输入框架内识别行人。虽然所提出的模型可以有效地识别行人,但对于该模型来说,在累积了类噪声特征的框架上工作仍然是一个挑战。因此,进一步的研究应该集中在对带有噪声数据的模型进行训练,使模型能够更有效地对输入图像进行分类。


参考文献:Bubryur Kim, N. Yuvaraj, K. R. Sri Preethaa, R. Santhosh & A. Sabari Enhanced pedestrian detection using optimized deep convolution neural network for smart building surveillance  Soft Computing 17081–17092(2020)



最新评论(0)条评论
不吐不快,我来说两句

还没有人评论哦,抢沙发吧~

相关新闻推荐