1. 磐创AI-开放猫官方网站首页
  2. Medium

使用AI - YOLO进行实时实时目标检测

“您只需看一次”即可检测到常见的(约9000)个对象及其各自的概率,这些概率大多很高。YOLO是一种用于检测图像和视频中的对象的尖端AI算法。速度、对象间的学习差异和可定制化是它的基本优点。其速度可以归因于对复杂卷积神经网络(CNN)的优化编程。它通过训练新的变化并从新的变化中学习来照顾对象的变化。拥有足够的培训数据(大量映像)可加快性能。可定制性可以通过手动标记不同图像中的≥200型对象,并将先前对大数据集学习的情报传授给用户,从而实现可定制化。complex convolutional neural nets

更多动作,请在詹姆斯·邦德的预告片中现场观看。James Bond trailer

目标检测是计算机视觉领域的一个重要概念。它是对图像数据中的目标进行检测和分类。它有很多应用-从自动驾驶汽车到监控。它帮助我们仅通过查看就解锁了我们的手机-因为轻敲手指太费力了。

YOLO应用的概念与您创建智能时使用的概念相同。您可以通过对环境中的对象进行检测和分类来学习。算法也是如此。YOLO非常准确,而且它看到的图像越多,准确度就越高。

它在学习物体的表示方面做得很好。当你了解碗的时候,你会发现其他看起来像碗的东西–大小不一、颜色各异–也是碗。你不必看所有的碗就能知道一个新的物体是一个碗。

考虑到它的完整形式,YOLO只“看一次”,因为它通过创建神经网络在一次传递中工作,神经网络将图像划分为区域,并预测每个区域的边界框和概率。这些边界框由预测的类别概率加权,以获得最终的分类和边界框。

该算法在40帧/秒(FPS)下的平均准确率(真阳性/(真阳性+假阳性))为78.6%。YOLO是可泛化的,并且还可以从带标签的对象周围的环境中学习。YOLO还提供对象存在的概率。它在检测到的对象周围绘制方框。该算法还检测到它没有训练过的对象。

随着检测到的框数量的增加,您会获得更高的IOU值(真实值和预测值有多相似)。如下所示:y轴是IOU值,x轴是箱数。

YOLO是针对大量标记良好的数据集进行培训的。它是以复杂的神经网络为模型,快速进行85.2亿次运算。它采用等级分类法,如“诺福克梗”和“约克夏梗”都是“猎犬”的下义词,“猎犬”是“狗”的一种,“猎犬”是“猎犬”的一种,而“猎犬”是“猎犬”的一种。大多数其他好胜模式都将标签视为不同的标签。

它是可定制的,可以高精度地预测自定义对象。YOLO是为检测微软的Hololens而定制的,正如你在下面看到的,它运行得很好。

YOLO在标记的图像和处理这些图像(裁剪、饱和度、旋转等)的增强数据上进行训练。它查看整个图像,从而推导出对象周围的上下文。该算法通过捕捉对象的本质特征和基本原理,具有较好的泛化能力。

我鼓励您阅读这里的报纸以了解更多细节。本文对YOLO提供了深入的解释和编程教程。浏览此处的代码。paper here This article here

原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2021/07/20/%e4%bd%bf%e7%94%a8ai%e2%80%8a-%e2%80%8ayolo%e8%bf%9b%e8%a1%8c%e5%ae%9e%e6%97%b6%e5%ae%9e%e6%97%b6%e7%9b%ae%e6%a0%87%e6%a3%80%e6%b5%8b/

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息