1. 磐创AI首页
  2. Medium

YOLOv1 - 您只需看一次(物体检测)

在本章節中,回顧了FIRE(脸书AI研究)的YOLOV1.網絡只查看圖像一次以偵測多個物件.因此,它被稱為Yolo,你只看一次。

只需查看一次圖像,偵測速度是实时(45fps)。FAST YOLOv1達到155fps。這是另一種最先進的深度學習對象檢測方法,在我寫這篇文章時已於2016年年CVPR發表,引用次數超過2000次。

下面是作者提供的YOLOv1範例:

如果有興趣,他們還提供其他YOLOv1範例:

  • YOLO观看YouTube(上)
  • YOLO观看YouTube(下)
  • YOLO观看YouTube第三部分
  • YOLO守望自然(上)
  • YOLO守望自然(下)

4.培训


4.1预留

  • 先用Imagnet千级數據集對捲積層做訓練
  • 訓練只使用前20層捲積層,後面接上一個Average-Pooling Layer和一個全連結層

4.2.边界框正規化

  • yolo訓練前會先依據輸入圖的長寬,正規化(规格化)的長寬,因此包围盒的長寬會介於0~1之間
  • 边界框的中心座標(x,y)是在特定网格单元的偏移(偏移),所以座標也會介於0~1之間

4.3激活功能

  • YOLO架構除了最後一層用線性輸出為,每一層都會搭配漏电整流线性激活(漏电重启)
  • 因為“Relu會使部分神經元的輸出為0,可以讓神經網路變得稀疏,緩解過度擬合的問題。但衍生出另一個問題是,某些神經元可能永遠不會被激活,導致相應的參數永遠不能被更新(失效重新连接问题)


4.4列车详细信息

  • 將預訓練好的部分再接上隨機權重的四層捲積層,和兩層F.C.
  • 因為偵測任務通常需要细粒度视觉資訊,提高解析度為448∗448
  • bw,bh:yolo訓練前會先依據輸入圖的長寬,正規化(规格化)的長寬,因此包围盒的長寬會介於0~1之間
  • Bx,By:边界框的中心座標(x,y)是在特定网格单元的偏移(偏移),所以座標也會介於0~1之間
  • 除了最後一層用线性激活,其他都是泄漏继电器

4.5微调细节

  • 纪元:≈≈135,动量:0.9
  • 衰减:0.0005,從第一個連接層之後丢失:0.5%
  • 学习率調整

  • 做圖像了20%HSV色空间中做了1.5倍曝光度和飽和度的隨機調整

5.非最大值抑制

通常做物件偵測時,有可能一個物件被很多候選框給選到(如下圖),下左圖就是一個例子假設算法抓到這麼多框都是物件,這時我們會採用非最大抑制將多餘的候選框濾除

2.將信心度很低的Bound Box先丟掉,並選出Confiability最高的Box,並假設他為“確定的物件”並加入物件集合

3.將剩餘的Bound Box和Confiability最高的Box、如果算出來的IOU大於設定好的Threshold、那些剩餘的Bound Box的Confiability會被設定為0(也就是這個Bbox重複計算要刪掉)

4.重複上述步驟直到剩下的信心都是0,這時候被存在“物件集合”的物件就是最後結果

参考文献

原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2021/09/20/yolov1%e2%80%8a-%e2%80%8a%e6%82%a8%e5%8f%aa%e9%9c%80%e7%9c%8b%e4%b8%80%e6%ac%a1%e7%89%a9%e4%bd%93%e6%a3%80%e6%b5%8b/

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息