yolo
yolo copied to clipboard
经验总结
1.概况
这是一个利用yolo算法实现车流识别的系统。硬件基础是cpui7-7700HQ,显卡英伟达1050TI。
基于win10,python3。
python的安装库要求深度学习框架tensflow,keras和一些常用机器学习库。
是否选择gpu加速看个人情况,这里使用cuda8.0,cudnn6.0。
2.yolo简述
YOLO ("you only look once")是一种流行的算法,因为它实现了高精度的同时还能够在实时运行。1.目标的表示。
我们所熟知一般的卷积神经网络,经过若干次池化和卷积,在全连接层后利用softmax分类或者sigmoid判断物体是否存在。而对于yolo,它将一个图片分成19×19的网格,在每个网格里寻找物体。物体的表现形式为 (pc,bx,by,bh,bw,c),pc代表物体存在与否,x,y代表方框中心,h高度,w宽度,都是相对于整体1的数字,c代表类别。c为(c1,c2......)每个cn都是1或0。而针对一个19×19方格出现多个物体,用anchor boxes解决。假如有80类要探测,且每个方格至多可能出现5个个体。如图所示。
2.目标的确定。
对于每个anchor box我们找出其最可能的种类。

如果我们不画出pc为0(无探测物体的的anchor box)。可能得到这样的图片

出现统一物体被多次画框。这时我们要用 IoU和Non-max suppression。就是所谓的交并比和非极大值抑制。iou如图
