1. 磐创AI首页
  2. Medium

基于计算机视觉的人脸面具检测。

引言:

在冠状病毒的情况下,有必要在公共场合佩戴口罩,以避免被感染。在这里,我们已经建立了一个计算机视觉模型,它可以检测到这个人是否戴了口罩。在进一步进行之前,我要感谢Rahul Arora在这方面与我合作。Rahul Arora

数据集集合:

在这里,我们在我们的数据集上建立了模型,其中有331个训练图像和17个带有标签掩模的测试图像,没有掩模

数据注释:

图像注释已使用MakeSense.AI完成。这是一个开源网站,可帮助您注释图像并根据我们的选择以任何格式下载。以下注释以两种方式完成:1.在.xml格式中,我们有X-min、X-max、Y-min、Y-max坐标MakeSense.AI

2..txt格式,包含对象类、对象坐标、图像宽度、图像高度

数据准备和建模:

因为我们在这里使用了2个不同的模型,所以数据准备已经用了2种不同的方式。这里我们不会包含所有使用的库或Python代码,因为这会使这个博客太长。参考资料部分将提供参考资料。

1.使用预先训练的SSD RESNET进行TensorFlow对象检测:

我们必须从XML创建.csv文件。

在此之后,我们需要分别创建训练和测试TF记录。

我们对我们的模型进行了10000步的训练。对于最后几个步骤,这里是我们的损失看起来是什么样子

从上面我们可以看出,总损失太大了,所以我们并不期望这个模型能够正常工作。为了对该模型进行推论,我们提供了下面的要点。

让我们检查一下我们的模型的性能。

从上面我们可以清楚地看到,我们的模型执行得不够好。要么需要训练更多的步数,要么需要使用更好的模型,但是对于最后几步,损失并没有减少很多,我们可能已经达到了饱和点。我们需要用更好的型号。

2.YoloV5s:

在这里,我们将使用.txt文件注释来训练模型。yolo v5有不同的版本。我们最初使用的是Yolo v5s版本来检查模型的性能,我们将只发布必须进行更改的代码片段。

在培训模型之前,请确保您的文件结构如下所示:

确保图像、标签文件名应该准确,否则会抛出错误。现在我们将训练我们的模型200个纪元,批次大小为80。对于最后几个纪元,这是我们的损失看起来是这样的。

让我们检查一下我们的模型的性能:

我们可以看到我们的模型执行得很好。让我们看看绘图是什么样子:

从上面我们可以观察到,我们的模型一点也不过度拟合。

参考链接:

GitHub存储库:

对于任何联系人,这里是我们的LinkedIn个人资料:1.Nipun Agrawal https://www.linkedin.com/in/nipun-agrawal-200597110/2.Rahul Arora https://www.linkedin.com/in/rahul-arora-461a19125/https://www.linkedin.com/in/nipun-agrawal-200597110/ https://www.linkedin.com/in/rahul-arora-461a19125/

原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2021/08/09/%e5%9f%ba%e4%ba%8e%e8%ae%a1%e7%ae%97%e6%9c%ba%e8%a7%86%e8%a7%89%e7%9a%84%e4%ba%ba%e8%84%b8%e9%9d%a2%e5%85%b7%e6%a3%80%e6%b5%8b%e3%80%82/

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息