1. 磐创AI-开放猫官方网站首页
  2. Medium

MemuConvert

MemuConvert

基本上,MemuConvert是一种图像处理方法。目的是减少目标检测中的标记处理工作量。

我为什么要开发这个方法?

我参加了一个团队的比赛,我们的任务是用无人机的数据检测汽车。我们在YOLOV3中使用它自己的数据集尝试了这个任务。然而,这是一个失败,因为数据集不充分。因此,我们理解,我们必须从头开始训练人工智能。

目标检测分为3个步骤:采集数据、标注数据、训练阶段。主要问题是需要大量的标注数据。有三种解决方案,与其他人工智能一起训练人工智能,使用scale.ai等网站,以及使用算法。我们没有另一个人工智能来训练,我们不想花钱,因为我们想在比赛中有所作为。因此,我们搜索了算法,但问题是一样的,过程是基于人力的。之所以会出现此问题,是因为应该为每个图像定义新的阈值。出于这个原因,我不得不限制门槛。

该方法

可以从图像、颜色和形状获取两种类型的数据。每个人都有自己的问题。例如,形状算法无法找到脸部或汽车等大多数对象,因为它们是其他元素的总和。如果车只有车身和轮胎,我们就叫它“车”。由于大多数物体都是推理结果,形状算法找不到结果。它逐一找出所有的推论。有时,它也会发现一些人造的表情,比如天际线。因此,新的方法应该基于颜色,但大多数情况下,图像在所需颜色中具有不需要的像素。

在A1中,建筑物和出租车具有相同的调色板,因此这是颜色算法的两个相同对象。因此,我应该去掉那些多余的颜色。

步骤

海绵测试

海绵测试是对我在图像中所做的物理描述。想象一下,一块海绵上只有一个红点。如果你挤压那块海绵,海绵上的红色就会消失。总而言之,这种物理应用提供了主色,这为用主色重建对象提供了机会。

Kimage:表示经过海绵测试的图像中分割出的矩形个数。

Kxcolor:表示特定矩形的主色。

在开始时,我将Kimage修复为1024,但在低质量图像中,Kimage不起作用。因此,我将Kimage固定为图像的x长度。但是,有些图像对于等长矩形并不方便。因此,一些矩形重叠在每个矩形上。因此,为了去掉这些矩形,需要对图像进行模糊处理。

所有的图像都有相同的阈值!

总而言之,

该方法为快速训练目标检测人工智能提供了机会。然而,由于算法的通用性,它并不能精确地标注所有的图像。

原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2021/07/17/memuconvert-2/

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息