MemuConvert
基本上,MemuConvert是一种图像处理方法。目的是减少目标检测中的标记处理工作量。
我为什么要开发这个方法?
我参加了一个团队的比赛,我们的任务是用无人机的数据检测汽车。我们在YOLOV3中使用它自己的数据集尝试了这个任务。然而,这是一个失败,因为数据集不充分。因此,我们理解,我们必须从头开始训练人工智能。
目标检测分为3个步骤:采集数据、标注数据、训练阶段。主要问题是需要大量的标注数据。有三种解决方案,与其他人工智能一起训练人工智能,使用scale.ai等网站,以及使用算法。我们没有另一个人工智能来训练,我们不想花钱,因为我们想在比赛中有所作为。因此,我们搜索了算法,但问题是一样的,过程是基于人力的。之所以会出现此问题,是因为应该为每个图像定义新的阈值。出于这个原因,我不得不限制门槛。
该方法
可以从图像、颜色和形状获取两种类型的数据。每个人都有自己的问题。例如,形状算法无法找到脸部或汽车等大多数对象,因为它们是其他元素的总和。如果车只有车身和轮胎,我们就叫它“车”。由于大多数物体都是推理结果,形状算法找不到结果。它逐一找出所有的推论。有时,它也会发现一些人造的表情,比如天际线。因此,新的方法应该基于颜色,但大多数情况下,图像在所需颜色中具有不需要的像素。
在A1中,建筑物和出租车具有相同的调色板,因此这是颜色算法的两个相同对象。因此,我应该去掉那些多余的颜色。
步骤
海绵测试
海绵测试是对我在图像中所做的物理描述。想象一下,一块海绵上只有一个红点。如果你挤压那块海绵,海绵上的红色就会消失。总而言之,这种物理应用提供了主色,这为用主色重建对象提供了机会。
Kimage:表示经过海绵测试的图像中分割出的矩形个数。
Kxcolor:表示特定矩形的主色。
在开始时,我将Kimage修复为1024,但在低质量图像中,Kimage不起作用。因此,我将Kimage固定为图像的x长度。但是,有些图像对于等长矩形并不方便。因此,一些矩形重叠在每个矩形上。因此,为了去掉这些矩形,需要对图像进行模糊处理。
所有的图像都有相同的阈值!
总而言之,
该方法为快速训练目标检测人工智能提供了机会。然而,由于算法的通用性,它并不能精确地标注所有的图像。
原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2021/07/16/memuconvert/