ICCV 2019 | 用于提高车牌识别的单幅噪声图像去噪和校正
精品文章,第一时间送达

作者:BBuf(北京鼎汉技术有限公司 算法工程师(CV))
编辑:唐里
转载自:AI科技评论,未经允许不得二次转载

下面要介绍的论文始发于ICCV2019,题为「SNIDER: Single Noisy Image Denoising and Rectification for Improving License Plate Recognition」,axriv地址:https://arxiv.org/pdf/1910.03876 。

和校正网络
。2)辅助任务预测网络包括文本计数分类网络
和分割网络
。3)用于文本检测和分类的网络LPR。整个框架可以用Figure2来表示。

通过旋转不同的角度可以产生四张训练图像,其中
用于
,
用于
,
用于
,c用于
,
,主任务的
和
网络从输入图像
恢复为高质量图像。然后,LPR网络获取
进行文本检测和识别。
输入到
网络产生去噪后的结果。给定一对输入图像和未校正的去噪标签图像
,
的损失函数是逐像素的MSE损失,如等式(1)所示:
是去噪网络的参数。这种损失函数让网络不仅能提取输入图像语义信息也能生成像素级的高质量图像。然后校正网络
从
的输出开始处理,产生校正后的高质量图像,以更有利于LPR网络进行文本识别。训练图像对用
表示,
网络使用L1损失函数,如等式(2)所示:
和
可以捕获鲁棒的特征来进行图像恢复,但是这种结构的结果并不能总是保证有良好的图像质量提升输出。因此,我们使用了两个辅助任务,即二值分割和计数估计,这将有助于我们的主任务网络产生更具区分性的代表特征。针对这个问题,我们将编码器最后一层的权值相加,以指导辅助任务网络更有效地从低质量图像中提取关键信息。
。
的细节如Table1所示:
接收主任务编码器求和后的特征集F并输出车牌分割结果,每个像素位置的值代表该像素值属于车牌区域的概率。此外,用于分割的标签样本可以使用论文[4]中的OTSU算法得到,如Figure3所示。虽然[4]中的分割注释不能完全反映图像的实际细节,但我们的实验表明,这种辅助学习的策略在图像恢复方面取得了有效的进展。给定F和语义分割标签
,

代表
是否属于车牌区域。
来预测图像中字符的个数。因此,我们的
扮演两个角色,第一个是使得相邻字符之间的分割更加清晰,另外一个角色是促进每个主任务的编码器产生更高质量的图像。
的损失函数为L2损失,如公式(4)所示:
是预测值,
是标签。




长按扫码,关注我们你与世界只差一个
磐创AI
点击阅读原文,获得更多精彩内容
原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2019/11/09/0720a40c23/

