1. 磐创AI-开放猫官方网站首页
  2. Medium

如何选择最优的图像大小来训练卷积神经网络?

为什么?

在我们跳到“如何”这一部分之前,让我们先讨论一下选择错误尺码的负面后果。在我们选择了固定的宽度和高度之后,标准程序是将所有图像的大小调整到这个固定的大小。因此,现在每个图像都落入两个桶中的一个桶中。

  • 缩小:较大的图像将被缩小,这使得CNN更难了解分类或检测所需的特征,因为关键特征所在的像素数量将显著减少。
  • 放大:当小图像被放大并用零填充时,NN必须知道填充部分对分类没有影响。较大的图像训练速度也较慢,可能需要更多VRAM。

因此,我们必须选择自己的毒药,我们越接近最佳图像大小,效果就越好。

最佳图像大小

我们都知道,选择合适的大小取决于数据集,但问题是如何做到这一点?将图像大小可视化。

数据集:牛津-IIIT宠物数据集The Oxford-IIIT Pet Dataset

该数据集有7000多张大小和分辨率各不相同的图像。

从第一张图看,大多数图像的分辨率都低于500乘以500。放大后,我们可以清楚地看到图像聚集在300或500大小附近。对于此数据集,我的建议是开始训练图像大小为300的神经网络,然后逐渐将其增加到400,并在大小为500的情况下完成训练。这样,对于不同的图像分辨率,该模型都具有较好的泛化能力。

奖金

  • 错误标记的数据:可能会混淆模型。
  • 某些类图像的分辨率很高或很低:可能会使模型产生偏差。

2.检查后,如果我们认为需要删除某些数据点,则使用Lasso Selector来实现。Lasso Selector

原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2021/06/24/%e5%a6%82%e4%bd%95%e9%80%89%e6%8b%a9%e6%9c%80%e4%bc%98%e7%9a%84%e5%9b%be%e5%83%8f%e5%a4%a7%e5%b0%8f%e6%9d%a5%e8%ae%ad%e7%bb%83%e5%8d%b7%e7%a7%af%e7%a5%9e%e7%bb%8f%e7%bd%91%e7%bb%9c%ef%bc%9f/

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息