使用修改后的数据进行培训,例如使用10倍以上的数据
如何训练你的VIT?视觉变形中的数据、增强和正则化sarxiv论文摘要https://arxiv.org/abs/2106.10270arXiv pdf论文https://arxiv.org/pdf/2106.10270.pdfGoogle代码https://github.com/google-research/vision_transformerPyTorch代码https://github.com/rwightman/pytorch-image-modelshttps://arxiv.org/abs/2106.10270 https://arxiv.org/pdf/2106.10270.pdf https://github.com/google-research/vision_transformer https://github.com/rwightman/pytorch-image-models
为了帮助增强功能,Augly https://github.com/facebookresearch/AugLy提供了上百种图像、视频、文本和音频增强功能。它们还包括表情符号、字体和屏幕截图模板,以帮助增强功能。https://github.com/facebookresearch/AugLy
视觉变换器(VIT)已被证明在图像分类、目标检测和语义图像分割等广泛的视觉应用中具有很高的好胜性能。
为了更好地理解培训数据量、AugREG、模型大小和计算预算之间的相互作用,进行了实证研究。
欧元?发现增加的计算和AugREG的组合可以产生与在更多的训练数据数量级上训练的模型相同的性能:我们在公共ImageNet-21k数据集上训练各种大小的VIT模型,这些模型或者匹配或超过在更大的,但不是公开可用的JFT-300M数据集上训练的同行。
随时了解最新情况。使用我的其他帖子按类别https://morrislee1234.wixsite.com/website/contactWeb订阅我的帖子https://morrislee1234.wixsite.com/website站点https://morrislee1234.wixsite.com/website/contact https://morrislee1234.wixsite.com/website
领英https://www.linkedin.com/in/morris-lee-47877b7bhttps://www.linkedin.com/in/morris-lee-47877b7b
原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2021/06/22/%e4%bd%bf%e7%94%a8%e4%bf%ae%e6%94%b9%e5%90%8e%e7%9a%84%e6%95%b0%e6%8d%ae%e8%bf%9b%e8%a1%8c%e5%9f%b9%e8%ae%ad%ef%bc%8c%e4%be%8b%e5%a6%82%e4%bd%bf%e7%94%a810%e5%80%8d%e4%bb%a5%e4%b8%8a%e7%9a%84%e6%95%b0/