这项研究表明,仅凭合成数据就可以训练一个健壮的目标检测算法,并以真实世界的数据为基准。This study
他们把重点放在合成数据的价值上,以帮助计算机视觉算法自动检测卫星图像中的飞机及其属性。synthetic data
在对真实数据集和合成数据集进行了广泛的实验评估和性能比较之后,研究证明了合成数据单独和结合少量真实数据样本是有效的。对我们来说,最有趣的是,当添加一小部分真实数据来微调使用合成数据集训练的模型时,他们观察到MAP获得了显著的收益,导致性能与仅在真实数据集上训练的模型持平。
微调仅用10%的观测数据训练的合成数据上的模型获得了与100%观测数据集上训练大致相同的结果。这种方法可以省去90%的人工标记和收集工作。如果你仔细想想,这是一个相当大的成本削减,因为从卫星角度获得飞机的真实图像并不容易,也不便宜。但不仅如此,想想你还能节省多少时间。
不仅收集真实世界的数据绝对是耗时的,而且注释数据是一项巨大的工作,通常是手动的,当数据量达到训练机器学习模型所需的水平时,很容易出错。另一方面,合成数据价格低廉,易于生成,并且会自动使用适合不同用例的不同类型的基础事实数据进行注释。use cases
在目标检测方面,合成数据可以和真实数据一样执行吗?
这项研究表明,合成数据可以充分减少对真实数据的依赖,真实数据速度慢、成本高,而且通常很难获得。这为计算机视觉技术在各行各业更快、更多地采用提供了机会。synthetic data
还需要考虑的是,现实世界数据的可变性通常仅限于您可以直接收集的数据。这会使您的模型产生偏差,因为您无法在培训时提供足够多样化的条件和场景。使用合成数据,您可以控制生成的数据,确保覆盖所有用例需求,并避免模型中的偏差。
我们坚信,这些将合成数据与少量真实数据相结合的实验及其结果可以应用于其他用例。你认为如何?use cases
睡觉保证,当我们找到更多支持这一假设的证据时,我们会让你知道的。
来源:RarePlanes:合成数据在arxiv.org上起飞RarePlanes: Synthetic Data Takes Flight on arXiv.org
关于AnyVerse™
AnyVerse™可帮助您持续改进深度学习感知模型,以缩短系统应用新软件2.0流程的上市时间。我们的合成数据生产平台使我们能够提供高保真、准确和平衡的数据集。伴随着数据驱动的迭代过程,我们可以帮助您达到所需的模型性能。
使用AnyVerse™,您可以准确地模拟任何相机传感器,并帮助您决定哪一个将在您的感知系统中表现得更好。多亏了我们最先进的测光管道,不再需要使用真实设备进行复杂和昂贵的实验。Anyverse™ simulate any camera sensor
想知道更多吗?
请随时访问我们的网站anyverse.ai,并在社交媒体上关注我们。anyverse.ai
原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2021/10/13/%e5%90%88%e6%88%90%e6%95%b0%e6%8d%ae%e5%8d%95%e7%8b%ac%e8%83%bd%e8%ae%ad%e7%bb%83%e5%87%ba%e5%81%a5%e5%a3%ae%e7%9a%84%e7%9b%ae%e6%a0%87%e6%a3%80%e6%b5%8b%e7%ae%97%e6%b3%95%e5%90%97%ef%bc%9f-2/