我们都做过。部署一个模型只是为了让它在一些模糊的情况下失败，并将其视为最初不太可能发生的边缘情况而不屑一顾，并声称成功，因为它很快就被训练出了模型。问题解决了吗？还没那么快。

人工智能正在以令人眼花缭乱的速度重组我们的世界。许多创新绝对是了不起的，但当我们将人工智能的限制视为仅仅是边缘情况时，我们是在自食其果。这种对边缘案例的忽视和未能承认边缘案例的真实性质和规模，将我们采用人工智能的步伐置于危险之中，从而危及整个行业。与其将这些限制斥为边缘案例，我们需要承认它们的真实性质，这样我们才能努力真正解决问题。

边缘情况是在实践中很少发生的情况，我们经常报告说，一旦解决了，这种情况不太可能再次发生。有时情况如此模糊，以至于我们会加倍声明，甚至有些人可能已经糊涂到做出了错误的决定。

事实是，边缘案例的数量是无限的。这是一个非常真实的案例，在世界各地，人工智能系统每天都会遇到边缘案例，这是一个很可能不太可能的情况。这些边缘情况形成了人工智能模型必须处理的非常长的情况尾巴，特别是当我们开始将它们部署到任务关键型系统时。probable improbable

此外，虽然即使是一些人类也可能会被边缘情况搞糊涂，但大多数人不会感到困惑，那些边缘情况下的人通常会比人工智能更优雅地处理念力。相反，当人工智能被边缘情况混淆时，所有的人工智能都会被混淆，就像自动驾驶汽车的情况一样。

传统精度度量的局限性

边缘情况的问题被放大了，因为我们不能使用传统的精度度量来预测部署过程中的模型性能。即使正确地处理了坚持数据集和指标，如召回率、精确度和F1得分，这样的验证也不能很好地从实验室转化到遇到边缘情况的现实世界。事实上，仅有准确性指标已经不足以部署值得信赖的人工智能。

所需要的是能够预测AI模型在不可预测的边缘情况下的行为的健壮性度量。这些健壮性度量可以通过每次模型迭代进行跟踪，并用于更好地为部署新候选模型的决策提供信息。这有助于避免新模型更精确，但在边缘情况下更容易失效的情况。健壮性度量还可以洞察问题类别并识别模型故障偏差，这两者都可以用来更好地将模型调整到更良性的故障情况，从而降低总体风险。

随着我们希望将人工智能部署到关键任务系统，将人工智能的限制视为边缘情况或忽视模型的健壮性和安全性不再是可接受的。我们已经看到了忽视值得信赖的人工智能的法规和重大处罚。从责任的角度来看，我们都需要准备好回答这样的问题，比如我们的模型可能会出什么问题，我们已经采取了哪些步骤来降低风险。如果做不到这一点，将导致采用率下降，令人惊叹的创新停滞不前。拥抱变幻莫测的事物是令人兴奋的。你只是永远不知道你会看到什么。

原创文章，作者：fendouai，如若转载，请注明出处：https://panchuang.net/2021/07/31/%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e8%be%b9%e7%bc%98%e6%a1%88%e4%be%8b%e7%9a%84%e5%8d%b1%e9%99%a9%e9%a9%b3%e5%9b%9e/

人工智能边缘案例的危险驳回

传统精度度量的局限性

联系我们

400-800-8888

人工智能边缘案例的危险驳回

传统精度度量的局限性

相关推荐

请登录

联系我们

400-800-8888