乳腺癌早期检测的示例业务提案,包括定义业务目标、成功度量、数据收集、模型选择和最终部署模型。
业务目标
一个商业问题
在巴基斯坦,由于社会因素和放射科医生的可获得性,检测乳腺癌变得越来越困难,即使这样,这一过程也需要专注和时间,如果你正处于大流行期间,这是一种奢侈。放射科医生拍一张乳房X光片,然后用肉眼检测肿瘤或癌症,这有时可能很困难,如果你处于压力之下,错误率会相当高。
在1000名妇女中,大约有100名被召回进行额外的诊断成像,在这100名妇女中,有4到5名被诊断为乳腺癌(nih.gov)(见图1)。这些假阳性检查会导致可预防的伤害,包括患者焦虑、良性活检和不必要的干预或治疗。此外,高假阳性率大大增加了每年78亿美元的乳房X光检查费用(oup.com)。这些问题可以通过新兴的基于人工智能(AI)的计算机视觉技术来解决,这将降低假阳性预测率,提高放射科的效率。(nih.gov) (oup.com)
业务解决方案是通过使检测部分平滑来提高放射科医生的效率,以便他们能够专注于提供准确和快速的结果。
产品的业务案例
这款产品将提高患者的满意度,因为他们不必等待2天就能拿到报告,即使这样,报告也足够准确,他们不必再去做另一次乳房X光检查。这将直接或间接地通过客户满意度增加客户的信任,并增加医疗实验室和医院的收入。机器学习将减少处理图像的时间,并预测图像的良、恶性。哪些是肉眼很难察觉的呢?这款产品将帮助医生确定患者是否需要立即手术或需要化疗。
AI/ML模型
这可以通过使用深度学习计算机视觉(Deep Learning Computer Vision)来实现,我们将根据乳房、癌症患者和非癌症患者的X射线图像来训练我们的模型。机器学习模型的引入将改善各医院放射科的工作表现,这将直接改善不断工作的放射科医生的生活。
成功指标
成功的衡量标准将通过监测放射科收入的增长和客户满意度来衡量。客户包括放射科医生、患者和肿瘤学家。成功度量也可以通过放射科医生或肿瘤科医生给出的评级来衡量。我们希望提高癌症检测的准确性,减少观察乳房X光检查的时间,这将间接帮助肿瘤学家更快地做出决定,即使在大流行爆发的情况下也是如此。
数据
数据中的大小和潜在偏差
最初,我们将获得500张乳房X光照片,并将其贴上标签,要么是内部的,要么是聘请第三方的。我们将使用Appen来监控和改进图像标签。首先,我们将只选择两个类别。无论有没有癌症,我们都会使它们保持平衡,以避免有偏见的预测。Appen
数据将如何获取?
我们将收集医院的一些图像以及公开提供的数据集和睡觉,我们将购买这些数据或与不同的医院签署谅解备忘录,这样我们就可以很容易地从现实世界获得新的数据集,作为回报,我们将以折扣率提供服务。
数据标签
最初,我们将保持简单,只有两个类别,随着时间的推移,我们将添加到六个类别。我们还计划增加良性、恶性和未知三个子类别。部署和维护两类数据集将变得很容易,二进制任务的模型性能也会提高。这个简单的解决方案需要放射学家或肿瘤学家再次检查照片,以确定癌症的类型,然后确定它是良性的还是恶性的。
型号
将如何建立模型?
出于隐私和数据敏感性的考虑,我们希望将模型保持私有,并在内部进行培训,但由于资源不足,我们将被迫在初始阶段使用云服务。我们将在云上训练我们的模型,并在云上创建推理。这将帮助我们推出最低限度的可行产品,但在第二阶段,我们希望将模型和数据集从云迁移到本地。我们将在各种更高层的模型(如CNN和RNN)上训练数据集,然后对它们进行集成以获得最好的结果。这个过程是迭代的,而且随着时间的推移,我们将不断更新我们的模型。
ML指标
在癌症检测中,召回率和精确度是我们希望通过监测F1分数来改善并随后提高整体有效性的最重要的指标。精确度将用于营销目的,但对于车型性能,我们将坚持召回和F1得分。要了解有关指标的更多信息,请单击此处。here
最低可行产品(MVP)
用户界面
初始界面构建在云上,具有简单的界面。首先,它会要求你添加一张乳房X光照片的图像,然后它会对图像进行处理,几秒钟后,它会给你这个图像是否含有癌症的结果。它还会给出置信度分数和处理时间。
用户类型
界面将是最好的用户友好界面,它几乎与他们在医疗专业中习惯的UI相似。我们将在开始时保持简单,这样他们就不需要接受培训或查阅用户手册。
构建并发布产品
我们将从小规模开始训练两个类别的模型,并通过预处理和模型选择来提高我们的F1分数。起初,这将在Google云上完成,但随着时间的推移,整个过程将转移到本地基地。在每个结果的最后,UI会要求用户对我们的结果进行评级,以及我们获得结果的速度。这将帮助我们确定成功指标。总体而言,整个产品将在云服务上推出,用户要么可以连接数据库,要么可以单独上传图片。
MVP后-部署
从长远来看,改进产品
- 我们将监控模型性能指标,并尝试通过在新的一批映像上对其进行训练来改进。
- 我们将监控我们产品的成功指标和客户评论,为他们提供更好的界面和产品性能。
- 我们将增加更多种类的癌症,并进一步增加良性或恶性癌症。
- 我们将继续改进界面,这样只需点击几下就能得到医生想要的结果。
- 我们也会随着时间的推移提高图像处理的质量,给我们更好的结果。
- 主动学习将是这一产品的主要部分,因为我们将从患者那里获得新的数据。
- 我们将通过在循环中添加人类(如放射科医生或肿瘤学家)来提高未知类别的模型性能。
监测偏差
为了减轻偏见,我们将从不同的医院收集数据,并努力保持我们的数据库平衡。这将在主动学习的情况下完成,因此我们的产品可以准确地预测一种新的肿瘤类型。我们还将派一名人员在循环中监控我们产品的性能,很可能是内部肿瘤学家,他将监控未知类别并尝试标记数据以提高性能。
动机
在巴基斯坦,我们有多家人工智能领域的初创公司,特别是在XYLEXA等医疗领域,他们正在使用计算机视觉(如CADx)制造产品,这些产品可以93%的准确率检测乳腺癌。这些初创公司需要指导方针才能进入主流市场并开始销售产品。XYLEXA
其次,巴基斯坦面临着生物医学工作人员和认证放射科医生的短缺,这在大流行期间变得最严重。当找到合格的员工时,他们往往会因为“人才外流”而迷失方向。人才外流是指受过教育的工人从他们的发展中国家(nih.gov)移民。(nih.gov)
结论
人工智能正在迅速允许发展中国家解决卫生、能源、农业和金融服务等关键领域的紧迫挑战(worldbank.org)。特别是在巴基斯坦,医疗保健行业需要人工智能技术来提高诊断疾病的效率,并提供更快的结果,以便专家能够迅速采取行动拯救患者的生命。我们已经介绍了人工智能产品的商业计划样本,它为我们如何在任何公司引入新产品提供了一个清晰的视角。业务目标包括建议解决方案的业务收益、数据收集和AI模型选择。然后,我们讨论了成功度量和数据收集方法。最后,我们将重点放在模型选择、训练,然后将其部署为具有简单用户界面的最低可行产品。我们还提供了明确的方向,说明我们将如何为部署后版本维护和改进我们的AI应用程序。 (worldbank.org)
我希望这篇文章已经帮助你将人工智能应用的想法转化为现实。
原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2021/07/08/ai%e4%ba%a7%e5%93%81%e5%95%86%e4%b8%9a%e8%ae%a1%e5%88%92%e4%b9%a6%ef%bc%9a%e4%b9%b3%e8%85%ba%e7%99%8c%e7%9a%84%e6%97%a9%e6%9c%9f%e5%8f%91%e7%8e%b0/