人工智能正在通过语言翻译、人脸识别、目标检测等许多领域改变世界。这些人工智能系统通常属于广泛的类别,具有世界性的市场需求,因此吸引了密集的研究。许多人可能不知道的是,我们可以利用深度学习的成果来创建定制的人工智能服务,这些服务是为适合个人而定制的。
这篇媒体文章,以及相应的GitHub项目,展示了我们如何借助已建立的对象识别神经网络的成功来创建个性化警报系统。这个项目展示了预先训练的神经网络如何检测到感兴趣的物体何时改变状态-在这种情况下,何时大门打开,或者何时躺椅的腿睡觉折叠下来。GitHub project
图像的神经网络
VGG-19是牛津大学视觉几何组预先训练的图像识别神经网络。这种神经网络因其简单的体系结构和在解析图像特征方面的成功而在各种任务中广受欢迎。它由16个卷积层组成,它们解释图像的低级属性,然后是三个完全相连的层,它们试图确定哪个对象在图片中。VGG-19 Visual Geometry Group
因为我们在寻找跨图像的简单变化,所以我们需要评估图像的特征,而不是评估图片中的哪个对象。这意味着我们可以剥离最后三层-通常被称为神经网络的“顶层”-并捕获每幅图像的最后一层卷积层的输出。这称为特征提取。
然后,我们将使用距离度量来确定图像偏离其基线状态的程度。我们可以使用几种距离度量来比较图像,但余弦相似度是一个很好的起点。VGG-19型号使用RELU激活功能,这意味着许多功能号码的值为零。因此,最基本的距离度量,欧几里得距离,可能不会给出很好的结果,而余弦相似度通常用于稀疏矩阵。cosine similarity ReLU activation function might not give good results
为了检测物体中的运动,我们将通过预先训练的VGG-19神经网络运行一组图像,并从卷积层提取特征的数值向量。通过将图像与基线进行比较,我们可以知道何时(A)对象正在移动到新位置,或(B)其他因素干扰了结果,例如日光变化或另一个对象通过图像移动。
TensorFlow+Python
本项目使用TensorFlow和Python对示例图像进行评估,代码位于此GitHub存储库。特征提取的实践是如此重要,以至于TensorFlow的KERAS功能使得导入卷积神经网络(如VGG-19、Inception或ResNet)变得非常容易。this GitHub repository VGG-19 Inception ResNet
François Chollet已经公布了几个预先训练的神经网络的参数文件。这些权重文件包括下载它们的选项,而没有前面提到的完全连接层的“顶部”。这是因为卷积层在使用参数方面比完全连接的层效率高得多。在这种情况下,排除VGG-19型号的顶部会将文件大小从548 MB减少到76 MB。several pretrained neural networks
后院大门
许多人会发现当后院大门打开时得到通知是很有用的,因为这可能意味着孩子或狗可以离开院子。我们的第一个示例由9个图像组成,其中一个门从关闭位置移动到完全打开位置,并且白天和夜间有不同的图像。
第一张图片是关闭的大门的图片。这是基线图像,其他图像通过它们与第一张图片的余弦相似度进行评估。在理想情况下,当门打开时,这些余弦度量应该离参考图像更远。
还有两个不相关的图像充当健全性检查-这些图片的结果应该与基线图像相差甚远。这些不同的图像也可以用作其他任务的控件。例如,图像处理流水线经常将图像从红-绿-蓝切换为蓝-绿-红,反之亦然,必须小心确保将正确的格式传递给神经网络。当根据文档管理颜色通道时,这些无关图像的结果确实略好一些。
图1中的第一个图表显示,当白天和夜间图像组合在一起时,结果有点混乱。这意味着每个环境都需要基线图像,或者需要一些图像处理来针对不同的条件进行调整。当分别评估日间和夜间图像时,随后的两个图表显示更稳定的结果。
这些类型的图像可以由现有的家庭摄像头捕捉到,当大门打开或其他东西干扰结果时,例如有人走过该区域,对大门的持续评估可能会触发通知。
躺椅
许多沙发和沙发都有一个可以上下摆动的腿睡觉,这需要小心,因为当有人把腿睡觉向下移动时,可能会有孩子或宠物在下面。许多边缘设备的摄像头都有寻呼器、警报器、聚光灯或扬声器,可以用来提醒人们在完全缩回腿睡觉之前检查沙发下面。
我们的第二个示例由七张睡觉腿在白天折叠的图片、另外七张在晚上折叠的图片和两张无关的图片组成。第一张图片是沙发腿睡觉完全伸展。这是基线图像,其他图像通过它们与该参考图片的相似性进行评估。
图2中的第一个图表显示,与GATE的情况一样,当白天和夜间图像组合在一起时,结果就不那么清晰了。其他两个图表显示,随着腿睡觉旋转到向下位置,相似性度量距离基线图像更远。同样,当单独评估不同的条件时,结果会变得更有用。
个性化深度学习
这个GitHub项目展示了个性化人工智能系统的开端,尽管还需要做更多的工作来解决环境变化、相机角度中断等问题。这些结果暗示了像神经网络特征提取这样的实践如何使用成功的人工智能系统的构建块来实现一小群人-或者可能只是世界上一个人-所追求的目标。
原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2021/07/23/%e5%b0%86%e4%b8%aa%e6%80%a7%e5%8c%96%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%e7%bc%96%e7%bb%87%e8%bf%9b%e6%97%a5%e5%b8%b8%e7%94%9f%e6%b4%bb/