1. 磐创AI-开放猫官方网站首页
  2. Medium

用直观的视觉理解人工智能:手写数字的计算机视觉

(我们感谢Zetane的Mayah Schipper为本文所做的有益贡献。)

奇怪的机器人形象,尤其是那些挥舞着武器的形象,已经受够了。这种常见的、耸人听闻的、往往是负面的人工智能陈述不仅不准确,还阻碍了我们教育决策者和公众了解这种已经影响我们日常生活的颠覆性技术的重要和基本组成部分的能力。为了让社会获得全部好处并避免创新固有的风险,更好地理解人工智能实际上是什么,是能够处理复杂统计数据的复杂软件,这符合我们所有人的最佳利益。

Zetane的两位联合创始人Jon Magoon和Guillaume Hervé,有机会在蒙特利尔新技术公司主办的创新者现场秀上展示了人工智能作为嘉宾实际是什么样子的具体例子。这一系列针对蒙特利尔科技企业家和初创企业的讨论系列,接待了当地的创新者,他们正在将创新的界限推向极致。在这里,我们向非专家展示计算机视觉模型的基本组成部分,它可以识别手写数字;例如,这是使我们能够使用手机兑现支票的基本技术。在这里,我们将向非专家展示能够识别手写数字的计算机视觉模型的基本组件;例如,这是使我们能够使用手机兑现支票的基础技术。讨论还涉及到我们作为加拿大蓬勃发展的技术部门的一家成长型企业的创业之旅。The Innovators Live Show Montreal New Tech

请参阅此视频中的讨论,或者您可以仔细阅读下面的对话记录。

采访记录(稍加修改)

丹尼斯0:15当我们说人工智能时,你会想到什么?现在我试着想象一下人工智能本身到底是什么样子。如果我们把目光投向代码之外,试着想象人工智能是如何工作的,尤尼斯,脑海中会浮现出什么呢?

Eunice 0:27一张非常技术性的图片,就像一堆相互交互并链接不同数据库的代码。

丹尼斯0:34是的,这对我来说听起来差不多-对一些非常空想的东西,也许是坐在电脑后面的一个程序员。我个人,你知道,我没有人工智能背景。所以,对我来说,这是一个非常神秘的东西–“黑匣子”。因此,我想欢迎我们所有的嘉宾,所有的与会者,来到由蒙特利尔新技术公司提供动力的创新者。这是一个关于人、公司和组织的节目,他们正在通过创新的想法、技术和科学改变世界。

尤尼斯1:02我们是你们的东道主:尤尼斯和丹尼斯·卢希辛。在“创新者”的最后一集,我们一头扎进围绕人工智能的伦理和炒作中。今天,我们想要在那次对话的基础上,看看人工智能,但要通过一个不同的镜头。今天,我们想要做的是与两位有远见卓识的人交谈,他们阐述了如何让人工智能更容易获得、更民主、更有影响力,特别是对于那些不是程序员,但实际上可以看到人工智能的价值和潜力的人。

丹尼斯1分39秒太棒了太感谢你了,尤尼斯。所以,请您看到,在您的屏幕底部有一个小图标。点击这一点,给我们令人惊叹的嘉宾热烈的掌声,欢迎来到纪尧姆·埃尔韦和乔恩·马贡的银幕。泽坦系统公司的三位联合创始人中有两位是在我们蒙特利尔的自家后院发展起来的。欢迎,乔恩,纪尧姆;你们今天好吗?Zetane Systems

纪尧姆2:04哦,很好。谢谢。谢谢你邀请我们。

乔恩2:07好的,谢谢你邀请我们。这是我的荣幸。

丹尼斯2:10那么这个月你听到的最令人兴奋的人工智能新闻是什么?

纪尧姆2:16本月最令人兴奋的人工智能新闻,我认为是这样一个事实,就像每个月,我们看到如此多的投资进入人工智能公司。但我们现在看到的与三、四年前不同的是,我认为,人工智能公司更专注于他们给企业带来的东西,以及他们如何影响他们周围的世界。而在三、四年前,这只是在不同的概念上投入大量资金,看看哪些能站得住脚。所以我认为今天的人工智能世界比以前更有‘焦点’,然后就是不太久以前了,真的。

丹尼斯2:51这是个好消息。这是一个发展非常迅速的行业。所以很高兴看到事情正在取得进展。你那边有什么发现吗,乔恩?

Jon 3:01是的,只是,我的意思是,人工智能领域一直在进行着如此多的研究,看到了一些能够实现某种最先进结果的新模型,但是使用了各种不同的架构。因此,变形金刚,然后是同样使用类似机制的新型号,都有变形金刚的名字叫“注意”。它的表现与谷歌上个月发布的具有最先进图像识别能力的大型型号一样好。看到这个领域是如何发展的,这是非常令人着迷的。

丹尼斯3分34秒非常酷。

[章节已编辑。讨论是关于与观众建立一个游戏。]

尤尼斯4:51当观众和我们一起分享这一动态的时候,我想让你快速了解一下今天的节目是谁,因为,纪尧姆,我发现你不仅是一个在加拿大人工智能社区做了如此多工作的组织的成员,而且你也是一本出版的书的作者,你愿意给我们讲讲这件事吗?嗯,

纪尧姆5:17谢谢你问我这个问题。这很有趣,因为它确实引导了我们在泽坦所做的事情。所以我出版了一本关于公司创业的书,书名叫“内部创业”:公司内部的创业精神。它是基于我所做的一些工作;我在公司内部创办了一些初创公司,其中一个更大的初创公司成为了什么是CAE Healthcare,在那里我们采用了试点培训的概念,使用了大量的建模和模拟,并将技术诀窍和技术移植到了医疗保健世界。因此,在公司内部做了几次创业之后,我最终不仅推出了这本书,而且这本书让我成为了TechStars,以及蒙特利尔这里的创始人燃料和第三区,以及其他几个地方的导师。所以这是一次激动人心的旅行,当我开始的时候,它没有目的地。但就像所有的旅行一样,你知道,他们很迷人。

尤妮斯6:12,这些是更令人兴奋的。非常令人印象深刻。谢谢。乔恩,我只有一个简短的问题:你在路易斯安那州完成了学业。

约6:21好的。

尤妮斯6:22在所有你可能去的地方中,你怎么会在蒙特利尔开了一家公司?

约6:31是的,嗯,你知道,我的背景是哲学,不是软件开发。所以我是一个自学成才的软件工程师,我是一个自学成才的人工智能和ML开发人员,我见过帕特里克,这是一个很长的故事。所以我不会说太多。但我们都热衷于让人们更容易接触到这种复杂的领域。你知道,我的背景是学习在线学习,通过教科书自学。所以,你知道,人工智能和机器学习,这是复杂的,但它绝对可以理解的,可以更多的人接触到的想法,对我们所有人都很有吸引力。我认为我们都有同样的教学背景,帕特里克是一名教授,你知道,纪尧姆已经提到了他的导师和他的写作。因此,这绝对是我们大家都有联系的事情,我们都有兴趣进一步发展。

[章节已编辑。讨论是关于与观众的一场游戏。]

丹尼斯11:20好的,让我们进入真正的入口。因为我有很多东西要复习。反正时间已经过得很快了。那我们就直奔主题吧。所以我们今天让你们来这里的原因是要谈谈泽坦和泽坦发动机。所以你已经开发了一些东西,一些非常非常酷的东西。所以你们能用外行的话给我们解释一下吗,因为这也是你们所做的全部核心工作,就是让人工智能变得容易理解。告诉我们你在研发什么?你的创新是什么?

纪尧姆11:51当然,我可以首发,当然,乔纳森也可以首发。你知道,我想最好的例子是当我问别人“你是医生吗?”,就像丹尼斯:你是医生吗?

丹尼斯12:01不是

纪尧姆12:02号好吧。你有没有看过核磁共振、X光或扫描?

丹尼斯12:07我这辈子可能看过一两次X光片。显然,也许是在电视上。

不知名的发言人12:12好的,很公平。尤妮斯,你自己,如果你看过这些类型的图片的话?你不是医生,我也不是,但MRI或X光的美妙之处在于,它给从事医学研究的人提供了令人难以置信的信息和洞察力,帮助他们开发新的治疗方法和治疗疾病的新方法。但同样的图像让你和我能够理解,你知道,什么是坏的,什么是不起作用的。然而,我们不需要医学学位,也不需要理疗师来治疗你的手臂骨折或扭伤。所以在泽坦,这就是我们想要做的,我们说的是人工智能不应该完全掌握在数据科学家和机器学习工程师手中,因为如果是这样的话,它永远不会真正成长为一个完整的领域,影响着我们周围的世界。如果你不像核磁共振和扫描那样让人理解,那么你也可以追究那些给你提供解决方案的人的责任,对吗?因为你不能说,“嗯,你知道,当你解释你认为人工智能是什么的时候,你离得不远,你们两个都很亲近。但我们得到的下一个常见问题是,“但我们怎么知道它起作用了呢?”我们怎么知道它工作正常?我们怎么知道这不是有偏见的呢?我们怎么知道它什么时候不管用。因此,我们在泽坦所做的,我们说,我们需要利用这套复杂的算法,[Python]库和代码,并使它们可视化,这样不仅仅是专家可以用他们拥有的东西走得更远。但非专家可以参与,特别是在工业中,来验证它是否会起作用,它将接受测试,它将解决任何它必须解决的问题,它可以得到信任和解释。这就是问题所在,这就是我们开发的软件。

尤尼斯13:57我喜欢你的描述,因为归根结底,这也是关于挪用的,对于一个非常技术性的问题,有合适的解决方案是可以的。但最终,在解决方案的实施中,你真的需要在完成时获得一定程度的拨款,这实际上会让生活变得更容易。所以说到目前为止我们所知道的是,对于很多人来说,AI感觉就像一个“神秘的黑匣子”:你拿一些数据,一些代码,然后证明结果是一台可以帮助你解决问题的机器。这基本上是对这项业务的普遍理解。所以作为一个没有人工智能背景的人,我理解它的价值,它的价值,但不一定是技术的应用。我同意你们的观点,这不应该成为将人们排除在讨论之外的标准。所以我认为这是一种脱节。那么,你如何帮助像我这样的人在没有真正的AI背景或不成为AI专家的情况下看到真正的潜力,并理解这些技术的应用。

乔恩15:07:是的。所以我想你提到了一种对人工智能是什么的看法。而且,你知道,我认为人们认为人工智能是“聪明的”甚至“危险的”,对吧。几乎是天网意义上的。我是说,我们之前提到过终结者,对吧?但问题是,模特实际上是相当愚蠢的。一般来说,他们非常-他们专注于一个非常具体的用例。而且他们非常-他们能做的事情非常有限。所以你知道,老实说,这种误解导致了很多挑战,因为当我们谈论,你知道,将一个模型投入生产或理解它时,我们实际上,我们需要理解的是它实际能做什么。以及它不能做什么。它不能做的是一个非常重要的部分,因为这有助于我们建立强大的系统:它帮助我们,你知道,了解它将如何失败,为什么它会失败,以及我们需要采取什么措施来确保我们能够真正将一些东西投入生产并进行部署。所以,你知道,视觉化是其中很大很大的一部分。纪尧姆提到,你知道,在医学领域,你知道,人工智能模型可以预测一些东西,预测患者的结果,你需要-它需要与领域专家和医疗专业人员进行核实。不仅是关于结果,而且是关于它在内部做了什么,以确保它以正确的理由产生正确的结果。因为这两样东西有很大的不同,对吧?它可能会产生一个正确的结果,而这个结果是出于所有错误的内部原因而被训练出来的。这可能是一个更糟糕的问题。因为我们认为人工智能模型工作正常,在做它应该做的事情,但实际上它完全是“脆弱的”。一旦它开始遇到现实世界和未知的情况,它就会完全崩溃。所以,是的。

丹尼斯17:03我想我们已经看到了这一点,我知道我们也谈到了上一集,还有道德,因为这造成了一些差距,对吗?就像你教它你意识到的,你正在看的,或者你给它提供的数据,以及无数的例子,脱轨走向完全相反的方向,这是我们完全没有预见到的。当它很有趣的时候,当我们谈论人工智能的潜在未来时,它最终会做的事情太多了。然后我们教它的东西在某种意义上变得更加自主,从这个意义上说,但这就是我和你们的同事杰森交谈的地方,以及我们在预订你们时进行的预演对话。让人工智能更容易接触和民主化的概念非常、非常有趣。这就是你们用的词:“民主化。”你能告诉我们这是什么意思吗?民主化的人工智能对你来说是什么样子?

纪尧姆17:59在我看来,有两件事。第一,又回到了黑匣子的问题上,对吗?因为如果人们不理解和不信任某事,他们就会害怕。如果你害怕它,你就不会收养它。那么,如何打破这种恐惧循环呢?你让人们理解并解释你试图向他们展示的东西,你知道,他们对此感到舒服。问题是,就像,看看今天我们试图玩的游戏的例子(指的是密文部分)。让我们假设这是一个人工智能算法。不是的,但我们可以说是有的。嗯,今天它不起作用的后果的风险相对较小;你知道,就像,我们笑得很开心,然后,你知道,你会学到的,下一次会有所改善的。但我们假设这是一次医学诊断;我们假设这是一次雇佣某人的面试;假设它一直在监控一辆汽车及其自动驾驶,如果它在高速公路上以每小时120公里的速度行驶,如果它出了故障。风险和后果应该是不同的,对吧?这就是我们所说的人工智能民主化的全部意义所在。我们相信,如果你能让人工智能变得人类可以理解,如果你能做到这一点,你就会把它交到更多的人手中。如果你把它放在更多的人手中,更多的行业会使用它,并把它投入现实世界,就像“我们的世界”一样,我们中更多的人会说“好的,它是安全的。”我明白,所以我会用它。“这与我从那以后开始接触的技术没有什么不同;你知道,在过去的20年里,一开始都是有点停滞不前的,对吧?我记得,你知道,整个模型,你知道…基因组学领域。你知道,因为人们能够解释它,并给它更多的,你知道,概括。这把他们吓坏了,你知道,很多人多年来都被吓跑了。直到人们最终开始意识到,好吧,它可以带来很多好处。对我们来说也是一样:对我们来说,民主化是需要更多的工业人员,而不仅仅是人工智能方面的专家。所以开发人员,技术人员,用户,人工智能的消费者,能够以一种打开黑匣子的方式与它互动,这样他们就可以问所有的问题-乔纳森的例子真的很好。然后说,好的,我现在可以关闭黑匣子了,我会相信未来的黑匣子,因为你已经给我看过这个了。但今天,采用人工智能仍然存在很多阻力,因为我们还没有打开那个黑匣子。你们今天要看的乔恩的演示很不错。我的意思是,他们会向你展示什么是打开,真正打开一个人工智能黑匣子。

丹尼斯20:30,我个人非常期待。你知道,例如,特斯拉和自动驾驶功能百分之百的例子,完全同意你的观点,因为你可以把你的生命献给一台机器,去做人们世世代代甚至几十年来一直在做的事情-想到“好的,我完全相信这个东西会有我自己,我的乘客,其他在路上的人的生命”,特别是看不到你知道,它是如何分析你是什么,它在做什么。你不知道,甚至无法预测它在任何特定时刻可能会做什么。而这正是事实所在–这种信任被打破了。那么,你是如何与人工智能与人类互动的,因为在这一点上,互动肯定是被破坏的?

尤尼斯书21:16我们差不多谈到了这个问题,但是乔恩,你想给我们解释一下吗?你认为什么是重要的?我们理解,在未来,你将在很大程度上依赖人工智能驱动的技术或人工智能驱动的解决方案。但是,为什么你们认为这对你们两个都很重要,决定开始努力,就像,改变话题,开始为人们打开新的选择和新的机会?您从事这项业务的人员、技术和公司是什么?

Jon 21:51是的,我的意思是,我认为,你知道,人工智能和机器学习可以在特定的上下文和特定的用例中做一些真正令人难以置信的事情,对吗?如此巨大的挑战,是因为有太多的炒作。因为有一种,你知道,混合的术语,可能在媒体上,比如,什么是人工智能,什么不是人工智能。在一个组织内,甚至在一个在该领域工作的个人内部建立这种理解真的很重要。你知道,我们实际上在谈论什么,比如,人工智能到底能做什么?还有什么是它实际上不能做的。这是我们能够部署它的唯一方法。因为如果它仅仅是一种泛化的东西,这个黑匣子,或者一种神秘的东西,就不可能取得真正的进展,不仅仅是在研究方面。所以你知道,在可以做的事情上,研究正在继续向前冲刺,每天产生的研究是令人难以置信的。但就行业而言:我的意思是,这项研究进入工业应用、企业应用或小企业,要从所有这些令人难以置信的研究中获得一些实际价值,确实有一段时间的滞后。其中很大一部分原因是这个沟通过程实际上非常具有挑战性。因此,在专家和可能是专家但在他们的业务上的人之间;理解的能力,“好的,这项技术如何才能真正帮助我们而不是伤害我们?”“这项技术如何能真正给我们的组织和客户带来一些价值呢?”这就是真正发展缓慢的部分。这就是我们实际上非常关注的部分。这对我们来说很重要的一点就是带来研究,带来你知道的,无论是尖端还是古老的研究,但任何可以真正帮助一个组织的东西。这对我来说是最重要的部分。这就是我们感兴趣的。

丹尼斯23:45有没有一个例子在你脑海中很突出,你知道,你建立的伙伴关系,你一直在做的工作,真的展示了你与可视化结合在一起的影响,这真的帮助他们突破了下一个层次?

乔恩24:03好的,当然可以。我是说,纪尧姆,你在点头–跳进去吧。我可能在想同一个例子;想着不同的例子…

纪尧姆24:11好的,我告诉你。这真是个好问题。当我们创建Zetane的时候,我们专注于这个软件产品,它已经推出了;人们现在可以去Zetane.com下载它;在它的上面有一个免费的查看器。所以产品还活着,对吧?但我们陷入了公司的困境,他们说,“你能帮助我们完成我们正在努力完成的实际项目吗?”所以我们被带到了那个领域,现在我们做了很多这方面的工作。至少有三个、四个或五个例子表明,我们与人工智能团队合作,他们一直在努力让公司的业务方与决策者一起在内部批准他们的项目,决策者是消耗创新团队产生的人工智能的运营人员。在我们帮助他们把工作转移到泽坦之后。我曾经–就在疫情爆发前–在那里,他们真的拿起笔记本电脑,走到工程副总裁和首席执行官那里–就像那些级别的C-Suite,对吗?-然后说,“我要给你看一些东西。”他们在三四分钟内向他们展示了他们已经工作了几个月的项目的泽坦观点:立即接受,而不是夸张。有一天,就像,我在那里-事情发生了。所以我们开始意识到,就像,这真的很强大,但是人们不知道它的存在,对吗?但是当你可视化一些东西时,你会被告知:这是数据将要通过的方式;这是算法的功能-这个奇特的黑匣子;这是它看起来是什么样子;这就是为什么你可以信任它,因为这些就是我们已经做过的事情;这是它给你的输出的准确性,无论这个推荐是什么。你可以在视觉上做到这一点。如果你能挑战我说,“这没道理:那部分影响太大了,而这部分应该影响更大,”你知道吗?你说,“哦,好的。”接受变成了一种合作,而不是我试图说服你。所以,是的,我可以给你们举几个例子,在计算机视觉方面,这是我们的专长。所以这个字段是一个爆炸性的字段,但在常规的表格数据中也是如此,你知道,就像“我为什么要信任呢?”“嗯,我刚告诉你为什么–挑战我!”如果我不能回答,我会给你们答案,你们今天可以用Python代码、库和一些你们手头都拿不到的东西来做,除非你们是专家。

丹尼斯26:25这听起来就像,你知道,在那个时代,电脑刚刚成为一种东西,你所拥有的只有DOS界面。然后苹果想出了视觉界面和[响指]-应用程序,人们的接受度飙升,因为突然之间,你可以用它来做一些事情,你可以理解用它来做什么,这会产生巨大的不同。

纪尧姆26:45,是的。很好的例子。

尤尼斯26:49你看到了什么应用程序–你希望看到人工智能的哪些革命,成为使用你创建的工具进行开发的一部分?

乔恩26:59所以我们,就像你提到的,我们专攻计算机视觉。计算机视觉是一个我认为在这一点上被采用较少的领域。这是一个非常有趣的领域。这也是一个挑战:我们创造的工具是可视化的,它们帮助理解计算机视觉模型在做什么,计算机视觉模型是如何工作的,特别是围绕计算机视觉模型的挑战和限制。因此,在这个行业工作绝对是我们的一种激情。我们显然-我们也使用自然语言编程、自然语言和表格数据。但我们开发的工具,探索和可视化工具,当我们谈论计算机视觉模型时,它们似乎创造了一种共同语言。这就是我们现在看到的。

丹尼斯27:56,我们快到演示时间了。也许还有足够的时间再问一个问题。我确实想让我们的观众知道,如果你有问题要问乔恩或纪尧姆,一定要把它贴在评论里。很快,我们也会开放麦克风。这样你就可以和我们一起上银幕了。如果你想,你知道,留下评论,说一些具体的事情,你知道,我们一直在讨论的事情,然后直接问我们的客人一个问题。所以一定要注意这一点。它肯定会出现,但在我们进入演示之前,我确实想稍微谈一谈。其中有一件是要祝贺你们的。我知道在2020年底,你们有一些非常重大的消息,资金即将通过。你得到了35万美元用于莱茵金属项目,部分是与魁北克政府的创新部门梅合作。但我也看到你们收到了来自加拿大经济发展署的10万美元,到目前为止,我对此表示热烈的祝贺。这是非常令人兴奋的消息。但我真的很好奇,我想简单地谈一谈,但从政府的角度来看,从促进创新的角度来看,政府这样的投入如何影响你的创新能力和改变这个行业的能力呢?我想说的是,从政府的角度来看,在促进创新方面,政府这样的投入是如何影响你的创新能力和改变这个行业的?然后,你知道,把你的项目和你正在做的事情提升到一个新的水平?

纪尧姆29:20嗯,我听着,你知道,我们已经能够获得大约150万美元的非稀释资金。你提到的一些,还有一些,我们下周将发布一些令人兴奋的新闻稿,关于一家游戏公司,我们还不能告诉你,你知道,为我们所做的事情提供15万美元。所以,我要说,一方面,你知道,我认为加拿大魁北克的公司面临的最大困难之一是让政府更早而不是更晚地采用初创企业的技术。我想说的是,一方面,你知道,我认为加拿大魁北克的公司面临的最大困难之一是让政府更早而不是更晚地采用创业技术。你知道,根据定义,政府是厌恶风险的。因此,他们很好地将资金投入到我们从中受益的项目中。如果没有魁北克,我们今天就不会在这里,你知道,省、联邦和蒙特利尔;PME West-Island也帮了我们很大的忙,BDC。所以没有他们我们就不会在这里。因此,这一部分运行得相对较好。但是技术采用这句话的意思是,“你知道吗?我们将在政府ADC的分支机构使用Zetane,因为它将帮助我们做风险工作,并理解和解释人工智能解决方案。是的,它可能还不是完美的,但它相当不错。那我们就跳进去吧。“我认为这是仍然需要开发的部分。无论是人工智能还是医疗技术,因为我在医疗技术或其他技术方面做了很多工作-我认为这是很重要的一部分。如果政府能做到这一点,他们会很出色,因为这些项目的睡觉是相当扎实的。我不知道这是否回答了你的问题…嗯?

丹尼斯30:57是的,我想在一定程度上,它说的是,就像我说的,它只是触及了话题的表面,因为我知道我们还有很多节目计划好了。所以也许我们可以在演示之后继续讨论,因为我非常想跳到这个话题上来。乔恩,如果你能分享你的屏幕。让我们跳进去吧。

约31:18好的,我们开始吧。好的,你能看到我的屏幕吗?好的,好的。我们现在看到的是泽坦观察器。就像他提到的,这在我们的网站上是免费下载的。这位观众看到的是一个人工智能模型。所以你知道,我们稍微谈了一下什么是人工智能模型。但你知道,它的核心是一系列的统计和数学运算,它将接受输入信息,并将其转换为产出预测。所以在这种情况下,你知道,我选择了一个我们大多数人可能都经历过的真实世界的用例。因此,我们中的大多数人可能都曾与银行应用程序互动过,在这款应用程序中,你拍下一张支票的照片,它会上传支票,并将钱存入–希望是–你的账户。这是一个数字识别神经网络。所以我们正在看一个较小的数字识别神经网络的例子,它将接收由模型用户产生的输入图像。它将把它转变成一种预测。您知道,它可以是单个数值,也可以是一系列数值。模型所做的就是处理输入信息,并将其转换为输出预测。所以我们实际上是在看模型输入,对吗?现在我们来看一下模型;我们要看一下模型内部的信息,然后是模型在转换这些信息时所做的输出预测。所以在这种情况下,输入是一个数字的图像。这个数字来自mNIST,这是一个包含6万张手写图像的数据库。所以它是为训练模型而设计的,用来识别这些手写数字。

约33:29你可以在这里看到这个可视化的输入图像:它是28乘28乘28,所以28像素宽乘28像素高。它根据每个像素的值进行着色。所以这个配色方案,红色是较高的值,蓝色或紫色是较低的值。你可以作为一个人–很容易看出,“二”,也就是画出的两个,具有最高的价值。但这是可视化的一部分,我们实际上展示了原始的价值。所以这个输入基本上就是,你可以把它看作是传递到AI模型中的统计分布。人工智能模型是-它会随着时间的推移学习,基于一开始随机做出的预测,它会被一个叫做损失函数的数学函数修正,以一遍又一遍地教导模型,无论它所做的预测是正确的还是不正确的,并使其更接近正确的输出预测。所以这个,这个发生的,这个学习的过程叫做“模型训练”。当模型训练时,它实际上是在学习关于这个输入图像,这个输入数据的信息,它把这些信息存储在它的内部–也就是所谓的权重。这些都是它已经认识到的学习模式。我可以很快地证明这一点。所以,你知道,我们在这里看的是模型的实际内部结构。这是一个类似的可视化,但这些是模型权重。因此,这是模型正在了解的有关传递给它的输入数据的信息。我们在这里看到的“二”或“二”的这种彩色版本的可视化是这个特定输入图像和学习到的重量信息的组合。所以它们被结合在一起,以产生这种可视化效果。利用这一点,你可以在某种程度上看到模型对第二个数字了解到了什么。这就是,这个计算机视觉模型正在学习垂直线或水平线;它学习边、曲线;它学习不同笔画之间的并列。还有一件有趣的事情,你可以在这里看到,所以这是相同的配色方案。所以红色是一个较高的值,蓝色是一个较低的值,你实际上可以看到,这个特殊的权重已经学会了避免“两个”中的某些部分。对,所以当模型根据预测被奖励或惩罚时,它也学到了帮助它区分“2”和“7”,或者“2”和“3”的东西。所以它会记住这些东西,而且是高度的–它会注意它们,以便在最终的输出中区分它们。因此,当模型通过其操作传递其数据时,输入图像实际上被下采样;或者它变得越来越小。所以发生的是权重,这个模型-它只是,同样的过程一遍又一遍地发生,随着图像通过并变得越来越小,权重实际上开始了解关于这类图像的越来越多的特殊特征。所以你知道,在这个简单的模型中,图像非常小,它可能在学习,你知道,关于‘2’是‘2’的非常具体的东西;它可能只是,你知道,一组像素;也许,你知道,10个像素,它们影响着这个模型,在它对‘2’的预测中,它说,“好的,你知道,这是‘2’的顶部与‘2’的底部的交汇之处,”。这就是为什么这个词是“2”,而不是“7”、“3”或“9”。最终,这些分布被转化为统计似然预测。这个预测就是模型认为这张输入图像实际上是什么。我可以很快展示给大家看。

约37:48,在这种情况下,它预测的是10位中的一个,所以“零”在这里是一个数字。在这种情况下,它是相同的配色方案。所以0,1,2,这是最高值的预测。所以这个模型说,在所有这些可能性中,‘这’是对这幅输入图像最有可能的预测。所以这基本上是一种旋风式的计算机视觉模型的工作原理;他们变得更大更复杂,你知道,在一个更大、更复杂的模型中,他们开始学习更复杂的东西。所以,你知道,一个较大的模型可能会学习人类可识别的特征,就像我展示的特征地图,你知道,也许是狗的鼻子或眼睛。对于计算机视觉模型来说,无论出于什么原因来学习眼睛,或者你知道,汽车的边缘或其他东西,这是非常-非常常见的。这些都是模型将学习以区分这些不同类型的输入图像的结构。而且,你知道,根据我们之前所说的,你可能可以看出这个模型并不是真的-它是聪明的,但也不是那么聪明。它在做一件非常特别的事情。它正试图在这一点上做得非常好。但是模特们可能会被骗,他们可能会被骗。

约39:19我可以简单地举一个例子,昨晚我举了一个例子,说明这个模型做出了错误的预测。这是一个数字输入图像,它被传递到“9”的模型中,而该模型预测这是一个“7”。所以我们可以看看,你知道,模型学会预测哪些是对角线,垂直线,水平线的特征,它能看到所有这些。你可以看到,你知道,“9”周围的检测,但它没有很好地学习“7”和“9”之间的区别,这看起来很像“7”。你知道,就是几乎没有这个内部圈子。所以这个模型实际上预测的可能性是,你知道的,要么是‘7’,要么是‘9’。但在这种情况下,它实际上认为它更像是‘7’,更像是7岁左右,而不是9岁左右。所以,你知道,这是其中之一;这只是一个简单的例子,也是一种理论上的例子。但在支票的现实使用案例中,你知道,形象可能会有各种各样的挑战,需要计划和缓解。你知道,也许这张支票根本不是一张支票的图片,也许它太亮或太暗,或者支票上隐藏了一些关键信息。所以,即使是在一个简单的情况下,你知道,这个系统的设计是为了让这个模型进入实际生产,就是要知道模型可以做什么,以及知道模型不能做什么。并且知道如何为此做计划,以及如何解决这一问题。这样我就可以有更多的例子了。我不知道我们还有多少时间。

尤妮斯41:12我认为这是一个很棒的开场白,就像感谢你把我们带到这里来一样。因为有时,我们依赖于人工智能,而不是确切地知道它是如何工作的。但现在,就像,至少对观众和我来说,这会容易一些,这就是限制。或者,当我们谈论基于视觉或其他工具的预测和模型时,我们在谈论什么?那么,我们就快到节目的互动部分了。那么下一步就是请观众基本上拿着银行,为我们的嘉宾提问。是啊,不管谁想跳进去都行。

丹尼斯41:57好的,如果你想加入我们的对话,第一,你的聊天盒在右边,所以你可以在那里随意写字。乔恩,我们会密切关注这一点,并直接向预言家提出任何问题。否则,你可以点击麦克风按钮,然后你将能够真正加入我们的屏幕,这也是非常有趣的;我们希望能真正看到你,你今天要加入我们的行列。欢迎向我们的嘉宾提出一些问题。但与此同时,在我们等待的时候:乔恩,纪尧姆,我很好奇。那么看到那个可视化工具,有没有什么限制呢?什么样的人工智能应用程序可以像这样可视化,或者这些信息能够变成可视化的和可用的东西,供不一定像人工智能背景思维的人使用?或者,它是开放的,几乎可以应用于任何使用场景,这一点是否完全适用?

约42:54我是说,我想是的。我想说这里的优势在于计算机视觉模型。我举的另一个例子是一个医疗细分模型,你知道,如果我们没有任何问题,我们也可以通过挖洞进入这个模型。任何情况下,mNIST都很有趣,因为任何人,几乎任何人都可以通过看一个数字来正确判断那个东西是什么,对吗?这是一个“7”,就像即使作为一个人写得很差,我们也很容易区分一个写得很差的“7”。我是说,也许不是每件事都是这样的,对吧?就像,我不知道,有些笔迹是不可能看懂的。但在更复杂和更高风险的情况下,就像你们都提到的,特别是在医疗领域,或工业领域,需要引入领域专家和其他专家,他们不仅仅是ML开发人员,并有共同的过程来查看模型学到了什么,它学会了在这些输入信息中识别哪些模式,这变得越来越重要。所以你知道,特别是在医学领域:一个模型可以预测一些东西,但就像我提到的,它可能是出于错误的原因预测的。因此,你需要医学专业人士与ML开发人员合作,与人工智能专家合作,分享那个过程,那个开发过程和可视化过程,以便进行这种来回交流,并说,“好的,它是出于正确的原因而起作用的。”要不就是不管用。这就是为什么它需要修复的原因。这就是它需要修复的方式。所以你知道,这个,可视化工具提供了一种共享的语言,人们可以相互交流。这不是专门的领域-你知道,领域特定的术语,比如医生有很多这样的术语,ML开发人员有很多这样的术语,但是可视化或图像放在你可以遇到的地方,你可以说,“好的,嗯,这就是我说的吗?这就是我说的,你知道,‘肺之类的东西’。“你知道,我不知道任何医学术语。我试着让自己看起来太蠢了。

丹尼斯44:58太棒了。所以我看到观众们有几个简短的问题。我要往上滚动一点,因为我看到了加布里埃尔,实际上,你刚才给我们发来了一个问题。所以我想谈谈这个问题。因此,加布里埃尔问道:“因此,显然容易接近的人工智能应该与社会可接受的人工智能一起运行。那么,你将如何着手让普通公众足够了解AI,从而不会因为恐惧而无用地发展挡路呢?“

乔恩45:25是的,我是说,这是个很难回答的问题。我认为这是一个棘手的问题。所以我的意思是,其中一件重要的事情是,你知道,培训信息有一个问题,它涉及到另一个被问到的问题,但是,你知道,从定义上讲,模型是有点愚蠢的,对吧?在我认为有些人认为人工智能意味着或甚至正在寻找的那种普遍的人工智能意义上,它们并不是真的可以概括的,你知道,在未来,什么是一般的人工智能。在识别事物的模型的情况下,通常是数据集的问题:所以不完整或不正确的数据集,或者缺少现实世界的大部分是一个大问题。使用自动驾驶模型的一个原因是,为了获得足够的数据,要训练自动驾驶模型,你经常要生成这些,你必须模拟数据。这可能会有问题,因为您的模拟可能不会以任何有意义的方式表示真实世界。因此,即使你试图增加你拥有的数据量,你仍然受到开发人员的限制;你知道,他们如何感知世界,他们如何看待世界,以及输入到模型中的数据。所以我的意思是,我认为,对我来说,重要的一点是基本上理解数据的限制,数据的限制,以及开发的限制和在组织概念中工作的限制,或者可能是在一个更广泛的利益相关者群体的社会背景下,更广泛的能够为这个发展过程做出贡献的人。而这些东西可以,你知道,走向,你知道,只是更普遍和更好的人工智能性能,除了,你知道,你可能会说,更容易接受的人工智能,或者是的,。

纪尧姆47:16我要补充几点,这是一个非常激动人心的话题。我再补充两点。你知道,偏见,测试和评估。所以人工智能的问题是,它不知道什么时候它是有偏见的,因为它只接受正确的数据,而在算法中,它不能在给定数据的情况下选择它采用的数据。因此,如果我训练一个算法,这个算法-完全按照乔纳森的说法-针对你创造的东西,它真的很擅长计算出如何智胜你。真的是这样。所以已经有很多例子,算法接受了数据的一部分,然后说,“哈哈,这就是给我答案的驱动因素!所以我会作弊,忘记所有其他的东西,我只会跳到似乎总是驱动因素的东西上。“所以如果我给你一个人口数据,这肯定是有种族偏见的,或者是性别偏见的,那么结果就会是,“啊。总是男的。所以给我一份简历,是个男的,我会把他们放在首位的。给我一个有种族背景的罪犯,他们会把他或她放在名单的首位,“你明白我的意思吗?因此,打开黑匣子说,“哪里有偏见?它到底在说什么,真的吗?数据偏向在哪里?“因为算法本身是没有偏见的。它只是在做它所做的事情上很聪明。那是第一个。第二,我来自一个建模和仿真软件的世界;就像,我在我的职业生涯中做了很多这样的事情。在这个知识体系中,你知道,我们谈到了软件测试,软件验证,软件审计,对,这些都已经持续了很多年了。这在人工智能(行业)中还不存在。因此,你如何测试和验证人工智能以确保它以正确的理由做正确的事情的概念是不存在的。我们关注的一个领域是工作流程的一部分,比如,是的,你可以展示你可以看到的数据–就像Jon展示的那样–你说,“为什么你把这个叫做‘7’,而不是‘9’,或者‘1’,而不是‘7’呢?”“你为什么把它叫做‘7’,而不是‘9’,或者‘1’,而不是‘7’?”那很难,取决于欧洲的还是北美的,可以是‘7’,对吧?对这四个人来说,这看起来很滑稽。所以我们所做的就是,我们要让它看得见,这样偏见就可以暴露出来,人们就可以进行对话,获得数据和输出。我们将创造一个可以进行测试和评估的环境来解决这个问题。因为在你做到这一点之前,你是在再次信任,你是在信任(听不见的),你是在信任–就像你和我在工作中信任一个有偏见的人一样。除非你训练那个人以不同的方式看待世界,否则没有什么不同。个人周围的数据是不会有偏见的,对吧。这就是我们要做的。

尤尼斯49:57我能做什么这个轮换是在最后所有关于收养的事情,他们记得在美国的一个核设施,他们有成堆的规定和成吨的警告,关于哪里可以接近,我们不能接近,你将使用不同类型的灯来为人们做更多更具体的事情。你知道,即使你们说同样的语言,你也会清楚地看到红灯,不要去那里。但最后,我最喜欢的是这个传说的牌子,上面写着:“机器没有大脑,请用你的大脑。”嗯。无论如何,如果是人工智能,或者是古腾堡的打印机,或者是核设施中的打印机,最终,我们都是我们正在开发的技术的大师。重要的是,我们要认识到,将这些技术应用到网格中对我们来说很重要,以识别(正如刚才提到的)该技术的限制是什么。哪些是我们可以用它来探索的潜在途径。所以这很吸引人。

丹尼斯51:02我们收到埃拉·安德烈娜的来信–我希望我把你的名字念错了,对吧?因此,提供数据来识别和学习可能会引入一系列模拟的偏差,以实际找到更高的偏差,对吗?

约51:18但是我不应该提到我有哲学背景。我的意思是,如果我对这个问题的理解是正确的,我可能不是,我的意思是,这是一个非常有趣的观点。我认为这可能是一种非常有趣的发现技术-我的意思是,在很多方面,你知道,如果模型的开发者,当我们谈论跨职能的,或者像,你知道,多个利益相关者接近一个模型的开发时,在实际的开发中有很多不同的观点的表现是很重要的,因为训练数据的选择-训练数据的创建-实际上可以代表模型开发者已经存在的偏见和那些类型的事情。因此,当某些群体是唯一从事模型开发的人时,那么,你知道,这些偏见开始有意识或无意识地反映在创建的系统中。所以我认为,是的,绝对存在一定程度的,你知道,更高的偏见,你知道,从我们在ML系统中看到的一些大规模故障中发现了这一点。

纪尧姆52:30是的,我想补充一下,因为我参与了很多顾问工作的项目。我在这里夸大了自己-我忽略了很多项目,我意识到,你知道,这些著名的数据集可以很好地利用,顺便说一句,就像“兆”,这就是我们所说的大数据。这就是机器学习如此擅长的地方:人类理解所有数据并得出答案的时间太长了。这就是积极的一面。但是这些数据集有很多特点。机器学习算法和深度学习算法所做的就是找出我可以给你1000个特征中的哪些特征。但实际上,就像乔纳森展示的数字一样,可能有三到四个关键部分的功能驱动了大部分结果。因此,您需要不同程度的偏见,并且对每个功能的理解都起着主导作用。当乔纳森在演示中展示模型时,你看不到宏观层面上的情况。但是他向你们展示的是从左到右的顺序,数据是如何流动的。在这些不同的子模型的过程中,每一个子模型体系结构如何对确定正在发生的事情以及它将如何对其进行分类产生影响。所以我们刚才被问到的问题,就是在这个过程中的理解,会发生什么。我给你举个例子。我们和一家公司做了一些工作,他们在铁路上寻找更大胆的探测,铁路轨道,好的。他们用来训练模型的图片是一个模型–就在轨道末端进入隧道之前的一块巨石–就在隧道前的轨道上的巨石。如果你拍下这张照片,巨石和隧道轮廓看起来也像一块巨石。算法实际上是在告诉火车停车。所以基于隧道的形状做出了很好的决定。它将其解释为一块巨石,而不是基于巨石的形状。所以这种理解–我们发现在从左到右的12层之后–出于某种原因,它说:“啊哈,我们要停下来了,因为我一直在识别这个形状是一块巨石,就是这个。”你知道,不会有巨石,他会无缘无故地停下来,对吗?所以偏见是,他一直以来的理解是,算法说我什么时候在这里放了更多的“权重”。正如我们在模型体系结构中所说的,当你“从左到右”时,顶层偏向第二层偏向。

丹尼斯54:51,我们在这里的时间非常紧迫,我想确保在最后给你们一点时间,让我们知道如何跟上你们的脚步,但我想在这里触及一个问题,因为我不想忽视我们的观众,路加。所以他,卢克问道,“同样的产品被允许可视化模型不适用于2D图像吗?”比如时间序列?“

约55:12所以是的。我给你举个例子。我们研究了一种叫做唤醒词检测的模型。所以,当你说,“好的,谷歌或Alexa,”有一个神经网络,它会在这些设备中触发,它专门设计用来检测唤醒词。它唯一的目的就是听到这个词,然后启动和打开设备,然后打电话回家,让更大的系统开始与它互动。所以你知道,声音是一个时间序列:它是一个波,对吧。但是你可以使用很多不同类型的模型。在我们的例子中,我们使用计算机视觉模型。这是一种特殊的型号,叫做“喇叭”。它使用计算机视觉模型来识别音频本身中的模式和时间序列。当你想象它的时候,它实际上是令人着迷的,因为你可以看到波浪图案是什么样子的。你可以开始对音频波形应用卷积方法,或可视化,以查看模型将注意力放在波形上的位置。同样,你如何知道,模型可以学习图像数据中的模式,也就是,从计算机的角度来看,它只有794个独特的值,没有任何图像意义–这只是我们-我们解释信息的方式。同样,您也可以对音频信息做同样的事情,音频信息也只是一系列不同强度的值。所以你可以开始从唤醒词中拉出‘7’到‘9’这样的东西,这是我们所做的。所以我们拉出了,好的,这些是表现不是很好的。当你把他们当做人听的时候,你会说,“哦,好吧,很明显。”我可以告诉他们表现不是很好,因为听起来没什么,或者是随机的噪音,你知道的。所以很多情况下,数据是完全的,你知道,有人说,“去吧,停下来”,但听起来几乎完全一样,因为录音不是很好。这个模型说,“好的,你知道,我不明白如何预测这两个分布之间的差异。”所以,是的,这是你绝对可以做到的。

尤妮斯57:21所以按照传统,我们总是用提名来包装创新者的节目。因此,让创新者认识其他创新者,无论是导师还是某个人,他们甚至尊敬竞争对手。因此,每一场演出我们都会花一点时间来听取我们的嘉宾的意见。我认为第一个问题是,在未来的几集节目中,你知道或参与过互动的最具创新力的人或组织是谁,你想提名谁,并听取他们的意见?

纪尧姆58:11问得好。听着,我认为我认为在过去的一段时间里我指导了几家公司,我认为听到像莎拉·詹娜这样的公司离开我的智能机器-这是蒙特利尔基因组学领域的一个巨大成功故事-使用人工智能和基因组学,以及其他一些不同的东西,我认为,在一个漂亮的好胜环境中,我认为,在蒙特利尔,像莎拉·詹娜这样的公司将提供女性领导力,科技和蒙特利尔。所以这是一些-那将是一个人。你知道,Sylvain Karle在Founder Fuel之外所做的工作,你知道,利用他所有的知识,基本上就是创造Founder Fuel的人,并将其输出到环境和社会责任倡议中,所以所有知道如何建立科技公司的人都知道。但在这一部分,我的意思是,这只是我们提出的两个非常不同的侧写。但这肯定是两个非常,非常,你知道,有趣的人,他们会有很多东西可以分享,他们是各自领域的创新者。

丹尼斯59:23我们下午1点到所以实际上,我不想我不想耽误你们太久。所以我想用一个简短的片段献给你们。如果我们的观众能跟随你,不管发生了什么。现在是你发出行动号召的时候了,你知道,他们是如何跟随你的?你想让他们盯着什么?在接下来的几分钟里,让他们确切地知道这一点。

纪尧姆59:50嗯,在我这边,我会说去我们的网站,但我会说大约一周后去我们的网站。因为我们发布了一个全新的网站,不仅面貌焕然一新,而且导航和查找大量信息的方式也更加清晰。所以这是一种很好的方式,无论是旧的还是新的网站,免费的浏览器就是它是免费的,它不需要你花任何钱,没有任何信息,你只需下载即可。你可以开始看到乔纳森给你看的一些东西。它们更多的是针对机器学习,深度学习模型,但是你真的可以非常非常直观地玩耍。所以那将是我的第二次。当然,第三个问题是,如果你所在的公司希望引入人工智能,而你一直在努力做到这一点。你知道吗,我们很乐意就这件事谈谈,这是肯定的。所以我们可以在zetan.com的纪尧姆,zetan.com的jon或访问zetane.com找到。zetane.com

Jon 1:00:44是的,当其中一个东西–非常快–我们要发布的是–我们要把一组精心策划的模型放入查看器本身。因此,当您下载查看器时,将会有预先管理的模型。因此,如果你正在学习,如果你试图理解模型可以做什么,你实际上可以只使用引擎中已经内置的模型。所以你有五个不同种类的。其中之一就是ResNet。只是一些经典的架构,你可以看一看,你可以用它们做实验。所以你可以提供一些免费的样本数据。您可以看到样本数据在通过图像时是如何转换的。您可以加载您自己的数据并将其传递,而不必编写Python脚本或编写代码,只是为了在某种程度上了解正在发生的事情,或许还可以验证您是否有自定义模型。所以。

尤尼斯1:01:33谢谢你,乔恩。太棒了,再次谢谢你。再来一次,让我们几乎双手合十,感谢我们的嘉宾。它不在聊天盒子里,只是在屏幕上。让我们向他们展示我们社区的爱。因此,如果你喜欢这一集,请与你生活中或你的社区中所有的人工智能爱好者分享这一集。在接下来的几周里,我们将在蒙特利尔新闻科技的社交媒体上发布精彩内容,所以请务必关注我们。如果你还没有这样做,创建你来关注我们,并在社交媒体上与我们分享和互动。所以丹尼斯,事情就这样过去了。

丹尼斯1:02:21所以我们还没有真正做完。一定要在每一场演出结束时都有一个小小的休息室。乔恩,纪尧姆,我知道你们很忙。如果你有时间,我们很乐意看到你在里面。这是一个让我们的观众互动并在节目结束后进行一点对话的地方。因此,我们将开放两个分组会议室,其中一个专门用于继续关于人工智能的对话。第二个是我们所说的VIP创新者体验。这是这场演出的幕后黑手。所以我们总是我们的主要目标是不断迭代,下次做得更好。所以我们向观众敞开大门,和我们一起进入另一个休息室,让我们知道,你知道,你的节目怎么样?你玩得开心吗?什么管用?什么没有呢?例如,我知道我们可以就今天比赛中的混乱情况进行一些讨论。我很想听听你们是否愿意让我们再试一次。所以我们非常希望能听到你们那边的消息。所以除此之外,非常感谢你加入我们。纪尧姆,乔恩,这是一次美妙的谈话。我们很乐意在那之后再继续。如果你们有时间,我们一定会通过电子邮件与你们联系的。所以非常感谢你今天参加我们的节目。谢谢大家邀请我们。

展示流行人工智能技术的另一个例子

原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2021/06/16/%e7%94%a8%e7%9b%b4%e8%a7%82%e7%9a%84%e8%a7%86%e8%a7%89%e7%90%86%e8%a7%a3%e4%ba%ba%e5%b7%a5%e6%99%ba%e8%83%bd%ef%bc%9a%e6%89%8b%e5%86%99%e6%95%b0%e5%ad%97%e7%9a%84%e8%ae%a1%e7%ae%97%e6%9c%ba%e8%a7%86/

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息