上周,谷歌宣布它将在电邮服务中使用人工智能(如果你使用Inbox App这个独立于Gmail的邮箱服务的话)。据Gmail的产品总监Alex Gawley说,这也是基于TensorFlow而建立的。
“我们开始看到了我们研究团队建立的神经网络的强大力量。” Gawley说。“有可能,我们除了理解和组织之外还能协助做更多的事,也有可能,我们能在写作邮件之类的事情上帮上忙。”
Inbox的这一功能被称为“智能回复”,它本质上是一个递归神经网络,能够阅读你的邮件并将它传递给另一个网络,后者能产生出三个可能的回复。你从中选择一个,然后发送邮件。不过,在隐私方面邮件至少像图片一样敏感,如果不是比图片更敏感的话。
要记住,谷歌没有任何人人会读到你的邮件。不过,关于“你做了什么选择”的数据将被传送回去,用于训练整个模型。智能回复系统正是靠这来学习的。利用这些数据,研究者可以让机器回答某些问题,并发现神经网络中有哪些需要修改的地方。每个人都可以使用这个软件,这样,这个智能回复服务便让我们能够窥见谷歌的机器学习产品是如何建造的。Inbox团队内部都在利用这个功能特征来测试机器、告诉机器何为正确何为错误,这个过程被称为“喂狗粮”(dogfooding,这个词组的原义是,吃自家狗的狗粮。从这个词组能看出,这些技术咖有多怪异。)整个团队都在使用它,记录错误,并用越来越多的数据来喂养它。当这个App在受控环境中能正确地运转,并能被规模化时,团队就会发布这个产品。
一个拥有机器智能的智能手机的终极目标是:它将成为一个真正的数字个人助理,能进行准确的预测,知识渊博——它将成为你的大脑的一部分,尽管不是天生的部分。
内部测试使得研究者们有机会来预测当神经网络面临大规模数据时可能出现的错误。例如,刚开始时,智能回复服务倾向于对每个人说“我爱你”。而这是因为,在私人邮件里,“我爱你”是一个非常常见的词组,所以机器会认为它很重要。
所有这些都是为了让你的工作更容易些——那也正是该公司大部分产品的目标。 Google Now这个谷歌世界里的个人助理服务,尤其如此。该团队的口号是“让对的信息在对的时间出现”,Google Now的负责人, AparnaChennapragada说,当把机器智能建造到这个平台中去时,需要进行缜密的考量,以便为人的大脑提供协助。
“你需要挑选出那些对人类很难,但对机器很容易的问题,而不是反着来。”Chennapragada说。“我们要让技术来为你搬举重物,这样你就不需要自己来搬举重物了。”
此刻,这个产品正在探索如何用这些方法来让你的生活变得更轻松容易。 Chennapragada把这和五年前的语音识别研究相类比——Google Now已经做都不错了,但还不能每次都做对。
他们正在探索,如何运用三种不同类型的数据形成有趣的信息来为你服务。他们认为,智能电话是一种“局部注意装置”,而一个理想的装置不应该让你信息过载。
“ 如果你看看我们每个人是如何使用手机的,你会发现我们是在生活中各种事情的间歇里使用它。使用它时,你在寻找的是一些点点滴滴的信息。”Chennapragada说。“我们在思考的一件事是,我们怎样才能以一种积极的方式代表你行动,随时随地的。”
这便是一个拥有机器智能的智能手机的终极目标:它将成为一个真正的数字个人助理,能进行准确的预测,知识渊博——它将成为你的大脑的一部分,尽管不是天生的部分。
为了实现这一点,你的手机需要关于你的数据:你的时间表,你在搜寻什么,你听什么音乐,以及你要去哪里。这些是最容易获取的信息,因为它们已经存在于你的手机上了。
“我们在思考的一件事是,我们怎样才能以一种积极的方式代表你行动,随时随地的。”
当你把个人信息、通过谷歌知识图谱(这个随后再讲)得到的关于世界的信息和来自其他用户的信息联合起来时,世界将来到你的指尖。或许你不知道如何开车去机场,但你的手机知道。
关于谷歌利用众人信息的方式的另一个例子是测量道路交通情况。通过从高速公路上的手机中提取匿名位置数据,谷歌可以辨认出汽车们比平时开得慢。同理,也能辨认一家饭馆或是咖啡馆拥挤不拥挤。
Google Now 代表了谷歌使用人工智能的方式。他们意识到,那种能转化图片并告诉你图片里有什么的一般性智能模型离我们还有好些年的距离。所以现在,他们在创造由一个个工具组成的联合体,这些工具能协调一致地为用户提供最好的体验。
组织全世界的信息
好了,上文我提到Google Now借助知识图谱来工作。什么是知识图谱呢?
前谷歌研究院负责人John Giannandrea是2010年加入谷歌的。他曾建立了一家 名叫Metaweb的公司,该公司能把互联网上的文本和对象联接起来。它是一种与搜索服务相平行的逻辑服务——通过它不仅能搜索到想找的东西,而且能搜索到与之类似的东西和信息。很久之前,当他还是网景公司的首席技术官的时候,他就在做这件事了。(你还记得网景公司吗?)这一切都体现在知识图谱中。知识图谱于2012年首次亮相。当你搜索某个事实时,它就会以相关信息和文字的方式弹出来。如果你搜索《大众科学》杂志何时建立,谷歌就会告诉你答案(“1872”)。
这就是谷歌的做法:不仅要为互联网编制目录索引,而且要让互联网变得对用户来说更好用、更有用。这也是人工智能第一次闯入谷歌的主要业务——搜索。从那时起,谷歌把它15%的日常搜索业务都交给了一个名叫 RankBrain的人工智能模型。这个系统实现的是常识意义上的搜索——它要处理那些传统算法无法搞定的查询。
除了把它整合进谷歌的核心搜索算法并把它扩展到产品中之外,谷歌还打算做一些登月级的神奇工作。在这方面,他们的靠山是Geoff Hinton。
Hinton是人工智能界最杰出的思想家之一——人们经常把他的名字与Facebook的YannLeCun,谷歌的Andrew Ng(注:已转到百度)以及YoshuaBengio等人相提并论。(实际上,LeCun,Hinton和Bengio 还在五月份的《自然》杂志上写了一篇深度学习综述,这篇综述读起来像一篇人工智能的教材。)“在魔术和神秘之间有一条很细的线,我们希望让自己处于正确的一边。”
与Hinton对话,就像在于一个生活在未来五年之后的人对话。我们的对话围绕着怎样将文档变成思维向量,以便机器能理解和记住冗长的数据,并能通过逆向工程获得我们大脑用于学习的算法。
例如,现在的许多计算机程序在分析文本的意义时,是通过查询文档中的单词的词典定义和语法这样的蛮力。然而,要想像人一样去理解文档,理想情况下计算机就需要能够将文档分解为一系列不同的思想。”
谷歌将会乐于能够记录,并找到其中的原理是什么,文档里说了什么,一种想法是怎么从前面的想法中流过来的”,Hinton说,“如果我们可以开始做到这些,那么机器能给你更好的答案,因为他真正地读了文件并理解了。”
当问及为什么这一点还没有实现时,Hinton说,如果我们想要让机器与大脑的理解力相匹配,问题在规模方面。研究者现在使用的人工神经网络不具有我们大脑的复杂性,哪怕把规模扩大到目前的极限也达不到。最好的系统或许拥有数亿个需要操作的权重(在讲述如何操作权重时,LeCun把它们类比为一个外表面上有一百万个旋钮的黑盒子。)然而,我们的大脑有上百万亿个需要操作的权重——这意味着大脑要处理的信息要高上十万倍。
尽管被规模问题所阻挠,Hinton仍然很乐观,认为人工智能研究的这一特征并不会像过去一样使它夭折。(人工智能曾经历过“凛冬”,那时进展总是无法满足预期,投资也退缩了。)这种乐观的一个主要原因是,前面提到的思维向量的观念正在变得日益流行。不过,在Hinton看来,最让他感到安慰的是过去五年来的进展,特别是在对象识别和语音领域。过去这些问题常常被认为是太复杂了,而现在,它们在标准化测试中的错误率已戏剧性地下降。
“它们的表现正在接近人类水平。”
“它们的表现正在接近人类。不是在所有方面,而是在像对象识别这样的方面。几年前,做计算机视觉的人还会告诉你,‘不,很多年之内计算机都达不到那样的水平。’ 所以,我们有理由保持乐观。”Hinton说。
不过,无论机器能多么好地补充或模拟人脑,如果普通人不明白该怎么使用它,它就毫无意义。所以谷歌才会打算以这种方式来统领人工智能——让它在使用者面前尽可能地简单。幕布背后的计算过程是复杂而动态的,而它所输出的结果却是人人都能用的工具以及可供改善这些工具的手段。如果你想的话,可以用这些手段来改善这些工具。
“在魔术和神秘之间有一条很细的线,我们希望让自己处于正确的一边。”Google Now的Chennapragada说。