第二章 AI复兴:深度学习+大数据=人工智能(第7/14页)

我下定决心,要让这个团队中的工程师“解放”出来,专心地做更有前景的项目。当我把这个决定告诉该团队的建立者时,他怎么也不同意我将这个团队解散和重组,于是他把状告到了鲍尔默那里,而鲍尔默又告诉了盖茨。

盖茨找到我说:“开复,我希望你的团队能让用户自然地与机器交流。那为什么你执意取消这个自然语言处理团队呢?”

“因为,这个团队走的方向是错的。”

“但是,大卫也是专家,还拯救过公司。他不认可你的看法。”

“比尔,大卫是操作系统的专家。我才是语音语言的专家。”

“但是,这个项目我们的投入很多,我们特意批准了100多个人,围绕着语言学家来解决人类语言理解的问题。”

“比尔,当你走错方向的时候,投资越大,损失就越多,弥补也越难。”

“你确定这个方向不行吗?”

“比尔,你还记得我加入公司的时候,你曾告诉我,微软的许多技术决定都借鉴了我在其他公司的工作吗?”

“当然!”

“如果我不在微软时都借鉴我的做法,那我加入了微软,请你一定也要相信我。”

盖茨沉默了一下,没有说话。

我看着盖茨的眼睛,对他说:“在公司,很多人为了自己的利益会跟你说很多话。但是,我对你保证,我不会骗你。”

在那一刹那,我感觉我们的心灵有一个难得的碰触。

“好,那就照你说的做。”盖茨说。

盖茨亲自参与这个问题的解决,最后支持了我的决策。然后,我亲自操刀,把这个团队裁减了一半,才腾出了资源来做更多、更好的项目。

时代就是这么无情,在人工智能的上一个时代,符号主义专家特别是语言学家们还风光无限,仿佛技术突破的美好前景都要由他们来描绘。但实践结果表明,我所代表的统计学派真正可以解决问题,可以提高语音识别与自然语言处理的准确率,专家系统等老一代技术就被无情抛弃。老一代研究者如果不能尽快更新知识储备,就只有面临被解雇的命运。

今天,语音识别和更广泛意义上的自然语言处理已经走进了统计方法与深度学习方法相结合,甚至是深度学习方法独立起主导作用的新时代。与我们那个时代相比,今天的语音识别真正满足了用户的应用需求。这也意味着,像我这样“上一代”的研究者就必须抓紧一切时间,转换思维和知识储备,拥抱以深度学习为代表的崭新时代,否则,就有被时代淘汰的风险。

深度学习助力语音识别

我做研究时,没有赶上深度学习技术革命。语音识别在第二次人工智能热潮中虽性能提升明显,却始终无法满足需要。在近年来的第三次人工智能热潮中,语音识别领域发生了天翻地覆的变化。深度学习就像一个秘密武器,蛰伏多年,重出江湖,首先在计算机视觉领域,帮助计算机认识人脸、认识图片和视频中的物体,然后,拔剑四顾,冲入语音识别、机器翻译、数据挖掘、自动驾驶等几乎所有人工智能的技术领域大展身手。

2011年前,主流的语音识别算法在各主要语音测试数据集中的识别准确率还与人类的听写准确率有一定差距。2013年,谷歌语音识别系统对单词的识别错误率在23%左右。也就是说,深度学习技术在语音识别系统广泛应用之前,基本还停留在比较稚嫩的阶段,说话者必须放慢语速,力求吐字清晰,才能获得一个令人满意的准确率。

但仅仅两年时间,因为深度学习技术的成功应用,谷歌在2015年5月举办的Google I/O年度开发者大会上宣布,谷歌的语音识别系统已将识别错误率降低到了惊人的8%37!

而IBM的Watson智能系统也不遑多让,很快就将语音识别的错误率降低到了6.9%。

微软则更进一步。2016年9月,微软研究院发布了里程碑式的研究成果:在业界公认的标准评测中,微软最新的基于深度学习的语音识别系统已经成功地将识别错误率降低到了6.3%38。

图23 近20年来语音识别错误率的下降趋势

如图23所示,在我从事语音识别研究的时代,统计模型崛起,并在随后的一二十年中,将按照单词统计的识别错误率从40%左右降低到20%左右。但在今天的深度学习时代,只用了两三年的时间,微软、IBM、谷歌等公司就将语音识别的错误率从20%左右降低到了6.3%!

这就是为什么我们说,这一拨人工智能浪潮的最大特点是人工智能技术真正突破了人类的心理阈值,达到了大多数人心目中“可用”的标准。以此为基础,人工智能技术在语音识别、机器视觉、数据挖掘等各领域走进了业界的真实应用场景,与商业模式紧密结合。

例如,今天我们拿出手机,使用苹果手机内置的语音输入法,或者使用中文世界流行的科大讯飞语音输入法,我们就可以直接对着手机说话以录入文字信息。技术上,科大讯飞的语音输入法可以达到每分钟录入400个汉字的输入效率,甚至还支持十几种方言输入。在不方便用键盘打字的场合,比如坐在汽车或火车上,我就经常用语音输入法录入文字,然后再将文字信息发给别人;有时候,我还直接用语音识别系统来写大段的文章。

深度学习携手大数据引领第三次AI热潮

语音识别系统在近年来突飞猛进,技术上只有一个原因——深度学习!事实上,机器视觉领域,2014年在Image Net竞赛(ILSVRC)中第一次超越人类肉眼识别准确率的图像识别算法也是深度学习的杰作!

今天,人工智能领域的研究者,几乎无人不谈深度学习。很多人甚至高喊出了“深度学习=人工智能”的口号。

毋庸讳言,深度学习绝对不是人工智能领域的唯一解决方案,二者之间也无法画上等号。但说深度学习是当今乃至未来很长一段时间内引领人工智能发展的核心技术,则一点儿也不为过。

人工智能大师、深度学习泰斗约书亚·本吉奥(Yoshua Bengio)说:“没有可与深度学习竞争的人工智能技术。人工智能是循序渐进的耐心工作的成果,而且它总是站在巨人的肩膀上,并且这些进步在某种程度上促成了转折点——我们可以在新服务中利用这些成果来生产新东西,进行经济转型以及改变社会。正如人们所写的那样,我们正在经历另一场工业革命,它并不是简单地增加人类的机械力;计算机将增加人类的认知能力和智力。我谈到了深度学习,因为这些变化和突破在很大程度上正是由于深度学习的进步。”39