第一章 人工智能来了(第7/8页)
另一方面,从心理学和生物学出发,科学家们试图弄清楚人的大脑到底是怎么工作的,并希望按照大脑的工作原理构建计算机程序,实现“真正”的人工智能。这条道路上同样布满荆棘。最跌宕起伏的例子,非神经网络莫属。
生物学家和心理学家很早就开始研究人类大脑的工作方式,其中最重要的一环,就是大脑神经元对信息(刺激)的处理和传播过程。早在通用电子计算机出现之前,科学家们就已经提出了有关神经元处理信息的假想模型,即人类大脑中的数量庞大的神经元共同组成一个相互协作的网络结构,信息(刺激)通过若干层神经元的增强、衰减或屏蔽处理后,作为系统的输出信号,控制人体对环境刺激的反应(动作)。20世纪50年代,早期人工智能研究者将神经网络用于模式识别,用计算机算法模拟神经元对输入信号的处理过程,并根据信号经过多层神经元后得到的输出结果对算法参数进行修正。
早期神经网络技术没有发展太久就陷入低谷。这主要有两个原因:一是当时的人工神经网络算法在处理某些特定问题时有先天局限,亟待理论突破;二是当时的计算机运算能力无法满足人工神经网络的需要。20世纪70年代到80年代,人工神经网络的理论难题得到解决。20世纪90年代开始,随着计算机运算能力的飞速发展,神经网络在人工智能领域重新变成研究热点。但直到2010年前后,支持深度神经网络的计算机集群才开始得到广泛应用,供深度学习系统训练使用的大规模数据集也越来越多。神经网络这一仿生学概念在人工智能的新一轮复兴中,真正扮演了至关重要的核心角色。
客观地说,神经网络到底在多大程度上精确反映了人类大脑的工作方式,这仍然存在争议。在仿生学的道路上,最本质的问题是,人类至今对大脑如何实现学习、记忆、归纳、推理等思维过程的机理还缺乏认识,况且,我们并不知道,到底要在哪一个层面(大脑各功能区相互作用的层面?细胞之间交换化学物质和电信号的层面?还是分子和原子运动的层面?)真实模拟人脑的运作,才能制造出可以匹敌人类智慧的智能机器。
定义三 AI就是与人类行为相似的计算机程序
和仿生学派强调对人脑的研究与模仿不同,实用主义者从不觉得人工智能的实现必须遵循什么规则或理论框架。“黑猫白猫,逮住耗子的就是好猫。”在人工智能的语境下,这句话可以被改成:“简单程序,复杂程序,聪明管用的就是好程序。”
也就是说,无论计算机以何种方式实现某一功能,只要该功能表现得与人在类似环境下的行为相似,就可以说,这个计算机程序拥有了在该领域内的人工智能。这一定义从近似于人类行为的最终结果出发,忽视达到这一结果的手段。另一种对人工智能的近似定义则更强调人工智能的实用色彩:AI就是可以解决问题并获得最大收益的计算机程序。
略懂些编程的人都知道,几乎所有程序设计语言都提供了类似“if……else……”的分支结构,即,如果程序发现某个条件已满足,就执行if之后的指令,否则就执行else之后的指令。那么,与“if……else……”相关的一个哲学问题是,程序根据某个条件进行判断并完成相应操作的时候,这个“判断”以及随后的“决定”是由计算机自己做出的,还是由编程序的人做出的?如果是由计算机自己做出的,那能不能说所有执行了“if……else……”语句的计算机程序都是人工智能?如果相反,那计算机根据运行时的情况做决策时,人又在哪里呢?
哲学思辨容易陷入这样的两难境地,但实用主义者根本不把这当回事——执行“if……else……”的程序是否有智能,完全要看那个程序是不是做了和人相似的有智能的事。像Dendral这样的专家系统就是靠大量“if……else……”来模仿人类专家的判定规则,这当然属于人工智能的范畴,而普通的数值计算程序即便用了“if……else……”,也不能被称作智能。
实用主义者推崇备至的一个例子是麻省理工学院于1964年到1966年开发的“智能”聊天程序ELIZA。这个程序看上去就像一个有无穷耐心的心理医生,可以和无聊的人或需要谈话治疗的精神病人你一句我一句永不停歇地聊下去。当年,ELIZA的聊天记录让许多人不敢相信自己的眼睛。可事实上,ELIZA所做的,不过是在用户输入的句子里,找到一些预先定义好的关键词,然后根据关键词从预定的回答中选择一句,或者简单将用户的输入做了人称替换后,再次输出,就像心理医生重复病人的话那样。ELIZA心里只有词表和映射规则,它才不懂用户说的话是什么意思呢。
这种实用主义的思想在今天仍有很强的现实意义。比如今天的深度学习模型在处理机器翻译、语音识别、主题抽取等自然语言相关的问题时,基本上都是将输入的文句看成由音素、音节、字或词组成的信号序列,然后将这些信号一股脑塞进深度神经网络里进行训练。深度神经网络内部,每层神经元的输出信号可能相当复杂,复杂到编程者并不一定清楚这些中间信号在自然语言中的真实含义,但没有关系,只要整个模型的最终输出满足要求,这样的深度学习算法就可以工作得很好。在研究者看来,深度学习模型是不是真的跟人类大脑神经元理解自然语言的过程类似,这一点儿都不重要,重要的是,整个模型可以聪明地工作,最终结果看起来就像人做的一样。
定义四 AI就是会学习的计算机程序
没有哪个完美主义者会喜欢这个定义。这一定义几乎将人工智能与机器学习等同了起来。但这的确是最近这拨人工智能热潮里,人工智能在许多人眼中的真实模样。谁让深度学习一枝独秀,几乎垄断了人工智能领域里所有流行的技术方向呢?
20世纪80年代到90年代,人们还在专家系统和统计模型之间摇摆不定,机器学习固守着自己在数据挖掘领域的牢固阵地远远观望。从2000年到2010年,短短十几年过去,机器学习开始逐渐爆发出惊人的威力,并最早在计算机视觉领域实现了惊人的突破。2010年至今,使用深度学习模型的图像算法在Image Net竞赛中显著降低了对象识别、定位的错误率。2015年,Image Net竞赛中领先的算法已经达到了比人眼更高的识别准确率23。就在同一年,语音识别依靠深度学习获得了大约49%的性能提升24。机器翻译、机器写作等领域也在同一时期逐渐被深度学习渗透,并由此获得了大幅改进。