第四章 AI时代:人类将如何变革?(第13/20页)

图46以银行业为例,显示了人工智能正在和即将发挥重要作用的各个应用场景。

金融行业AI应用成功案例

目前,国内外人工智能在金融领域的应用已有诸多成功案例。美国的Wealthfront和Betterment、英国的Money on Toast、德国的Finance Scout 24、法国的Marie Quantier等均成功将人工智能引入投资理财,目前智能顾问已掌握大量资产;第一个以人工智能驱动的基金Rebellion曾成功预测了2008年股市崩盘,并在2009年给希腊债券F评级,而当时惠誉的评级仍然为A,通过人工智能,Rebellion比官方降级提前一个月;掌管900亿美元的对冲基金Cerebellum,使用了人工智能技术,从2009年以来一直处于盈利状态。

在国内,蚂蚁金服已成功将人工智能运用于互联网小贷、保险、征信、资产配置、客户服务等领域;智融金服利用人工智能风控系统已经实现月均120万笔以上的放款,常规机器审核速度用时仅8秒;招商银行的可视化柜台、交通银行推出的人工智能机器人“娇娇”等则在智能客服领域做出了早期的尝试和探索。

在创新工场所投资的公司里,以机器学习见长的第四范式就在银行业的精准营销、资产预测、风险防控等方面做得非常出色;以机器视觉见长的旷视科技(主打产品是人脸识别系统Face++),则为传统金融及互联网金融提供了身份验证、智能门禁、员工考勤等先进的解决方案;以互联网小额信贷平台为主营业务的用钱宝公司,则利用人工智能技术建立了高质量的风控模型,大幅提高信贷业务的通过率,降低坏账率,实现了惊人的业绩增长。

以用钱宝公司为例,这家公司主打的移动端app于2015年7月才上线,短短一年半的时间,到2016年12月,用钱宝app的单月交易笔数就突破了100万。这个增长速度在金融类移动应用中是非常惊人的。用钱宝之所以能在保证风险可控的情况下高速增长,最关键的秘密只有一个——用机器学习技术自动分析包含大量强特征和弱特征的数据,自动判断交易风险。

传统信贷风控经常使用一种叫作“风险评分卡”的数学模型,这个模型依赖于大量以非0即1的形式存在的强特征,综合计算一个客户的风险等级。这样的传统数学模型考虑的因素少,对现实风险的拟合非常简单,难以直接迁移到强特征不明显的互联网金融客户上。

如果把一个人的数据比作一座冰山,那么强特征数据仅是冰山的一角,之下还存在海量的弱特征数据,例如电商数据、设备数据、位置数据、行为数据等。同时,作为百业之母的金融行业与整个社会存在巨大的交织网络,本身沉淀了大量有用或者无用数据,其中包括各类金融交易、客户信息、市场分析、风险控制、投资顾问等。这些数据单位都是海量级,且大量数据又以非结构化的方式存在,无法转换成传统模型可有效分析的数据。

以深度学习为代表的人工智能算法所要做的,就是充分挖掘并有效地利用这些海量弱特征数据,建立起更加符合真实世界规律的数学模型。虽然无法凭借其中少数几条数据就做出借贷决定,但如果把几百个甚至几千个维度的数据综合起来,就可以训练出有效的风控模型,并以此为风控依据为用户做出借贷决定。

在人工智能技术的驱动下,用钱宝等新型金融应用可以在大大减少人工劳动的同时,大幅提高效率,降低成本。未来的金融科技必将是互联网与AI的有机结合,由此产生的智慧金融服务将成为每个人生活的重要组成部分。

AI科学家的土豪人生

金融市场上,用人工智能技术自动建立预测模型,自动进行量化交易来赚钱,是许多数学天才和计算机科学家都热衷的研究方向。

其实,科学家与金钱的关系,本身就是个值得探讨一辈子的有趣话题。现如今,真正有才的人工智能科学家凤毛麟角,能被谷歌、Facebook、百度等顶级公司抢来抢去的顶级科学家,年薪动辄几百万美元。这在普通码农眼里,已经是非常高的收入了。但如果说,最聪明的计算机科学家可以在金融市场上轻松收入几十亿美元,这样的财富神话,你会相信吗?

还记得此前提到过,我在做语音识别的时候,是受到IBM一位叫彼得·布朗的师兄的启发,才走上统计学道路的吗?我们现在就来说说这个彼得·布朗的故事。

当时,在IBM研究中心,鉴于统计学方法在语音识别领域的成功,彼得·布朗和他们这个研究小组的同事们基本都“归顺”了统计流派。这个小组的许多人后来一直从事语音识别研究,可彼得·布朗不是在一个领域一耗若干年的那种人。这个组里还有另一个不安分的人,他的名字后来经常与彼得·布朗并列,他叫罗伯特·默瑟(Robert Mercer),通常人们也称他为鲍勃·默瑟(Bob Mercer)。

鲍勃比彼得年长,1972年就加入了IBM研究中心。鲍勃和彼得玩腻了语音识别,就开始去弄机器翻译。反正是人工智能领域的几大难题之一。这一下,还真捅了马蜂窝。要知道,在20世纪八九十年代,语音识别和机器翻译在经典人工智能科学家的心里,地位是有天壤之别的。

语音识别,不就是听见啥输出啥,一个听写机器而已嘛。符号语言学的方法在语音识别上派不上用场,统计学方法大放异彩,那完全是因为问题本身就不属于高级智能的范畴。机器翻译?那可是要理解原文语法、语义,然后转换成目标语言的语法、语义的。论智能程度,语音识别是两三岁孩子的水平。跨语种翻译?那可是许多翻译大家皓首穷经,一辈子也难以企及的高远境界。这玩意儿绝对算得上是高级智能,是人类智慧的精华,要用计算机来解决翻译问题,非得懂得人类思想方法,懂得语言学不可。

鲍勃和彼得这两个浑身码农味道的研究员,居然要用什么概率统计方法来解决机器翻译问题,这真是要被语言学家们笑掉大牙的。这故事的结局大家肯定猜得到,鲍勃和彼得带领的机器翻译小组只用了很短的时间,就建立了一套可以运行的,基于大语料统计模型的机器翻译系统,居然得到了不算太糟的结果,至少,那结果比经典语言学方法得到的结果更接近人类语言,更让用户信服。从那以后,成功的机器翻译系统比如谷歌翻译走的都是统计模型的道路(今天更是在统计模型的基础上增加了深度学习这个高级武器)。鲍勃和彼得的工作并不复杂,但他们在机器翻译领域的贡献直到许多年后还有人记得。2014年,计算语言学会议给鲍勃·默瑟颁发了终身成就奖。