第五章 机遇来临:AI先行的创新与创业(第8/10页)

概括来说,目前的人工智能产业发展面临六大挑战:

一、前沿科研与产业实践尚未紧密衔接:除少数垂直领域凭借多年大数据积累和业务流程优化经验,已催生出营销、风控、智能投顾、安防等人工智能技术可直接落地的应用场景外,大多数传统行业的业务需求与人工智能的前沿科技成果之间尚存在不小距离。面向普通消费者的移动互联网应用与人工智能技术之间的结合尚处在探索阶段。科学家和研究者所习惯的学术语境,与创业者和工程师所习惯的产品语境之间还无法快速衔接。

二、人才缺口巨大,人才结构失衡:据Linked In统计,全球目前拥有约25万名人工智能专业人才,其中美国约占三分之一。这一数量级的人才储备远无法满足未来几年中人工智能在垂直领域及消费者市场快速、稳健增长的宏观需求。人才供需矛盾显著,高级算法工程师、研究员和科学家的身价持续走高。人才结构方面,高端人才、中坚力量和基础人才间的数量比例远未达到最优。

三、数据孤岛化和碎片化问题明显:数据隐私、数据安全对人工智能技术建立跨行业、跨领域的大数据模型提出了政策、法规与监管方面的要求。各垂直领域的从业者从商业利益出发,也为数据的共享和流转限定了基本的规则和边界。此外,许多传统行业的数据积累在规范程度和流转效率上还远未达到可充分发挥人工智能技术潜能的程度。

四、可复用和标准化的技术框架、平台、工具、服务尚未成熟:虽然Tensor Flow、Caffe、MXNet等深度学习框架已被数以万计的研发团队采纳,相关开源项目的数量也在飞速增加,但一个完整人工智能生态所必备的,从芯片、总线、平台、架构到框架、应用模型、测评工具、可视化工具、云服务的模块化与标准化工作,尚需3年或更长时间才能真正成熟。

五、一些领域存在超前发展、盲目投资等问题:目前的人工智能技术只有在限定问题边界、规范使用场景、拥有大数据支持的领域才能发挥最大效能。但创投界存在盲目追捧,不顾领域自身发展程度,或利用人工智能来包装概念等现象。由此产生的盲目创业和投资问题虽非主流,但仍有可能阻碍整个行业的健康发展。

六、创业难度相对较高,早期创业团队需要更多支持:与互联网时代、移动互联网时代的创业相比,人工智能创业团队面临诸多新的挑战。例如,对高级人才较为依赖,科学家创业者自身的商业实践经验较少,高质量大数据较难获得,深度学习计算单元和计算集群的价格十分昂贵,等等。

AI是中国创新、创业的最好机会

如前所述,AI创业既客观存在局部过热的泡沫,也有巨大的潜能尚待挖掘。总体来说,目前的人工智能大格局中,机遇是主旋律,泡沫和危机是必须克服的局部挑战。这一格局在全球如此,在中国亦如此。

而且,若专就中国AI创业环境来说,人工智能更是助力中国科技腾飞的最好机会之一。互联网和移动互联网时代,中国科技精英已经用淘宝、微信、摩拜单车等“中国创新”让世界看到了我们的创造力和执行力。人工智能时代,中国的人才优势、市场优势、资金优势、坚持多年创新的商业模式优势等,都是人工智能最好的生长土壤。如果措施得当,行动高效,中国甚至有可能借人工智能技术全面占据信息科技的制高点,在创新、创业领域真正成为引领者而不是跟随者。

AI领域,中国人/华人已是科研中坚

2016年,美国白宫发布的《国家人工智能研究与发展策略规划》报告从Web of Science核心数据库里查询提到“深度学习”或“深度神经网络”的文章,统计其数量变化趋势。报告说,从2013年到2015年,SCI收录的论文里,提到“深度学习”的文章增长了约6倍,同时强调:“按文章数计算,美国已不再是世界第一了。”

美国不是世界第一?谁是世界第一呢?报告指出,中国发表的相关论文数量在2013年及以前还落后于美国,而在2014年和2015年,中国的相关论文数量就跃居世界第一。如果只统计论文数量,中国在AI研究领域,已经是不折不扣的领跑者了。

白宫《国家人工智能研究与发展策略规划》中的数字统计,其实还是存在一些技术上的问题,比如,直接搜索关键字“深度学习”“深度神经网络”,是否真的能涵盖这些年人工智能领域的所有科学研究进展?统计论文数量时,是否要考虑论文所发表期刊的影响因子,以便衡量论文的重要程度?

创新工场使用更严格的条件,只统计Web of Science核心数据库中SCI影响因子较高的人工智能期刊中的论文,并在主题上涵盖人工智能相关的所有科研领域,做了一次独立的数据分析。

根据创新工场的统计,在2006年到2016年的时间段里,近两万篇顶级的人工智能文章中,由华人贡献的文章数和被引用数,分别占全部数字的29.2%和31.8%。近10年,华人用五分之一左右的作者人数,平均贡献了三成的顶级AI研究文章和被引用数。从统计角度来看,这已经是超出平均水平的科研贡献了。

图59 华人在人工智能研究领域的贡献占比

从变化趋势看,2006年到2015年,华人作者参与的顶级AI论文,占全部顶级AI论文数量的比例,从23.2%逐年递增到42.8%。而华人作者参与的顶级AI论文被引用次数,占全部顶级AI论文被引用次数的比例从25.5%逐年递增到55.8%。

图60 华人在人工智能研究领域贡献的变化趋势

举例来说,《IEEE模式分析与机器智能汇刊》(IEEE Transactions on Pattern Analysis and Machine Intelligence,简称PAMI)在2006年到2016年,引用数很多的前500篇顶级的人工智能论文中,作者一共1220人,其中华人科学家、研究者316人,占25.9%。所有作者单独累加计算的被引用数总和是231361次,其中,华人科学家、研究者被引用数总和是63846次,占27.6%。如果单看2014年(当年华人的文章数、引用数均较高)的数据,华人科学家、研究者被引用数占51.8%,超过了半数。

也就是说,即便只统计顶级出版物里的顶级文章,中国人/华人在人工智能领域的贡献,在发展趋势上也和白宫报告中揭示的规律一致——无论从哪个角度来说,中国人/华人正在人工智能领域里发挥举足轻重的作用,而且,从2014年和2015年开始,中国人/华人已经处于人工智能研究的领先地位,占据了人工智能科研世界的半壁江山!