斯坦福全球AI报告:人才需求两年暴增35倍,中国机器人部署量涨500%
发表时间:2018-12-14 14:37

刚刚,斯坦福全球AI报告正式发布。


从去年开始,斯坦福大学主导、来自MIT、OpenAI、哈佛、麦肯锡等机构的多位专家教授,组建了一个小组,每年发布AI index年度报告,全面追踪人工智能的发展现状和趋势。


“我们用硬数据说话。”报告的负责人、斯坦福大学教授、前任谷歌首席科学家Yoav Shoham谈到这份最新的报告时表示。


今年的报告,从学术、工业、开源、政府等方面详细介绍了人工智能发展的现状,并且记录了计算机视觉、自然语言理解等领域的技术进展。


报告要点:


一、美国AI综合实力最强


  1. 美国的AI论文发布数量虽然不是第一,但美国学者论文被引用的次数却是全球第一,比全球平均水平高出83%。


  2. 2018年美国AI创业公司的数量,比2015年增长2.1倍。而从2013年到2017年,美国AI初创企业获得的融资额增长了4.5倍。均高于平均水平一倍以上。


二、中国AI追赶速度惊人


  1. 清华2017年学AI和机器学习的学生数量,是2010年16倍。


  2. 70%的AAAI论文来自美国或中国,两国获接收的论文数量相近,但中国提交的论文总量比美国多30%。


  3. 基于经同行评议论文数据库Scopus的数据,2018年发布AI论文最多的地区是欧洲(28%)、中国(25%)和美国(17%)。


  4. 与2000相比,2016年中国AI学者论文被引用的次数,提高了44%。


  5. 中国一年的机器人部署安装量,从2012到现在增长了500%。ROS.org来自中国的访问量,2017年比2012年增加了18倍。


三、全球AI发展提速但仍不均衡


  1. 2017年,全球ML人才需求已经是2015年的35倍。


  2. 整体来说,自2016年以来,美国、加拿大、英国政府在国会/议会会议中对人工智能和机器学习的提及激增。

  3. 80%的AI教授是男性,统计数据来自UC伯克利、斯坦福、UIUC、CMU、UC London、牛津和苏黎世联邦理工学院。


  4. 美国AI工作岗位的应聘者中71%为男性。




看过这份报告之后,人工智能大牛吴恩达总结了两点:1、AI正在快速发展,不管是学术界还是工业界都是如此。2、AI的发展仍不均衡,在多样性、包容性方面仍需努力。

以下是这份报告的主要内容:


AI论文情况分析


发表总量增长迅猛


2.jpg


从1996年到2017年,CS领域的年发表论文增长了约五倍 (6x) ,AI领域的年发表论文增长了约七倍 (8x) 。对比一下,所有学科的年发表论文总量增长了不到两倍 (<3x) 。

划重点,AI论文的年发表量,比CS论文增长要快。


各地区AI论文发表情况


3.jpg


2017年,Scopus上面的AI论文,有83%来自美国以外的地方。具体数据是,28%来自欧洲,25%来自中国,17%来自美国。

从2007年到2017年,中国的年发表AI论文数增长了150%。


细分领域论文发表情况


4.jpg


2017年发表的AI论文中,有56%来自机器学习与概率推理这一研究方向。


对比一下,2010年发表的AI论文,只有28%来自这个方向。


另外,图表里显示的大部分研究方向,在2014-2017年间,复合年均增长率 (CAGR) 比2010-2014年要高。


比如,神经网络这一方向的论文发表数量,2014-2017年之间,复合年均增长率达到37% (如图中红色曲线) ,最为突出。


做个对比,在2010-2014年之间,神经网络论文发表数,复合年均增长率仅有3%。


arXiv论文




自2010年以来,arXiv论文总体呈现迅速增长,从2010年发布的1,073篇,到2017年发布的13,325篇,增长超过11倍 (12x) 。许多细分领域也呈现增长。


这表示,论文作者们倾向于把自己的研究成果传播出去,不论是经过同行评审还是在AI会议上发表的论文。这也体现了,AI这个领域竞争激烈的特质。


在细分领域中,计算机视觉 (CV) 是自2014年起增长最快的一个 (上图蓝色曲线) ,从1,099篇增长到2017年的4,895篇,涨幅近400%。


AI论文引用量




FWCI是领域权重引用影响系数,可以用来衡量论文的影响力。

报告重新定义了一种“改装版” (Re-based) 的FWCI,不按地区,而按世界平均值,来计算影响力。


在这个标准之下,虽然欧洲发表的AI论文数高于中国和美国,不过论文影响力曲线比较平缓;相比之下,中国发表的论文影响力增长剧烈:与2000年相比,2016年平均每位中国AI论文作者的引用率增长了44%。


不过在这方面,美国依然全球领先,美国AI论文作者的平均引用率,比世界平均值高出83%。


AAAI论文




AAAI 2018,提交论文,中美占70%,中选论文,中美占67%。

中国的论文提交数高出美国约1/3,但二者中选论文数相差无几,中国入选265篇,美国入选268篇。


高校AI课程注册情况





AI和ML进军高校的速度提升了不少。


报告显示,截止到2017年底,AI课程注册人数是2012年的3.4倍,ML课程注册人数是2012年的5倍。


其中,UC伯克利的ML课程的注册人数增长最快,是2012年的6.8倍,但此数值较2016年增长速度有明显下降。




报告进一步统计了非美国地区院校AI+ML课程注册人数的变化。结果显示,清华是非美国院校外增长率最高的高校,几乎是第二名多伦多大学的2倍。


纵向对比来看,清华2017年AI+ML课程注册人数是2010年的16倍。


学术会议热度




在大型会议中,NeurIPS (曾用名NIPS) 、CVPR和ICML,是参与人数最多的三大AI会议。自2012年以来,论参与人数的增长率,这三者也领先于其他会议。

NeurIPS和ICML参与人数增长最快:将2018年与2012年相比,NeuRIPS增长3.8倍 (4.8x) ,ICML增长5.8倍 (6.8x) 。


上面讨论的是大型会议,但小型会议的参与人数同样有明显的增长,甚至可以比大型会议的增长更加明显。




这里最突出的是,ICLR 2018的参会人数达到了2012年的20倍。

原因很可能是近年来,AI领域越来越关注深度学习和强化学习了。


AI创业投资情况




从2015年1月到2018年1月,人工智能创业公司的数量增长到了原来的2.1倍,而所有活跃的创业公司增长到了原来的1.3倍。

大多数情况下,创业公司的增长都保持相对稳定,而人工智能创业公司呈指数级增长。


在风投资金方面,从2013年到2017年,人工智能领域的风投资金增长到了原来的4.5倍,而所有的风投资金只增长到了原来的2.08倍。这些数据都是年度数据,不是逐年累积的。

图表中有两个高峰期,1997-2000年风投资金的激增,对应的是网络泡沫时期。2014-2015年出现了一个较小的增长,因为当时正处于一个相对较大的经济增长时期。


人才需求


报告显示,近几年,社会需要的AI相关人才大幅度增加,目前对有ML技能的人才需求最大,其次是深度学习。



可以看出,ML人才需求也是这两年增长速度最快的。


报告统计,2017年,全球ML人才需求是2015年的35倍,从2016年到2017年的增幅尤为明显。全球对AI人才的需求在2016年骤增。


专利


2014年,大约30%的人工智能专利发明人来自美国,其次是韩国和日本,各拥有16%。


在韩国和中国台湾地区,专利的增长速度较快。2014年人工智能专利的数量几乎是2004年的5倍。


财报电话会议中提及AI和ML的次数



2015年,科技公司在财报电话会议中提及AI和ML的次数开始有所增加。


2016年,其他行业提及AI次数才开始增长。

相比之下,科技行业的公司提及AI和ML的次数远比其他行业多。



在财报电话会议中,除了科技行业之外,提及AI次数最多的公司,基本上分布在消费、金融和医疗保健行业。


机器人安装量



2012年到2017年,中国机器人年安装量增长了500%,其他地区,比如韩国和欧洲,分别增长了105%和122%。


在安装量较小的地区中,中国台湾比较突出,在2012-2017年增长最快。

开源框架GitHub标星数




各框架的标星数反映着他们在开发者群体中的流行程度。不过,因为开发者们日常不会“取关”GitHub项目,所以这些星星都是多年来积攒下的。


我们可以明显发现,TensorFlow的受欢迎程度在开发者中遥遥领先、稳步增长。




排除了第一热门,第二名和第三名分别是scikit-learn和BVLC/caffe。


TensorFlow官方力推的keras排到了第四,但近一年来几无增长势头。


另外两大热门PyTorch和MXNet分别排到了第七和第六,尤其是PyTorch,作为一个年轻的框架,自2017年初发布以来至今,GitHub标星数至少增长了4倍。获取新用户的势头很猛,不知道其中有多少被TensorFlow逼疯的人类。


各类任务最新成绩


这个部分分为CV和NLP两块,分别列举了各主流任务从发展之初到现在的成绩进步情况。


ImageNet图像识别准确率




2017年是ImageNet比赛的最后一届,2018年这项比赛就不再进行了。不过,验证集依然有人在用。


图中,蓝色的线条为ImageNet挑战赛历年的成绩变化,由于每年比赛所用的数据不同,旁边多了一条黄色线条,是以ImageNet 2012验证集为评价标准绘制的。


可以看出,到2015年,机器在图像分类任务上的能力已经明显超越了人眼,而即使比赛不再继续,学术研究者依然在认真推进该任务的表现。


这也侧面说明,如果一项工作有了明确的评价标准和固定的挑战内容,研究者们围绕此竞争,更容易让技术在该领域取得突破。


ImageNet训练速度




这张图是训练ImageNet图像分类神经网络所需时间的历年变化(当然,是买得起足够计算资源的人和机构所用的时长)。


从2017年6月的1小时,到2018年11月的4分钟,ImageNet图像分类神经网络的训练速度提升了16倍,除了硬件方面的贡献,算法上的提升也不容小觑。


图像分割COCO




ImageNet挑战赛“退休”之后,CV领域的朋友们就把重点放在了微软的COCO,挑战语义分割和实例分割。


四年来,COCO数据集上图像分割挑战的精确度已经提升了0.2,2018年的成绩比2015提升了72%。不过,目前还没有超过0.5,这一项还有充足的进步空间。


另外值得一提的是,COCO比赛近年来占据冠军位置的多是来自中国的公司,包括旷视、商汤等计算机视觉独角兽日常包揽数个项目的冠军。


语法分析(Parsing)




在确定句子结构这种语法分析的任务上,2003年到2018年的15年间,AI的表现(F1 Score得分)提升了将近10%。


机器翻译




在机器翻译任务上,报告拿英语-德语互相翻译举例,评估了AI模型在经典机器翻译评估算法BLEU标准中的表现。


报告显示,2018年英语转德语的BLEU评分是2008年的3.5倍,德语转英语成绩是2008年的2.5倍。


机器问答:AI2 Reasoning Challenge(ARC)




在问答领域,AI表现进步更明显,可以按月计数了。


报告统计了2018年从四月到11月间,AI在ARC推理挑战赛上成绩的变化:简单组得分从63%提升到69%,挑战组得分从27%提升到42%。


这些,都仅是半年间的进步。


机器问答:GLUE




同样用于机器问答的GLUE基准(General Language Understanding Evaluation)推出至今只有7个月的时间,但目前的表现已经比半年前提升了90%。


GLUE的推出者、纽约大学助理教授Sam Bowman说,虽然围绕GLUE的大型社区还没有出现,不过已经有了像谷歌BERT这样的代表性技术用了GLUE基准,面世一个月内已经被引用8次。在EMNLP会议中,GLUE时常被讨论,可能会成为语言理解领域中的一个基准线。


政府提及






整体来说,自2016年以来,美国、加拿大、英国政府在国会/议会会议中提及人工智能和机器学习的次数激增。

2016年之前,机器学习很少被提及,与人工智能相比,机器学习在总提及量中只占很小的一部分。


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平亚博体育app官方下载。


分享到:
联系手机:15930166008
联系电话:0311-85391456
联系地址:石家庄市长安区平安大街与光华路交口荣盛城市广场23A
联系我们
扫一扫,关注我们
阿里云
今傲科技
小云淘客
英孚教育
弹个车
天安人寿