中国人工智能超越美国需先跨过这几座大山 中国AI杀手锏有?
中国杀手锏:海量数据和执行速度
在中国,科技公司与政府也开始展开紧密合作:比如,百度已被要求领导一家国家级深度学习实验室。讯飞牵头的国家科技部863重大专项——“基于大数据的类人智能关键技术与系统”相关研发工作也在有序进行,这是讯飞“讯飞超脑”计划的重要组成部分。
这引起了美国的担忧。有媒体报道称,美国政府官员表示,美方将采取进一步措施,限制中国企业对美人工智能的投资——百度、腾讯和滴滴等中国科技巨头以及若干中国初创企业都在美国设有AI实验室,并且为50多家美国AI公司提供资金,融资达七亿美元。
种种优势之下,尽管中国还未诞生谷歌、亚马逊、IBM这样的巨无霸AI公司,但BAT、京东都将AI作为未来重要战略,也汇聚了大批估值超10亿美元的AI独角兽,许多AI企业虽然仅仅成立一两年,大部分发展脚步已经远超他们的西方竞争对手。比如今日头条、旷视科技等等,他们在AI领域的研究和应用都已领先美国同类企业。
“考虑到在AI人才方面的巨大储备、优秀的工程师培育体系以及巨大的潜在AI市场,中国几乎肯定会成为AI领域的领导者。”李开复说。
“中国的AI公司通常有更快的迭代及执行速度。”百度金融首席科学家丁磊表示,美国人工智能在理论和基础研究领域布局已久,技术相对领先。而中国的优势在于数据资源庞大以及一些商业化场景应用方面,技术方面也追赶迅速。
过去,芯片与软件在很大程度上是依据编码产生的指令运行,这使得拥有优秀编程人才的国家占据了优势。但现在, 海量的数据和核心算法是AI发展最为重要的条件。
这是中国AI发展最大的优势。中国有世界上最大的互联网公司,且拥有搜索、社交、电商、互联网金融等很好的应用场景——微信拥有9.4亿用户,阿里拥有超过4.2亿活跃的淘宝买家,而百度是中国领先的搜索引擎,这些科技巨头引领许多其他的公司建立了庞大的数据库。
“不仅仅是在数据量上,在数据质量上也大大超过其竞争对手。”一家风险投资公司高层人士表示,目前中国网民约有7.3亿,几乎所有中国网民都使用智能手机上网,这种工具产生的数据比电脑更有价值。只需要处理日常工作,其产生的数据就能超过其他所有国家的总和。即便是在罕见疾病领域,中国也能提供足够的样本,教给算法如何识别这些疾病。
《经济学人》就举例称,中国的共享单车服务已经席卷了各大城市,它不仅提供了廉价的出行方式,而且成为了一场“数据大战”。当用户租用一辆自行车时,一些公司就会借助自行车上安装的GPS设备不断追踪它的运动轨迹。
实际上,所有AI企业现在都已深刻认识到,数据直接关系到自己的生死存亡。“AI离不开场景和数据,而金融场景里产生的海量数据,能成为人工智能的燃料。”蚂蚁金服副总裁,首席数据科学家漆远说,蚂蚁金服为此搭建了一个包含强化学习、无监督学习等技术在内的金融智能的AI系统,广泛应用于蚂蚁金服的各项业务,包括智能客服、交易风控、贷款准入和金融理财等等。从数据上看,仅仅是AI图像识别能够同时处理万级的案件量,这有望每年为行业节约案件处理成本20亿元。
同时,中国传统产业缺乏技术背景也为许多企业提供了在AI领域大展宏图的绝佳机会。比如,前百度深度学习程序设计员创立的初创企业“第四范式“(4Paradigm Data Tech),其主要业务是帮助客户开发人工智能软件,从而更有效地将客户与服务进行匹配。仅用一年时间,该公司就成功获得了包括招商银行等超过12家银行和保险业客户的合同。
几座大山还要跨越:创新+开源+人才
虽然在靠近商业价值应用层面中美并驾齐驱,但在基础性、原创性研究、创新土壤、数据开源、人才储备层面,中国相较美国还存在不小的差距。这几座大山,是中国AI能否超越美国的关键。
“国内更多是技术的落地、产业化和应用,相比国外科学家和公司,突破性和奠基性的工作还不够多。”在接受媒体采访时,地平线机器人技术联合创始人黄畅承认。
更直接一点的说法是,在AI创新上,中国与美国还存在很大差距。“我们面临的危险在于,由于我们在数据上领先,所以会停止算法上的创新。”驭势未来CEO吴甘沙说。
这种创新,在香港科技大学计算机系主任杨强看来,应该是开拓新领域的领域,而不是在原有的基础深挖。“把一个10层的深度模型拓展到100层甚至1000层,这确实是一个进步,但这些在我看来并不是一个原创。”
这个问题,引起了国内科学家的重视。中科院院士张钹就认为,在基础/算法的研究上,中国和世界顶尖水平还相差甚远,“人工智能是美国人建立的学科。现在还是美国等欧美国家在引领发展,他们在不断地创新,如果我们不重视基础/算法理论研究,不在这些领域赶上他们,会非常制约中国的创新能力,特别是原始创新的能力。”
而在提供高运算速度的的基础层(AI芯片、云计算),中国企业同样远远落后于国际巨头。“智能芯片是人工智能的根本。”清华大学微电子学研究所所长魏少军强调称。但长期以来,由于英特尔、英伟达、高通等垄断这个领域,中国的芯片严重依赖进口,部分类型的高端半导体则几乎完全依靠进口,这将决定着人工智能解决方案能否实现大规模商业化。
同样有所差距的,还有中国的云计算。尽管在国内,阿里云市占率达29.7%,超过亚马逊、微软和IBM在中国市场的份额总和,且百度云、腾讯云、华为云、网易云等“国产云”纷纷布局,但由于相关技术没有实现完全自主,操作系统和大型软件方面没有太大的优势,导致国内企业依旧处于“跟随状态”。
此外,尽管中国的科技巨头能够通过其专有平台获得海量数据,但在创建一个标准统一、跨平台分享的数据友好型生态系统方面,中国仍落后于美国。 “不过,尽管中国企业布局频繁,但对技术开源的理解不如国外企业深刻,”一位业内人士告诉记者,“在国外,无论微软、谷歌还是亚马逊,均开源了自己的平台,国内企业在这一块则相对封闭。”
当然最为更关键的还是,尖端人才的短缺。美国半数以上的数据科学家拥有10年以上的工作经验,而在中国,超过 40%的数据科学家工作经验尚不足5年 。相关数据统计,在中国目前只有不到30所大学的研究实验室专攻人工智能,输出人才的数量远远无法满足人工智能企业的用人需求。此外,中国的人工智能科学家大多集中于计算机视觉和语音识别等领域,造成其他领域的人才相对匮乏。
“中国在人工智能领域拥有不少六段、七段甚至八段的高段位棋手,但暫时还缺少九段的顶级高手。”李开复用围棋的段位来比喻这个现象时说。