复盘百度AI十年历程:属于百度AI的时代已经启幕

2021-03-26 网络
浏览
[人工智能]复盘百度AI十年历程:属于百度AI的时代已经启幕

3月23日的演讲中,李彦宏将回港上市界说为百度的“二次创业”。

对于百度来说,“二次创业”的说法绝非虚辞。2005年冲刺纳斯达克时,百度照样一家纯粹的搜索引擎企业;时隔十六年后辅助百度叩开港交所大门的,则是深耕了十年之久的人工智能,百度已经彻底成为一家AI生态型企业。

犹记得在2019年5月举行的第二届数字中国建设峰会上,李彦宏在论述百度AI的愿景时打了一个形象的譬喻:“互联网是前菜,它的特点是快;人工智能才是主菜,需要温火慢炖,但营养厚实。未来没有一家企业可以声称与人工智能无关,吃不到这道主菜,将失去一个时代。”

借着百度二次上市的契机,似乎有需要重新梳理下百度AI的十年历程,若何从不被外界注重的新事物,逐步蜕变为百度的第二增进引擎,并辅助百度提前锚定了人工智能时代的市场站位。

鉴于篇幅的缘故原由,本文主要分为四个章节。

01 育种

2009年,神经网络专家Hinton和他的两个研究生将神经网络应用于语音的声学建模,与行业内盛行了30年的尺度工具一较高下,在小词汇量延续语音识别数据库TIMIT上,获得了语音识别竞赛胜利。

于是深度学习像是打开了闸门的洪水,迅速从语音识别、图像识别延伸到机械翻译、语义明白等领域,极短的时间里就成了学术圈的主流。彼时中国互联网还处于PC时代,流量盈利犹在,太平洋对岸的热闹未能触动太多企业,人工智能的应用还只是停留在科幻影戏里的虚幻场景。

百度可能是海内最先“醒悟”的互联网巨头,在2010年头率先确立了“自然语言处置部门”,只管最初的目的是为了服务搜索中发生的智能化需求;接下来不停在语音、图片等手艺上结构,并敲定了在知识图谱手艺上耐久投入的战略。

到了2012年的时刻,百度的AI战略已经开端成型,陆续确立了深度学习研究院IDL、人工智能实验室。2014年百度最先涉足智能驾驶领域,先后推出了深度语音系统、百度大脑、度秘、 Apollo 自动驾驶平台等手艺系统,涉及自然语言处置、机械翻译、语音、视觉、机械学习、深度学习、知识图谱等焦点手艺。

也正是从2010年最先,百度的研发用度进入稳步增耐久。研发投入在营收中的占比,从早期的不足10%跃升到 2020 年的 21.4%,十年间的累计研发用度高达 1023 亿元。甚至有好事者举行过这样一组对比:2010年进武士工智能后,百度的营收增进了14倍,研发用度的增进却跨越25倍。

上千亿的研发资金似乎并未直接利好百度的营收,但带来了远比一时的利润更有价值的硬实力:

凭证国家工业信息平安生长研究中央宣布的《2020人工智能中国专利手艺剖析讲述》,在人工智能专利申请量和授权量方面,百度以9364件专利申请和2682件专利授权位居第一,并在深度学习、智能语音、自动驾驶等领域占有首位。

仅在2020年时代,百度被国际AI顶会收录的论文到达260多篇,在CVPR、ECCV、NeurIPS、INTERSPEECH等全球顶级的人工智能学术集会或相关竞赛上,百度AI问鼎冠军近30次,斩获了100多个行业权威奖项。

沉甸甸的数字背后,百度就像是一位劳作在田间地头的“育种师”,亲手开拓了一块又一块的试验田。在外界着迷于追逐风口疯狂扩张的时刻,百度的速率看起来有些“落伍”,但育种师清晰的知道这些种子的价值在那里

02 散播

2016年,人工智能的浪潮终于走出学术圈。在某场著名的公关事宜后,人工智能逐渐成为人人茶余饭后的谈资。或许许多人对人工智能的应用依旧生疏,但人工智能的进化速率彻底刷新了人们的传统认知。

原本痴迷于移动互联网船票的中国企业逐渐意识到,属于人工智能的时代已经不再遥远,倘若和新的手艺浪潮失之交臂,效果可能是灾难性的。现实的残酷在于,凭证第一财经等主流媒体的报道,中国AI人才的缺口可能有500万的规模,并将随着人工智能的产业化历程逐年增进。

百度最先有意调整自己的姿态,从默默深耕的“育种师”,思索怎么将前沿的人工智能手艺散播出去,阻止重复造轮子等问题。

2016年9月的百度天下大会上,集视觉、语音、自然语言处置、知识图谱、深度学习等手艺于一体的百度大脑正式对外开放,而且每隔一段时间就会举行迭代,互助同伴可以直接挪用百度AI的焦点能力。

同样是在2016年,百度主导的深度学习框架PaddlePaddle(飞桨)上线,涵盖了深度学习焦点训练和推理框架、基础模子库、端到端开发套件和厚实的工具组件,填补了中国开源深度学习框架的空缺。

在云盘算的战场上,百度率先提出了“ABC”战略,将人工智能(AI)、大数据(Big Data)和云盘算(Cloud)融合在一起,将视觉、语音、语义明白等善于的AI能力通过云盘算服务带到了企业级市场。

即即是不被外界重视的人才培育方面,百度在2016年与西安交通大学团结开设了人工智能班,与中科院大学在人才培育、科学研究、数据开放、资源共享等方面杀青互助,开启了产学研一体化的篇章。

数据再一次证实晰百度的远见。

现在百度大脑已经对外开放270多项AI能力,日挪用量跨越1万亿次;百度飞桨凝聚了265万开发者、服务了10万家企业、确立了跨越34万个模子;停止到2020年底,百度总计为社会培育了跨越100万AI人才……

加倍有说服力的是百度创新的营业孵化。2016年之前百度的营业主要集中在移动互联网的领域,现在已经形成了以AI为焦点的生态结构。好比信息流已经是百度移动生态的焦点组成,小度的月交互次数已经到达75亿次,Apollo旗下的Robotaxi和Robobus在海内多个都会接待的搭客数目已经跨越21万。