AAAI 2020 开幕:百度28篇论文入选 涉及NLP、机器学习、视觉等领域

2020-02-11 网络
浏览
[人工智能]AAAI 2020 开幕:百度28篇论文入选 涉及NLP、机器学习、视觉等领域

立春刚过,人工智能行业迎来2020年的第一个顶级学术大会,2月7日,AAAI 2020在美国纽约拉开了帷幕。本届大会百度共有28篇论文被收录,较AAAI 2019的15篇当选效果提拔近一倍,本次当选论文触及机械进修、自然语言处置惩罚计算机视觉等多个范畴,原计划有多位百度重量级科学家、研讨者将受邀赴会宣布演讲。受疫情影响,浩瀚中国学者将缺席本次大会,百度作为中国人工智能行业“头雁”,经由过程主动的长途介入,向天下展现手艺、学术才能,提振中国AI开年自信心。

自1979年建立至今,AAAI已举行34届,大会汇集了环球顶尖的人工智能范畴专家学者,可谓是人工智能行业的科研风向标。本届集会共收到的有用论文投稿凌驾8800篇,个中7737 篇论文进入评审环节,终究登科数目为1591篇,登科率为20.6%。个中百度当选28篇论文,再创百度参会当选论文数汗青新高,这一效果在环球局限中也处于第一梯队。此次当选的28篇论文掩盖机械进修、自然语言处置惩罚、计算机视觉等范畴,完成了在数目上和研讨方向的双向打破,立异科研才能可见一斑。

在NLP预练习范畴,百度当选论文《ERNIE 2.0: A Continual Pre-training Framework for Language Understanding》也被选做Oral举行展现。ERNIE 2.0是延续进修的语义明白框架,该框架可以增量地进修海量数据中的学问,延续提拔语义明白效果。在ERNIE 2.0中,学问可经由过程预练习使命的情势加入到练习框架,每当引入新使命时,该框架可在进修该使命的同时,不忘记之前学到过的信息。基于该框架,ERNIE 2.0模子经由过程定名实体展望、句子排序构造重修、语义逻辑关系展望等预练习使命,从大规模练习数据中猎取到词法、句法、语义等多个维度的学问,大幅提拔了通用语义明白程度。

ERNIE 2.0同现有的预练习模子在英文数据鸠合GLUE和9个中文使命上举行了试验。 模子在英语使命上险些周全优于之前的SOTA模子BERT和XLNet,在7个GLUE使命上取得了最好的效果;中文使命上,ERNIE 2.0模子在一切9个中文NLP使命上周全优于BERT。客岁 12月,基于ERNIE 2.0革新的模子在GLUE上初次打破90大关,逾越人类基线3个点拿到环球第一。

机械浏览明白范畴,百度当选论文《A Robust Adversarial Training Approach to Machine Reading Comprehension》,议论了机械浏览明白模子面对匹敌进击时的效果鲁棒性问题以至安全问题。经由过程人工体式格局发明、总结并生成用于练习匹敌样本的体式格局会发生须要人工介入的瑕玷,且不大概经由过程划定规矩的体式格局枚举出一切大概的匹敌样本范例及其划定规矩。针对此,论文提出一种模子驱动的体式格局,运用自动匹敌的要领无需人工介入,可以自动地发明未视察过的匹敌样本范例并终究提拔浏览明白的效果鲁棒性。

该要领可以简朴地划分为三个步骤:(1)对每一个练习样本我们应用匹敌的要领生成一个滋扰向量输入,使得它可以误导当前的浏览明白模子;(2)采纳贪婪战略从滋扰向量的辞汇权重中采样取得对应的离散化的滋扰文本;(3)运用滋扰文本构建用于练习的匹敌样本,并从新练习浏览明白模子并反复上述步骤直至收敛。

经试验考证,运用上论文中的匹敌练习要领后,在差别的匹敌数据集上均有异常明显的效果提拔。并发明论文提出的模子驱动的要领确切可以生成多样性越发雄厚的匹敌样本,从而补充人工划定规矩的不足。同时也发明运用该要领生成的匹敌样本case依然较为芜杂,并不具有很好的流畅度以至完整不是自然语言,因而当前匹敌生成的要领依然有较大提拔空间。

在计算机视觉范畴,百度当选论文《ZoomNet: Part-Aware Adaptive Zooming Neural Network for 3D Object Detection》,并选为oral举行展现。该论文提出了一个全新的双目3D检测框架ZoomNet,经由过程奇妙的应用自适应缩放来下降远距离的深度预计偏差,以及进修部位特性来进一步进步3D检测的表现。在主流的KITTI数据集3D检测使命上,ZoomNet在考证集上的均匀精度(IoU阈值为0.5)凌驾Pseudo-LiDAR(CVPR19)近10个百分点。关于远距离(>40m)的车辆,3D检测精度比Pseudo-LiDAR高了120% 。

论文示意,关于每一个实例,ZoomNet在猎取摆布边境框后,起首对该实例在2D上做细粒度的剖析。然后,2D上的远景像素点会被投影到3D空间中用于位姿的回归。为了充分应用RGB图象中雄厚的纹理提醒来举行更正确的视差预计,ZoomNet引入了一个观点简朴的模块——自适应缩放,该模块同时将2D实例边境框的大小调解为一致的分辨率,并响应地调解了相机的固有参数,以实现从调解分辨率后的图象中预计出更高质量的视差图,以及对差别深度的实例构建类似密度的点云。另外,论文还提出经由过程进修实例的部位特性来进步对遮挡的鲁棒性,极大的进步了3D检测的机能。

当选论文数目的增添可以看出百度AI的学术才能已取得国际承认,而在手艺研发、产业落地等方面,百度AI更是拿出实打实的“效果单”。

在过去一年中,百度深度进修平台——百度飞桨,累计效劳150多万开发者,宣布模子到达16.9万个,成为中国首个也是目前国内唯一开源开放、功用完整的产业级深度进修平台;百度大脑已升级成“软硬一体AI大生产平台”,对外开放240项中心AI才能,效劳凌驾150万开发者,日均调用量打破1万亿次,语音、人脸、NLP、OCR 调用量中国第一;百度 Apollo已跑入23个都市,测试里程已打破300万公里,智能驾驶专利1237项,位列全国第一;停止2019年6月,搭载小度助手的智能装备激活数目已打破4亿台,小度助手语音交互凌驾36亿次,前三季度,小度有屏音箱出货量稳居环球第一。

百度作为AAAI 2020的金牌赞助商,在周全展现论文研讨成果的同时,百度展台现场也非常火爆,现场交换者浩瀚,宣传材料已被“抢光”。