技术解读思必驰DUI标注训练一体化平台,语音识别全场景覆盖

2021-05-19 网络
浏览
[人工智能]技术解读思必驰DUI标注训练一体化平台,语音识别全场景覆盖

坊间总会撒播些他们的段子

格子衫、双肩包、缄默且一本正经

固然,另有岌岌可危的发量(没有,不是我说的)

那只能说,这些都是表象

堪称新时代的中流砥柱

天天家住回龙观,征战新中关

全身散发出高级又内敛的气质

事实是什么塑造的?

(一切为了事情 挣钱)

小驰捕捉到一位思必驰程序员小哥哥

今天去看看

他一样平常的那些“封神级”操作!

Q:一句话形容你正在做的事情?

A:人类之光…在宇宙中央呼叫AI…横竖很Cool就对了

Q:最近有什么新功效吗?

A:你惠顾着关注我们发际线,不关注我们的精神功效,扣鸡腿…

最近宣布了DUI标注训练一体化平台,详细干啥的,来补课!↓↓↓

DUI标注训练一体化平台全场景应用,识别体验连续提升!

思必驰DUI标注训练一体化平台,让服务赋能走向能力赋能:

Q:若是我中英文掺着说,语音识别TA能听懂吗?

A:差异场景、环境下的语音识别效果若干会受噪声、专业术语、多语言夹杂影响。契合场景来提升语音识别率,自然就能准确许多。

Q:让场景识别率能连续提升,你们有什么“神技”傍身?

A:我们融进了最新的「端到端识别手艺」来提升识别准确率,通过大规模预训练模子手艺提升语音识别后处置效果。连系「增量学习」、「自动学习」、「联邦学习」和「小样本迁徙」等手艺手段,提升用户体验。同时开放「端点检测模子自训练」、「标点断句自训练」等功效,让用户自己拥有自主权,来解决现实问题。

Q:呃…

A:好,说点你能听懂的

高能,划重点!

第一,关于端到端识别手艺。

过往严酷意义上的端到端识别手艺,如基于LAS的端到端系统,虽然可以较显著地提升通用语音识其余准确率,但受限于盘算庞大、自定制语言模子手艺不成熟等缘故原由,不能大规模的商用。思必驰去年推出新一代端到端语音识别建模手艺,在实现通用识别准确率相对提升10%-15% 的同时,也提升了模子盘算速率,更可以知足快速有用的语言模子自定制。

第二,关于大规模预训练模子手艺。

要知道,语音识别系统中除了焦点的语音识别(ASR)模子部门,语音识其余后处置模子也是十分主要的,它直接影响到识别效果的可读性。思必驰语音识别系统支持「智能纠错」、「智能标点断句」、「智能口语顺滑」、「智能语义分段」、「智能语义纠错」等语音识别后处置手艺,能进一步提升语音识其余效果与可懂度。模子接纳大规模预训练模子,连系多义务学习(Multi-Task Learning)和知识蒸馏(Knowledge Distillation)方式。在降低70%以上模子规模的条件下,提升了模子效果,运算效率大幅提升同时降低了内存开销。

例如在智能集会场景中,通常转写效果是篇章段落,且多含有口语化的表达,通过我们的识别后处置功效,可以将集会转写效果整理成花样化,易读易懂的集会纪录。

第三,增量学习。

受限于深度神经网络手艺中的灾难性遗忘问题,接纳深度学习方式的ASR建模在权衡“既要保障模子原有识别效果,又要提升新的目的场景识别效果”时,通常接纳基于新旧数据夹杂训练的方式。坏处是,该方式增进了模子优化的周期,又会带来数据平安隐患。基于思必驰自研的KDF-IL增量学习方式,在语音识别优化时,可以仅用新增数据举行模子训练,缩短开发周期同时,也有用保障数据平安。 第四,小样本学习。

自研的小样本迁徙学习手艺,使用少量数据就可快速实现场景体验优化。例如使用少量带标注的文本数据,即可对标点断句模子举行优化,相对传统模式调优,节约了83%的数据量。例如,在真实的航空质检场景中,通用的标点断句模子面临特殊的专业术语和断句方式,一定会水土不平。得益于小样本迁徙学习手艺,在使用少量的标注文本情形下,即可实现F值40%左右的绝对值提升,完成体验效果从不能用到可用的转变。 最后,咳咳….(这个气氛是不是该升华了)在功效层面,我们深知差异用户的使用场景庞大多样,单靠赋能用户自主训练ASR模子不能知足需求。

我们!(升华来了)承袭以解决用户现实问题为焦点的产物理念,开放端点检测模子自训练、标点断句自训练等功效,使得用户可以通过我们的产物,完成识别系统中险些所有模块功效的自训练,最洪水平优化用户体验。

Q:啊,真不愧是“人类之光”。求问,没履历可以用吗?

A:平台确立的起点就是降低 AI 使用门槛,只要企业有数智化转型的需求,我们就能匹配提供高可用定制的模子。平台的私有化部署能力,也能将自主权交给企业自己,非AI专家都能使用,”零“学习成本。

Q:怎么互助呢?

A:平台同时知足「模块化输出」+「支持 UI可视化界面 /API输出」这两点,可以凭证营业需求天真设置,选择使用一体化平台的所有功效,或者只使用其中几个模块的功效。

Q:可以拓展使用吗?

A:固然可以,「全场景笼罩」是平台的一大优点。适用于各种行业场景,如集会办公、航空通讯、智慧医疗、都会交通、数字化门店、智慧园区、线下质检、政务、庭审等等,可以快速从当前项目复用到新项目中,形陋习模化生产定制,知足多样化的营业需求。

Q:怎么联系你们呢?

若有互助意向,请发邮件

Q: 好,不愧是气质特殊的你们!今天收获颇丰!