声音定制三天交付,深声科技如何在语音AI赛道弯道超车?

2020-01-13 网络
浏览
[人工智能]声音定制三天交付,深声科技如何在语音AI赛道弯道超车?

自2015年入手下手,中国人工智能市场范围逐年爬升,2018年中国人工智能市场范围约为238.2亿元,增长率到达56.6%,据预测,到2020年,中国在人工智能的市场范围将靠近500亿元。

“语音是AI智能时期的重要进口,”深声科技创始人周俊明说。他的底气来自多年的行业积聚和互联网产物开发履历。

2012年,周俊明从中科院计算所博士毕业,顺遂进入广电行业龙头企业北京永新视博担负高等算法工程师,重要担任音视频算法事情;2013年,他依附音视频算法手艺才能,被腾讯选中,故任职于此,继承处置在线音视频算法手艺研发事情;2016年,他加入了欢聚时期,担负音视频手艺总担任人,率领国内顶级音视频团队,为YY供应中心手艺效劳和手艺创新计划。

2018年,周俊明和中心团队成员配合创办了“深声科技”,一家智能语音手艺效劳商,重要经由过程基于深度进修的笔墨转语音团体解决计划效劳B端客户,进步客户在行业内的协作壁垒,辅佐客户构成独占的协作上风。据悉,建立不到半年,深声科技就获得了来自小米科技的数千万元天使轮融资。

AI行业从不缺协作对手,BAT等头部大企业有强者的打法,始创企业也有本身弯道超车的战略。深声科技在多年的实践探索发明,以往客户在语音合成中最体贴的是信息的通报。但随着物质生活的不断进步,客户关于语音转化真实感的需求也日趋剧增,催生了拟人声智能营销、拟人互动、拟人陪同等大范围商业化运用场景和代价。基于此逻辑,深声科技在商业模式方面主打三大场景:语音内容输出、智能语音交互、智能客服营销

个中,内容输出营业是深声科技重点推动的主线营业,团队重要经由过程与有版权IP的企业协作,以有声浏览的体式格局将深声语音显现给消费者,内容涵盖文学、动漫、新闻资讯等多种题材和范例。依据深声科技供应的数据显现,深声现在已与十余家行业头部的内容版权企业杀青协作,一方面为企业供应笔墨言语转化东西,按字数收费;另一方面,供应语音合成团体解决计划,配合开发版权IP的语音情势。

语音交互营业中,团队依托投资方小米的资本及产物,重点效劳智能语音音箱和车联网企业,为其供应语音合成、数据制作和人机交互等效劳,辅佐客户在产物开发过程当中精准感知用户需求,加强行业协作上风。

智能客服营销营业是深声科技正在尝试的场景,深声科技重要辅佐运营商和金融客户定制声响并合成声响,使其在营销过程当中进步通话时长和营销转化率。谈及看好语音交互和智能客服营销这两类客户群体的原因时,周俊明通知创业邦,这两类客户关于语音音质的请求更高,经由过程深声科技本身语音合成手艺的上风能很快发生范围化效应,且这两类客户群体的历久付费才能更强。

从时候的维度上看,深声科技比拟科大讯飞、商汤科技等AI企业入局较晚,但团队正在抓紧营业规划,构建本身手艺壁垒。起首,基于端到端的语音合成手艺逻辑,深声科技会对收集到的原始语音举行自动标注,再由声学模子算法对言语和语音举行音素级特性对齐,能够完成完整拟人发声,将语气、腔调、语速、抑扬顿挫等语音特性圆满显现。在Blizzard Challenge 2019 国际语音合成大赛中,该手艺在PER(拼音-不包括音调-错误率)和PTER(拼音-包括音调-错误率)两个指标上优于科大讯飞。另外,团队在声响定制合成方面的托付才能凸起,三天内便可完成,而行业平常须要3~6个月。

建立不到两年,团队已有50多人范围,个中80%为手艺研发职员。团队重要成员具有中科院、中山大学、华南理工、日本早稻田大学等名校硕博教诲背景和腾讯、网易、YY等名企事情经历。团结创始人黄博贤具有12年的互联网语音和音频手艺积聚,前后在酷狗和YY主导语音和音频手艺的开发。

接下来,团队会重点在结果、机能、数据三个维度优化算法手艺,为各行各业供应更多标准化解决计划,加快手艺落地,同时完美智能语音交互全链路手艺。2020年,团队还将推出面向C端用户的语音克隆产物,在陪同、亲子互动、泛文娱等交互场景周全发力。

现在,该项目已启动A轮融资,资金将悉数用于团队建立及营业拓展。

本文相干的文章列表页头图图片来源于摄图网,经受权运用。本文为创业邦原创,未经受权不得转载,不然创业邦将保存向其追查法律责任的权益。如需转载或有任何疑问,请联络。