FreeNeb亮剑语音界,主攻“声纹+语音”新战场

【猎云网北京】9月23日报道(文/奇点) 近年来,全球智能语音市场呈现连年增长的趋势,预计到2020

【猎云网北京】9月23日报道(文/奇点)

近年来,全球智能语音市场呈现连年增长的趋势,预计到2020年,全球市场规模将达到191.7亿美元——相比2015年的61.9亿美元,四年内其增长速度翻了三倍多。

但实际落地情况并没有表象中乐观。

当前,语音识别在行业落地遇到的最大问题,是行业数据与需求的不对等,即语音识别缺乏专业性。纵使是语音识别头部企业,也很难覆盖到各细分市场,从而导致行业整体识别率提升困难。

从技术角度来看,当前NLP(自然语言处理)的发展仍面临着“四大挑战”:词法、语义等不同层面存在着不确定性;新的术语和词汇等导致未知语言现象的不可预测性;数据资源的不充分难以覆盖复杂的语言现象;相关语义知识等难以用简单的数学模型描述,对参数庞大的深度模型需求迫切。

所以,NLP并未真正实现技术突破,这也使得整个语音领域的产品落地与客户期望之间存有一定差距,尤其是在客服、问答等领域。

近日,猎云网接触到语音界的新生力量——北京孚睿星辰智能科技有限责任公司(FreeNeb),其是一家专注语音处理技术研究,并面向企业提供“独具一格”的声纹识别和语音识别解决方案与专业服务的创业公司。

FreeNeb依托清华大学语音AI核心技术研究力量,目前在语音、声纹识别等语音相关领域已取得一系列成果。

其核心产品包括语音及声纹识别服务私有化平台、嵌入式语音和声纹识别服务,同时配套了智能语音翻译、智能语音门锁等多种解决方案。现已触达到教育、金融、政府、客服等多个领域。

FreeNeb COO刘荣在接受猎云网采访时表示:“基于目前整个语音领域的产品落地情况,FreeNeb要做一个为企业量身定制的语音优化工具,旨将语音识别技术经验做成一个简单可用的工具。“

刘荣还表示:“我们最主要的工作,就是让语音识别的技术触角触及到更多的行业,让各个行业具备独立利用其内部数据和语音技术实现快速变现的能力。”

行业深度融合是语音识别落地的关键

近年来,FreeNeb在产品定位上:旨要做一个标准化、可应用、高效率的语音优化工具,并且未来这将会是一个可铺量的标准化工具。

FreeNeb日前推出产品“创新企业开放语音平台(CeaOS)”是由智能语音创新企业开放联盟(CeaFos)支持的企业级私有引擎开放系统。其从本质上看,CeaOS系统是一款服务于中小企业的“语音识别优化工具”。

中小企业及微小型创企都可以利用该开放平台免费获得企业级语音服务引擎,从而可以自由地打造属于自己企业的“专业语音服务”。

目前FreeNeb的产品工具已达到标准化,同时上线了语音识别私有引擎和自适应训练平台,若究其技术原理,便涉及到声学及语言两种模型。

声学模型在技术上称为自适应学习,是根据语音数据中不同人的年龄、性别、生理等造成的差异来进行声学模型的提升,在原有的基础上进行自适应学习。整个过程就像是做一个迁移学习,让模型学会这种变化、差异,使其更偏向于数据所描述的特定领域。

而语言模型则是将语言转化成文本时的专业术语转化率,而这需要相应行业领域内的文本数据,让语音识别引擎知道更多的行业知识,从而再面对时会变得更加聪明。

CeaOS的主要目的是让更多初创企业可以获得免费的语音技术,从而减少语音产业落地过程中的摩擦成本。

另外,对于行业用户,FreeNeb推出私有化训练平台解决方案,提供用户私有化学习功能,一键训练快速提升,可以应用到电话端语音识别、网络端语音识别等场景。目前已有行业用户应用到金融端的呼叫中心应用解决方案中。

声纹、语音双融合,打造边缘端的新特色

当下声纹识别的应用较为广泛,其技术在各个领域都有渗透。自2016年起,中国建设银行便应用了手机声纹支付。不仅如此,声纹技术也同样应用于:呼叫中心的反欺诈及VIP认证,智能手机华为、三星的声纹唤醒技术,社保中的远程认证等。

目前FreeNeb的声纹技术主要应用于银行金融领域、安防领域、智能硬件领域。与此同时,FreeNeb在与具体企业业务上的结合也正在打磨,得到了来自各方企业的一致认可。

值得一提的是,从目前智能语音市场来看,其中不乏做语控及声纹的厂商,但致力于将声纹与语音技术融合的厂商——FreeNeb是第一家。

刘荣对此阐述道:“就声纹和语音技术两方面:融合是我们的特点,拆分后双方我们都有相对应的落地产品。团队一直在嵌入式语音技术上持续研发,在边缘端的语音技术和声纹技术已经在市场上落地,声纹+的产品模组也已经量产。”。

一方面,FreeNeb依托清华语音AI核心的力量,声纹技术早在清华实验室中积累了十几年的丰富经验;另一方面,FreeNeb发起人王东专注于语音识别技术研究已有20多年,经验极为丰富。

此外,目前国内声纹市场刚刚兴起,声纹技术人才相对短缺,FreeNeb团队具有天然优势。

目前FreeNeb正在与相关公司进行合作,推出声纹门锁模组,在原有指纹静态特征的基础上又融入了声纹动态特征,安全性极高。

FreeNeb 声纹+语音芯片模组

此外,FreeNeb在产品落地的设计上也独具一格。其注重在边缘端上发力,用户的数据信息不需上传至云端服务器,直接在边缘端上进行处理,用户可随时请求数据在边缘端进行删除,此举有效地保护了用户隐私。

刘荣说:“接下来我们希望能在端上实现设备与设备之间可靠的控制,边缘端处理数据不会上传至云端,所有的语音数据都在边缘端上计算,这也将是未来智能设备处理数据的一个正确趋势。”在未来的研究中,FreeNeb端上技术不仅只是人的声纹控制,还会延伸到设备的声纹控制(即对物体的声纹识别)。

未来我们周围的智能设备及专属穿戴设备将无需亲力亲为的通过输入指纹密码进行控制,而是采用声纹控制实现可靠、可信的交互控制。

从技术到商务:新型“通用人才”式团队

FreeNeb的核心团队源自于科研底蕴深厚的清华大学。发起人王东是清华大学副教授、语音语言技术中心副主任,曾任Oracle软件工程师、IBM高级软件工程师、爱丁堡大学马丽-居里研究员、法国EURECOM博士后研究员、美国Nuance公司高级研究科学家等。

CEO 汤志远 中科院与清华大学联合培养博士,专注语音识别、说话人识别、语种语别等领域,在主要国际期刊或会议上发表论文20余篇。

CTO李蓝天,清华大学博士,专注说话人识别领域,在主要国际期刊或会议上发表论文50余篇,北京市优秀毕业生,公开专利10余。

COO刘荣是中国石油大学学士,清华大学语音和语言技术中心资深工程师,曾任阿里巴巴资深算法工程师、优酷土豆信息流推荐算法工程师。此外,FreeNeb团队还包括来自互联网公司的多名优秀人才。

技术实力的储备和行业从业经验的积累,使得FreeNeb团队具备了从技术到商务的“通用型”人才。

刘荣在接受猎云网采访中表示:“AI到这个阶段,为什么落地遇到了瓶颈,大部分原因还是因为AI人才的成本太高。”在一个行业中,商务、市场、销售不懂技术,往往是最让人头疼的事情。

从这个出发点,刘荣从思维上做出了改变。

团队2016年组建之初,FreeNeb就带着算法博士去现场、去和客户进行深入沟通。在这个转变的过程中,将其技术上的思维与解决问题的思维慢慢融合、打磨。虽然过程极其痛苦,但FreeNeb也为AI落地完成了思维上的改革。

刘荣表示:“这是个心态转变的过程,既要懂技术,又要涉猎到业务上。当然最重要的是放低技术身段,谦虚地与传统厂商讨论学习,这个转变对FreeNeb的影响很大。”

当下,FreeNeb涵盖了技术研发部、工程开发部、产品质检部、市场项目部等。合作方包括国家电网、日本清华同方、中科汇联等。

他们也正在开放接洽新一轮融资,寻找共同致力于语音技术产业落地的投资方和资源方。

项目:CeaOS(创新企业开放平台)公司:北京孚睿星辰智能科技有限责任公司网址:http://www.freeneb.com/

打开APP阅读更多精彩内容