一文了解全球语音技术市场格局解析投资

与机器进行语音交流,让它能听明白你在说什么,是人类一直以来的梦想。自从年贝尔研究所研制出了世界上第一个能识别10个英文数字发音的实验系统再到年英国的Denes等人研制了第一个计算机语音识别系统。语音技术开始获得了高速的发展。目前,人类已经将梦想变成了现实,语音识别已成为人与机器通过自然语言交互的重要方式之一。

一、语音技术市场格局

随着互联网技术的高速发展,人类越来越依赖着机器设备的人工性和智能性。以语音技术为代表,它深入到人类生活的大多数领域。如:智能家具家电、移动互联网、汽车自动驾驶、医疗等。

1.全球:

据中商产业数据统计,年全球智能语音市场规模达到.1亿美元。其中,在全球智能语音市场占比情况中,各巨头市场占有率分别为:Nuance(31.60%)、谷歌(28.40%)、苹果(15.40%)、微软(8.10%)和科大讯飞(4.50%)等。值得注意的是科大讯飞已经超越老牌计算机巨头IBM位列全球第五位。

全球智能语音市场规模及占有率

数据来源:中商产业数据库

2.国内:

中国拥有庞大的用户群基础以及互联网系统优势。近年来随着中国智能语音技术的专利数量持续增长,国内智能语音市场规模不断扩大。数据显示,年中国智能语音市场规模达到.7亿元,与年相比增长70%。随着智能语音应用产业的拓展,市场需求增大,年中国智能语音市场规模预计再进一步增长,达到.7亿元。

中国智能语音市场规模及占有率

数据来源:中商产业数据库

数据显示,截至目前为止,中国智能语音市场,科大讯飞市场占有率排名第一,达到44.20%;其次为百度,市场占有率为27.80%,排名第三是苹果,市场占有率为6.90%。其后分别为Nuance和小i机器人,占有3.0%、2.70%的市场份额。整体来看,中国智能语音市场的主要份额被科大讯飞、百度以及苹果三大巨头分割。

二、语音技术工作原理

了解了语音技术的市场状况,然而我们大多数人都不太清楚语音技术的工作原理是怎样的。其实它的工作原理很容易理解,语音技术本质就是将语音序列转换为文本序列的过程,工作原理包括三大过程:

语音识别系统流程

数据来源:中商产业研究报告

1.前端信号处理

前端的信号处理是对原始语音信号进行相关处理,使处理后的信号更能代表语音的本质特征。具体过程划分五步:对原始语音进行活动检测—降噪—回声混声消除—声源定位—波束形成。

2.声学模型和语言模型

通过前端信号处理把语音序列转换成文本序列后,需要对可能的文本序列转换成一个词,接下来这个过程需要用到声学模型和语言模型。声学模型是将语音信号的观测特征与句子的语音建模单元联系起来,即计算。而语言模型则与文本处理相关,比如我们使用的智能输入法,当我们输入“nihao”的时候,输入法候选词会出现“你好”而不是“拟好”,候选词的排列将参照语言模型得分的高低顺序。同时,语音识别中的语言模型也应用于处理文字序列,它是通过结合声学模型的输出而给出概率最大的文字序列作为语音识别的结果。

声学模型示意图

数据来源:智能软件网

3.语音识别效果展示

以上几个过程串联起来,基本上形成了一个简单的语音技术工作框架,之后在检测过程进行不断修正,基本上可以把语音识别效果展示出来了。

三、全球知名语音技术公司介绍

目前全球知名语音技术公司有:

1.Nuance

Nuance公司专门从事语音识别软件、图像处理软件及输入法软件研发、销售。目前世界上最先进的电脑语音识别软件NaturallySpeaking就出自于Nuance公司。T9智能文字输入法是该公司的旗舰产品,该产品功能强大,支持超过70种语言,是业内认同的标准输入法,被众多OEM厂商内置,其中包括三星、诺基亚、索爱、LG、夏普、海尔、华为等等,在全球市场占有率超过70%,在中国市场占有率超过50%。

图片来源:Nuance

2.Google

谷歌是一家位于美国的跨国科技企业,业务包括互联网搜索、云计算、广告技术等,同时开发并提供大量基于互联网的产品与服务,GoogleNow语音技术为其中代表。目前,GoogleNow已经占据了15%的智能音箱市场份额,智能手机语音助理的市场份额为46%。

图片来源:谷歌,百度图库

3.Apple

Siri是一款可以调用应用的聊天机器人。年苹果以2亿美金收购Siri,随后通过与全球最大的语音识别厂商Nuance合作,实现了语音识别功能。目前经过一系列技术完善,Siri可以支持自然语言输入,并且可以调用系统自带的天气预报、日程安排、搜索资料等应用,还能够不断学习新的声音和语调,提供对话式的应答。新兴设备技术(EDT)研究服务最新发布的报告发现谷歌助手以50%的份额成为全球第一大虚拟助手,其次是苹果的Siri。

图片来源:苹果,siri

4.Cornata

微软在全球推出了覆盖语音、视觉、语言、机器翻译等功能的24项服务,目前已经有超过万开发者使用认知服务。语音助手Cortana是微软在机器学习和人工智能领域方面的尝试,Cortana可以记录用户的行为和使用习惯,利用云计算、搜索引擎和“非结构化数据”分析,读取和学习包括手机中的图片、视频、电子邮件等数据理解用户的语义和语境,从而实现人机交互。据统计,每一台Windows设备都装载了Cortana,其月活跃用户数达到了惊人的1.45亿人次(用户可能主要是通过XBox访问),Cortana在智能音响设备上的份额很小,然而伴随着微软庞大的整体用户群,其市场份额也在不断增长之中。

图片来源:微软

5.科大讯飞

科大讯飞股份有限公司(股票代码)从事智能语音及语言技术研究、软件及芯片产品开发、语音信息服务及电子政务系统集成。科大讯飞拥有自主知识产权的世界领先智能语音技术,产品覆盖范围从大型电信级应用到小型嵌入式应用,从电信、金融等行业到企业和家庭用户,从PC到手机到MP3/MP4/PMP和玩具。

图片来源:科大讯飞

目前,科大讯飞占有中文语音技术市场70%以上市场份额,语音合成产品市场份额达到70%以上,在电信、金融、电力、社保等主流行业的份额更达80%以上,开发伙伴超过00家,拥有灵犀语音助手,讯飞输入法等优秀产品。其中,灵犀定制语音助手在同类产品中用户规模排名第一。




转载请注明:http://www.180woai.com/afhpz/4619.html


冀ICP备2021022604号-10

当前时间: