首页> 智驾> 正文

【专利解密】百度技术让汽车终端智能识别出语音指令

嘉德IPR·01-23 14:57·智驾  来源: 爱集微

【嘉德点评】整体上来看,车载语音识别率的高低很大程度上是依赖于预先训练好的深层神经网络的准确率。

集微网消息,如今随着汽车工业的蓬勃发展以及电子市场日渐成熟,车载终端逐渐成为了汽车的重要标配了。据相关调查显示,国内汽车保有量达2.4亿量了,且汽车中含有智能终端也逐渐成为趋势。车载智能终端中的功能由开始单一的行车导航功能也向多功能方向发展。

新近发展中属智能终端语音指令识别和执行最为火热,功能也是较为复杂难实现。究其原因,主要是车载智能终端自身配备的指令集非常有限,不能智能识别出用户的语音指令,对不同语音的适应性也不够强,容易造成用户的使用障碍。

针对此类问题,百度公司迎难而上,提出“车载语音指令识别方法的装置”专利(专利公布号:CN105070288A),该方法的主要作用是获取用户输入的语音指令,根据指令利用神层神经网络预测出用户的基本信息,根据用户信息来识别出语音指令的内容,从而来确定用户的下一个意图。

专利中提出一种车载语音指令识别装置的技术方案,该方案图如图1所示。主要包括六个模块:指令获取模块,基本信息确定模块,意图识别模块,置信度确定模块,意图确定模块,动作执行模块。其中指令获取模块主要是获取用户输入的语音指令,而基本信息确定模块中需要使用到预先训练好的深层神经网络DNN模型来确定用户的基本信息。有了用户的基本信息,意图识别模块便可根据它对语音指令进行内容识别了,得到了识别出的内容和用户输入语音的场景上下文来确定用户可能的意图。置信度确定模块用户根据DNN模型确定用户可能的意图的置信度。最后意图确定模块根据有置信度的可能用户意图确定出最后的意图。最后动作执行模块根据确定的用户意图执行出相应的动作。

图1车载语音指令识别装置技术方案图

车载语音指令识别技术方案中核心的模块部分就是基本信息确定模块和意图识别模块了。基本信息确定模块主要包括两个部分特征提取单元和DNN识别单元,基本信息确定模块流程图如图2所示。特征提取单元主要是从输入语音指令中获取语音特征参数,包括过零率、短时能力倒谱系数和基频。待特征提取单元提取好语音特征后,再结合所述位置以及时间作为DNN神经网络的输入参数,深度神经网络根据输入预测出用户的的基本信息(用户的性别、年龄、籍贯和职业)。意图识别模块主要模块意图识别单元,它需要结合用户的基本信息和获取用户输入所述语音指令之前预定长度时间段内出现过的页面,并根据所述预定长度时间段内出现过的页面及各个页面的停留时间和语音指令中关键的识别语料判断出用户的可能意图。

图2 基本信息确定模块流程图

到此,小编就介绍完了百度公司提出的车载语音指令识别方法和装置,以及其中的核心模块部分了。从这个方法整体上来看,车载语音识别率的高低很大程度上是依赖于预先训练好的深层神经网络的准确率,但是随着如今网络的发展和硬件的发展,深层神经网络的训练将会越来越方便,随着网络的层数增加,神经网络的预测准确率也将越来越高。

关键词:车载语音,指令识别,神经网络,车载终端

专利号:CN105070288A

(校对/holly)

{{like_num}}

参与评论
{{i.user_info.nickname}} 作者 {{i.create_time | changeTimed}}
{{i.content}}
回复 · 全部{{i.comment_num}}条回复
{{i.like_num}}
{{reply.user_info.nickname}} 作者 {{reply.create_time| changeTimed}}
{{reply.content}}
@{{reply.to_user_info.nickname}}: {{reply.content}}
回复
{{reply.like_num}}
加载更多回复
暂无评论
没有更多了