买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:深圳市三宝创新智能有限公司
摘要:本发明公开了一种基于姓氏的语音识别系统及方法,包括主控制单元、语音获取单元、语音处理单元、姓氏模型单元和预训练单元:所述主控制单元分别连接语音获取单元、语音处理单元、姓氏模型单元和预训练单元,本发明不仅简单便捷,有效地实现高准确率快速姓氏汉字的识别,同时针对姓氏多种易混淆的可能设计一系列的处理方式,提高了语音识别的性能以及识别率,减轻了系统计算负担。
主权项:一种基于姓氏的语音识别系统,包括主控制单元、语音获取单元、语音处理单元、姓氏模型单元和预训练单元:其特征在于,所述主控制单元分别连接语音获取单元、语音处理单元、姓氏模型单元和预训练单元。
全文数据:一种基于姓氏的语音识别系统及方法技术领域[0001]本发明涉及语音识别技术领域,尤其涉及一种基于姓氏的语音识别系统及方法。背景技术[0002]语言是人类相互交流最常用、最有效、最重要和最方便的通信形式,语音是语言的声学表现,与机器进行语音交流是人类一直以来的梦想。随着计算机技术的飞速发展,语音识别技术也取得突破性的成就,人与机器用自然语言进行对话的梦想逐步接近实现。语音识别技术的应用范围极为广泛,不仅涉及到日常生活的方方面面,在军事领域也发挥着极其重要的作用。它是信息社会朝着智能化和自动化发展的关键技术,使人们对信息的处理和获取更加便捷,从而提高人们的工作效率。发明内容[0003]本发明的目的在于提供一种基于姓氏的语音识别系统及方法,以解决上述背景技术中提出的问题。[0004]为实现上述目的,本发明提供如下技术方案:一种基于姓氏的语音识别系统,包括主控制单元、语音获取单元、语音处理单元、姓氏模型单元和预训练单元:所述主控制单元分别连接语音获取单元、语音处理单元、姓氏模型单元和预训练单元。[0005]作为本发明的进一步技术方案:所述语音获取单元为M6027麦克风。[0006]作为本发明的进一步技术方案:所述语音处理单元分为声学模型特征提取模块、语言模型特征提取模块、混淆处理模块和单双姓氏处理模块。[0007]一种基于姓氏的语音识别方法,包含以下步骤:A、用户输入一串语音;B、系统获取语音信号,通过声学模型对语音进行特征提取,在声学模型得出发音序列后,利用语言模型从候选文字序列中找出概率最大的字符串序列;C、从汉字字符串序列中提取出表示姓氏的汉字,通过收集的全部汉字及其拼音字典,可将汉字转换为拼音,若其为多音字,只转换为其中某一个拼音;D、如果该姓氏为单字姓氏,则将其拼音加入列表list,针对姓氏拼音做易混淆发音的处理,以及查找多音字的处理,并将结果全部保存到list中;E、如果该姓氏为双字姓氏,则将两字姓氏中每个字的拼音单独取出进行易混淆发音的处理及查找多音,每个字都可得一个列表,将两个列表进行两两任意组合,找出这些拼音组合对应所有姓氏;F、根据得到的拼音列表,可查找到每个拼音对应的姓氏汉字,列出说话人所表达的全部可能姓氏汉字;G、最终获取对应姓氏汉字列表。[0008]与现有技术相比,本发明的有益效果是:本发明不仅简单便捷,有效地实现高准确率快速姓氏汉字的识别,同时针对姓氏多种易混淆的可能设计一系列的处理方式,提高了语音识别的性能以及识别率,减轻了系统计算负担。附图说明[0009]图1是一种基于姓氏的语音识别系统的结构框图图2是一种基于姓氏的语音识别方法的流程图。具体实施方式[0010]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。[0011]请参阅图I-2,本发明实施例中,一种基于姓氏的语音识别系统,其包括语音获取单元、语音处理单元、姓氏模型单元和预训练单元。[0012]语音获取单元:该单元负责利用M6027麦克风对用户发出的命令进行语音信号采样,并将用户语音信号传送至语音处理单元进行处理,使其通过语音识别,转换为汉字字符串。[0013]语音处理单元:单元分为声学模型特征提取模块、语言模型特征提取模块、混淆处理模块和单双姓氏处理模块。[0014]其中声学模型特征提取模块是利用声学模型对语音信号进行特征提取,将语音转换为声学表示的输出,给出语音是属于某个声学符号的概率;语言模型特征提取模块是在声学模型给出发音序列后,从候选文字序列中找出概率最大的字符串序列;混淆处理模块中有四种处理形式,一为平舌音和翘舌音处理,针对姓氏的拼音,判断是否以z、s或者c开头,若以z、s或者c开头,继续判断拼音中是否存在h,若存在,则去掉;若不存在,则在拼音的第二个位置加上h;二为前鼻音和后鼻音处理,对于后鼻音:字母g—般出现在拼音的开头或者结尾,判断姓氏拼音中是否包或者ing,若包含,则去掉拼音结尾的g,对于前鼻音:an、en和in—般出现在拼音的结尾,判断姓氏拼音中是否存在an、en或者in,若存在,继续判断拼音的最后一位是否为g,若不是,则在拼音的结尾加上g。三为鼻音n和边音1处理,判断姓氏拼音的开头是否为n,若为n,则将开头的n换为1。判断拼音的开头是否为1,若为1,则开头的1换为n;四为多音字处理,在将姓氏汉字转换为拼音的过程,若用户说出的姓氏为多音字,且其并未按照多音字在姓氏中的正确拼音读出,系统根据35个多音字的正确姓氏发音和其他发音的列表,判断所输入拼音是否在其他发音中,若在其他发音中,则取出正确姓氏发音。35个多音字的正确姓氏发音和其他发音的列表通过是系统己有的全部汉字及其拼音的列表中找出姓氏中的所有多音字,其中单字姓氏中有28个多音字,双字姓氏中有7个多音字。[0015]单双姓氏处理模块,其中对于单姓氏,先将单字姓氏的拼音加入列表list,针对姓氏拼音做易混淆发音的处理,以及查找多音字的处理,并将结果全部保存到list中。而对于双姓氏,将两字姓氏中每个字的拼音单独取出进行易混淆发音的处理及查找多音,每个字都可得一个列表,将两个列表进行两两任意组合,找出这些拼音组合对应所有姓氏。[0016]姓氏模型单元:收集的全部汉字及其拼音字典,其要覆盖尽可能多的汉字,并以此构建姓氏模型。[0017]预训练单元:通过系统构建的构建姓氏模型进行预先训练提取姓氏的识别模式,进行姓氏汉字的提取。[0018]本发明的工作原理是:其工作流程如图2所示:1.用户输入一串语音。[0019]2.系统获取语音信号,通过声学模型对语音进行特征提取,在声学模型得出发音序列后,利用语言模型从候选文字序列中找出概率最大的字符串序列。[0020]3.从汉字字符串序列中提取出表示姓氏的汉字,通过收集的全部汉字及其拼音字典,可将汉字转换为拼音,若其为多音字,只转换为其中某一个拼音。[0021]4.如果该姓氏为单字姓氏,则将其拼音加入列表list,针对姓氏拼音做易混淆发音的处理,以及查找多音字的处理,并将结果全部保存到list中。[0022]5.如果该姓氏为双字姓氏,则将两字姓氏中每个字的拼音单独取出进行易混淆发音的处理及查找多音,每个字都可得一个列表,将两个列表进行两两任意组合,找出这些拼音组合对应所有姓氏。[0023]6.根据得到的拼音列表,可查找到每个拼音对应的姓氏汉字,列出说话人所表达的全部可能姓氏汉字。[0024]7•最终获取对应姓氏汉字列表。
权利要求:1.一种基于姓氏的语音识别系统,包括主控制单元、语音获取单元、语音处理单元、姓氏模型单元和预训练单元:其特征在于,所述主控制单元分别连接语音获取单元、语音处理单元、姓氏模型单元和预训练单元。2.根据权利要求1所示的一种基于姓氏的语音识别系统,其特征在于,所述语音获取单元为M6027麦克风。3.根据权利要求1所示的一种基于姓氏的语音识别系统,其特征在于,所述语音处理单元分为声学模型特征提取模块、语言模型特征提取模块、混淆处理模块和单双姓氏处理模块。4.一种基于姓氏的语音识别方法,其特征在于,包含以下步骤:A、用户输入一串语音;B、系统获取语音信号,通过声学模型对语音进行特征提取,在声学模型得出发音序列后,利用语言模型从候选文字序列中找出概率最大的字符串序列;C、从汉字字符串序列中提取出表示姓氏的汉字,通过收集的全部汉字及其拼音字典,可将汉字转换为拼音,若其为多音字,只转换为其中某一个拼音;D、如果该姓氏为单字姓氏,则将其拼音加入列表list,针对姓氏拼音做易混淆发音的处理,以及查找多音字的处理,并将结果全部保存到1ist中;E、如果该姓氏为双字姓氏,则将两字姓氏中每个字的拼音单独取出进行易混淆发音的处理及查找多音,每个字都可得一个列表,将两个列表进行两两任意组合,找出这些拼音组合对应所有姓氏;F、根据得到的拼音列表,可查找到每个拼音对应的姓氏汉字,列出说话人所表达的全部可能姓氏汉字;G、最终获取对应姓氏汉字列表。
百度查询: 深圳市三宝创新智能有限公司 一种基于姓氏的语音识别系统及方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。