买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:吉林大学
摘要:本申请涉及语音处理技术领域,具体涉及一种数字化回忆干预系统的智能语音互动方法,该方法包括:语音采集老年音频向量和青年音频向量;对老年音频向量进行语音增强,计算语音模糊度;计算基频频移距离,得到频移后老年语谱图;计算共振峰增强包络线;计算增强后包络线,得到共振峰增强频谱图;得到增强老年语谱图;对增强老年语谱图进行语音识别,获得文本数据;并与语料库内的文本数据进行对比,找到匹配的回答文本数据;将回答文本数据进行语音合成,完成语音交互和对老年人的回忆干预。本申请可降低老年人与青年人的语音特征差异,提高老年人语音识别的准确性。
主权项:1.一种数字化回忆干预系统的智能语音互动方法,其特征在于,该方法通过以下模块实现:语音采集模块:负责收集用户语音,得到老年音频向量和青年音频向量;语音增强模块:负责对语音采集模块采集语音数据进行处理,具体包括:(1)采用语谱图分析算法,获得老年音频向量语谱图和青年音频向量语谱图,根据老年音频向量语谱图与青年音频向量语谱图内数据点的差异,计算语音模糊度;(2)采用基频提取算法,获得老年基频向量和青年基频向量,根据老年基频向量与青年基频向量中基频之间的差异,计算老年基频向量中各元素的基频频移距离,获取频移后老年语谱图;(3)根据老年基频向量和青年基频向量,构建老年元音频谱图集合和青年元音频谱图集合,根据老年元音频谱图集合与青年元音频谱图集合中各频谱图的包络线的共振峰分布相似性,计算老年元音频谱图集合中各频谱图的共振峰增强包络线;(4)根据老年元音频谱图集合中各频谱图的共振峰增强包络线与所述基频频移距离,计算老年元音频谱图集合中各频谱图的增强后包络线,获取共振峰增强频谱图;(5)基于共振峰增强频谱图,对频移后老年语谱图进行增强处理,获取增强老年语谱图;语音识别模块:负责对增强老年语谱图进行识别,将识别结果转化为文本数据;语音交互模块:包括文本库对比单元和语音合成单元,其中,文本库对比单元负责将语音识别模块输出的文本数据与语料库内的文本数据进行比对,获取匹配的回答文本,语音合成单元负责将回答文本进行语音合成,完成语音交互和对老年人的回忆干预;所述语音模糊度的计算方法为:分别计算老年语谱图内所有数据点的离散程度和青年语谱图内所有数据点的离散程度,作为老年模糊度和青年模糊度,老年语谱图和青年语谱图的离散程度是通过分别计算语谱图所有像素点的标准差获取的;所述青年模糊度与所述老年模糊度的差异作为模糊差异;将所述模糊差异与所述青年模糊度的比值作为语音模糊度;所述计算老年基频向量中各元素的基频频移距离,包括:将老年基频向量的均值与青年基频向量的均值之间的差值作为基频基础频移距离;根据老年基频向量中相邻元素之间的差异变化情况与语音模糊度,计算老年基频向量中各元素的基频差异化频移距离;老年基频向量中各元素的基频频移距离分别与所述基频基础频移距离和所述基频差异化频移距离呈正相关关系。
全文数据:
权利要求:
百度查询: 吉林大学 一种数字化回忆干预系统的智能语音互动方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。