申请/专利权人:宁波星巡智能科技有限公司
申请日:2024-05-11
公开(公告)日:2024-06-11
公开(公告)号:CN118173094A
主分类号:G10L15/22
分类号:G10L15/22;G10L15/26;G10L15/04;G10L15/02
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.06.28#实质审查的生效;2024.06.11#公开
摘要:本发明涉及音频处理技术领域,解决了现有技术中唤醒词识别准确度低、高延迟的问题,提供了一种结合动态时间规整的唤醒词识别方法、装置、设备及介质。该方法包括:获取多种看护场景下的实时音频数据;利用多特征融合算法,对所述实时音频数据进行静默识别,输出语音音频片段;依据预设的唤醒词对应的时长阈值,将高于所述时长阈值的对应音频片段剔除,输出待检测音频片段;对所述待检测音频片段进行频谱特征提取,获取与预设目标唤醒词相关的关键特征信息;利用动态时间规整算法和双词联合检测算法,对所述关键特征信息进行处理,识别目标唤醒词。本发明提高了多种使用场景下唤醒词识别的准确度,降低了响应延时。
主权项:1.一种结合动态时间规整的唤醒词识别方法,其特征在于,所述方法包括:S1:获取多种看护场景下的实时音频数据;S2:利用多特征融合算法,对所述实时音频数据进行静默识别,剔除识别出的静默音频片段,输出语音音频片段;S3:依据预设的唤醒词对应的时长阈值,将语音音频片段中时长高于所述时长阈值的对应音频片段剔除,输出待检测音频片段;S4:对所述待检测音频片段进行频谱特征提取,获取与预设目标唤醒词相关的关键特征信息;S5:利用动态时间规整算法和双词联合检测算法,对所述关键特征信息进行处理,识别目标唤醒词。
全文数据:
权利要求:
百度查询: 宁波星巡智能科技有限公司 结合动态时间规整的唤醒词识别方法、装置、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。