【发明公布】基于AI语音识别的智能多媒体终端_深圳中洲卓越科技有限公司_202410461643.X

导航：龙图腾网> 最新专利技术> 基于AI语音识别的智能多媒体终端_深圳中洲卓越科技有限公司_202410461643.X

申请/专利权人：深圳中洲卓越科技有限公司

申请日：2024-04-17

公开（公告）日：2024-06-14

公开（公告）号：CN118197309A

主分类号：G10L15/22

分类号：G10L15/22;G10L25/24;G10L15/02;G10L15/14

优先权：

专利状态码：在审-公开

法律状态：2024.06.14#公开

摘要：本发明公开了基于AI语音识别的智能多媒体终端，涉及智能终端技术领域。它包括：唤醒判断部分、身份鉴别部分、语音识别部分和多媒体控制部分；所述唤醒判断部分，用于实时采集周围环境的语音信息，发送第一控制命令至身份鉴别部分；所述身份鉴别部分，用于对语音信息进行特征识别，判断是否为特定用户；所述语音识别部分，对语音信息进行语音识别，得到语音控制指令；所述多媒体控制部分，用于根据语音控制指令，控制多媒体终端的运行。本发明实现了对语音单元的状态转移和观测概率建模，从而提高了语音识别的准确性、实时性和稳定性，为用户带来更智能、便捷的多媒体使用体验。

主权项：1.基于AI语音识别的智能多媒体终端，其特征在于，它包括：唤醒判断部分、身份鉴别部分、语音识别部分和多媒体控制部分；所述唤醒判断部分，用于实时采集周围环境的语音信息，首先对语音信息进行声源定位，获取声源距离多媒体终端的距离，若距离在小于设定的距离阈值，则检测语音信息的分贝值，并判断分贝值是否处于预设分贝区间，若是，则计算语音信息的长度是否在预设长度区间，若是则判断语音信息是否为人声，若为人声，则发送第一控制命令至身份鉴别部分；所述身份鉴别部分，用于对语音信息进行特征识别，判断是否为特定用户，若是，则发送第二控制命令至语音识别部分；所述语音识别部分，对语音信息进行语音识别，得到语音控制指令，具体包括：使用梅尔滤波器对语音信号进行频谱分析，得到频谱特征；将频谱特征转换为倒谱系数；构建动态贝叶斯网络作为声学模型，将倒谱系数建模为动态贝叶斯网络的状态转移过程；将倒谱系数映射到状态空间中，每个状态代表一个语音单元；使用动态贝叶斯网络进行推断，估计每个状态的后验概率，即给定观察序列条件下每个状态的概率分布；对动态贝叶斯网络的输出进行稀疏编码，将每个状态的后验概率表示为稀疏向量；将稀疏向量映射到词汇表中的单词，得到语音信息对应的词序列，作为语音控制指令；所述多媒体控制部分，用于根据语音控制指令，控制多媒体终端的运行。

全文数据：

权利要求：

百度查询：深圳中洲卓越科技有限公司基于AI语音识别的智能多媒体终端

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种新能源汽车配件生产定位钻孔装置_西安翔凌汽车零部件有限公司_202210366932.2

下一篇：一种双层保温日光温室_山东同岚农业发展集团有限公司_202410511060.3

相关技术

一种新能源汽车配件生产定位钻孔装置_西安翔凌汽车零部件有限公司_202210366932.2

一种双层保温日光温室_山东同岚农业发展集团有限公司_202410511060.3

一种采棉机摘锭座管测量装置_浙江亚嘉采棉机配件有限公司_202410465107.7

一种全固态锂离子电池复合型正极膜片及其制造方法_佛山(华南)新材料研究院_202111396479.1

城市暴雨洪水管理模型参数自动率定方法及系统_武汉理工大学_202210061553.2

一种间隔条浇灌胶质的装置_河南金拇指防水工程有限公司_202210302950.4

一种4-环己基-3-(三氟甲基)苯甲醇的制备方法_浙江工业大学_202211411775.9

一种轻量非晶合金及其制备方法_东莞市逸昊金属材料科技有限公司_202211701845.4

基于IPSO-CHRFA模型的海洋哺乳动物叫声分类方法_青岛科技大学_202410508360.6

一种冰醋酸中微量乙酸酐的检测方法_浙江圣兆药物科技股份有限公司_202211266952.9

一种大型铜套离心铸造方法及铸造设备_扬州市雪龙铜制品有限公司_202210381652.9

一种露头岩层非均质性的模型构建方法_岭南师范学院_202310948270.4

相关技术

相关技术

相关技术

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】基于AI语音识别的智能多媒体终端_深圳中洲卓越科技有限公司_202410461643.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务