【发明授权】数字人交互方法及系统、计算机可读存储介质、数字人设备_华院计算技术(上海)股份有限公司_202311057771.X

申请/专利权人：华院计算技术(上海)股份有限公司

申请日：2023-08-21

公开（公告）日：2024-06-21

公开（公告）号：CN117234369B

主分类号：G06F3/0481

分类号：G06F3/0481;G06T13/40;G06V10/80

优先权：

专利状态码：有效-授权

法律状态：2024.06.21#授权;2024.01.02#实质审查的生效;2023.12.15#公开

摘要：本发明公开一种数字人交互方法及系统、计算机可读存储介质、数字人设备，该方法包括：接收包含语音的用户交互视频；将所述用户交互视频分离为视频帧和语音，将所述语音转换为文本，得到多模态数据；根据所述多模态数据分别获取基于视频、语音、文本的情绪感知结果及感知编码；根据各模态的情绪感知结果或感知编码确定控制标签向量；将所述控制标签向量融合到各模态的感知编码中；根据融合后的各模态的感知编码分别生成基于视频、语音、文本的生成内容；将所述基于视频、语音、文本的生成内容进行合成处理，得到合成视频。利用本发明方案，可以有效提高数字人的情感识别和表达能力，提升用户使用体验和效率。

主权项：1.一种数字人交互方法，其特征在于，所述方法包括：接收包含语音的用户交互视频；将所述用户交互视频分离为视频帧和语音，将所述语音转换为文本，得到多模态数据；根据所述多模态数据分别获取基于视频、语音、文本的情绪感知结果及感知编码，所述情绪感知结果是情绪感知模型的决策结果，所述感知编码是情绪感知模型的中间信息；根据各模态的情绪感知结果或感知编码确定控制标签向量，所述控制标签向量用于使对应不同模态数据的生成内容具有情感一致性；将所述控制标签向量融合到各模态的感知编码中，根据融合后的各模态的感知编码分别生成基于视频、语音、文本的生成内容；将所述基于视频、语音、文本的生成内容进行合成处理，得到合成视频。

全文数据：

权利要求：

百度查询：华院计算技术(上海)股份有限公司数字人交互方法及系统、计算机可读存储介质、数字人设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种种子播种立方及其制备方法_俊富生态修复科技有限公司_202410577693.4

下一篇：一种多腔气管导管及气管穿刺器_皖南医学院第一附属医院(皖南医学院弋矶山医院)_202410473717.1

相关技术

一种种子播种立方及其制备方法_俊富生态修复科技有限公司_202410577693.4

一种多腔气管导管及气管穿刺器_皖南医学院第一附属医院(皖南医学院弋矶山医院)_202410473717.1

跨平台数据关联方法、装置、电子设备及计算机存储介质_深圳市云积分科技有限公司_202410398091.2

一种铝基复合材料及其增材制备方法与应用_湘潭大学_202410442969.8

基于批量打开多项式承诺的可验证秘密分享方法及系统_山东大学_202410493240.3

基于LSTM与Transformer的四序列系统发育树重建方法及系统_西安交通大学_202410287236.1

车载仪表显示方法、装置、电子设备及存储介质_亿咖通(湖北)技术有限公司_202410344662.4

一种水稻育秧用无机纤维基质及制备方法_盛和深_202410641494.5

触控显示面板、触控显示面板的制备方法和触控显示装置_京东方科技集团股份有限公司_202410338338.1

一种超氧治疗静脉曲张输液装置及其使用方法_三河通济医院_202410416653.1

基于数据分析的消化内镜远程处理方法_山东第一医科大学附属省立医院(山东省立医院)_202410666156.7

一种含四重氢键的聚氨酯抗冲击材料及其制备方法和应用_北京理工大学_202410480824.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】数字人交互方法及系统、计算机可读存储介质、数字人设备_华院计算技术(上海)股份有限公司_202311057771.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务