首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

信息处理装置、车辆、计算机可读存储介质以及信息处理方法 

申请/专利权人:本田技研工业株式会社

申请日:2021-01-13

公开(公告)日:2024-06-28

公开(公告)号:CN113221933B

主分类号:G06V20/59

分类号:G06V20/59;G06V40/16;G06V10/82;G10L25/30;G10L25/63

优先权:["20200206 JP 2020-019021"]

专利状态码:有效-授权

法律状态:2024.06.28#授权;2021.08.24#实质审查的生效;2021.08.06#公开

摘要:本发明涉及能够推测用户的感情的信息处理装置、车辆、计算机可读存储介质以及信息处理方法。该信息处理装置具备:第1特征量信息获取部,其获取从用户的讲话语音抽取出的声学特征量矢量和语言特征量矢量;第2特征量信息获取部,其获取从用户的面部图像抽取出的图像特征量矢量;以及感情推测部,其具有已学习模型,基于来自第2注意力层的输出矢量而推测用户的感情,已学习模型具有第1注意力层和第2注意力层,上述第1注意力层将根据声学特征量矢量生成的第1矢量以及根据图像特征量矢量生成的第2矢量作为输入,上述第2注意力层将来自第1注意力层的输出矢量和根据语言特征量矢量生成的第3矢量作为输入。

主权项:1.一种信息处理装置,具备:第1特征量信息获取部,获取从用户的讲话语音抽取出的声学特征量矢量和语言特征量矢量;第2特征量信息获取部,获取从所述用户的面部图像抽取出的图像特征量矢量;以及感情推测部,具有已学习模型,基于第2输出矢量而推测所述用户的感情,所述已学习模型具有第1注意力层和第2注意力层,该第1注意力层基于所述声学特征量矢量和所述图像特征量矢量而生成第1输出矢量,该第2注意力层基于所述第1输出矢量和所述语言特征量矢量而生成所述第2输出矢量;其中,所述声学特征量矢量由从所述用户的讲话语音得到的M个语音帧中分别提取的M个特征量矢量构成;所述图像特征量矢量由从拍摄所述用户的面部的动态图像数据得到的P个图像帧中分别提取的P个特征量矢量构成;所述第1注意力层将由从所述声学特征量矢量生成的M个特征量矢量构成的第1矢量和由从所述图像特征量矢量生成的P个特征量矢量构成的第2矢量作为输入;基于所述第1矢量和所述第2矢量计算构成所述第2矢量的P个矢量的各自的注意力权重;通过所述注意力权重,对构成所述第2矢量的所述P个矢量进行加权,计算得到构成所述第1输出矢量的M个矢量。

全文数据:

权利要求:

百度查询: 本田技研工业株式会社 信息处理装置、车辆、计算机可读存储介质以及信息处理方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。