买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:山东声通信息科技有限公司;上海声通信息科技股份有限公司
摘要:本申请公开了一种跨语言文本中实体语义识别处理方法、系统及存储介质,根据不同单词和相同单词在不同语言类别中进行发声的音素的长度不同,记录多个音素不同组成方式和对应的含义,将一串发声的音素对应的多个单词构建语句表。将语句表中的多类语言类别的单词翻译为同一语义类别,使得能够按照单词的语义来进行语义识别。本申请根据用户停顿情况进行语义的检测相较于普通按照前一个单词进行检测,能够更加准确地进行语义识别,通过语句表进行多种语言的语义识别,大大减轻了计算机的计算量,更加准确快速的对其进行跨语言文本的语义识别。即,本申请的方案可以把包含不同语言类别的语句翻译成预设的语言类别的语句,且翻译准确性高。
主权项:1.一种跨语言文本中实体语义识别处理方法,其特征在于,包括:获得待检测语音图像和数据库音素集合;所述数据库音素集合包含数据库中的多类语言类别对应的音素以及所述音素转化为的傅里叶图像;所述待检测语音图像为待检测的语音信号通过傅里叶转化提取特征后的傅里叶图像;通过三角判定结构,基于所述待检测语音图像和数据库音素集合,得到相似音素集合;所述相似音素集合包含一个或多个相似音素和与相似音素对应的相似音素类别;所述相似音素表示数据库中与待检测语音图像对应的音素相似的音素;基于所述相似音素集合,获得音素对应的单词,基于音素对应的单词构建语句表;所述语句表包含多个元素,每个元素指向一个单词向量;所述单词向量包含单词键值对,所述单词键值对包括单词音素个数和指针符号;所述指针符号为指向所述音素对应的单词的索引符号;所述单词音素个数为一个或者多个;所述单词音素个数表示构成一个单词的音素的数量;根据语句表中对应的单词,按照不同语言类别的单词翻译为统一语言类别,得到翻译表;基于所述翻译表,按照翻译表中单词的位置和不同语言类别翻译后的语义,得到预测语句。
全文数据:
权利要求:
百度查询: 山东声通信息科技有限公司 上海声通信息科技股份有限公司 跨语言文本中实体语义识别处理方法、系统及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。