首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种获取文本相似度的方法、装置、设备及可读存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中兴通讯股份有限公司

摘要:本文公开了一种获取文本相似度的方法、装置、设备及可读存储介质,属于通信技术领域,该方法包括:根据文本对数据集得到所述文本对的数值特征;通过所述文本对的数值特征构造样本特征矩阵;根据所述样本特征矩阵和预测向量进行模型训练,得到预测模型;获取目标文本对,根据所述样本特征矩阵和所述预测模型获取所述目标文本对的相似度得分;通过获取文本对的多个数值特征,兼顾语义和句法结构,来判断文本相似度,具有权重可训练、人工干预少、简单快捷、易于实施、准确率高等优点,提高了用户体验。

主权项:1.一种获取文本相似度的方法,其特征在于,包括:根据文本对数据集得到所述文本对的数值特征,所述数值特征包括:基于有序编辑距离的语义特征,基于无序编辑距离的语义特征,基于词义距离的语义特征,基于依存关系的句法特征;通过所述文本对的数值特征构造样本特征矩阵;根据所述样本特征矩阵和预测向量进行模型训练,得到预测模型;获取目标文本对,根据所述样本特征矩阵和所述预测模型获取所述目标文本对的相似度得分;其中,所述基于有序编辑距离的语义特征是根据所述文本对数据集的词向量矩阵和编辑距离,获取的文本对之间的第一改进编辑距离,所述基于无序编辑距离的语义特征是根据所述编辑距离和词袋模型,获取的文本对之间的第二改进编辑距离,所述基于词义距离的语义特征是根据所述词向量矩阵,获取的文本对之间的词义距离,所述基于依存关系的句法特征是对所述文本对进行依存句法分析获取的所述文本对之间的句法距离。

全文数据:

权利要求:

百度查询: 中兴通讯股份有限公司 一种获取文本相似度的方法、装置、设备及可读存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。