买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京天润融通科技股份有限公司
摘要:本发明提供了一种文本相似度最佳阈值自动寻找及优化方法及装置。该方法包括:根据问题列表中每个问题的向量表示,计算问题相似度矩阵;遍历问题类别及问题相似度矩阵,得到问题类别平均相似度矩阵;判断是否有类间问题相似度大于类别平均相似度;如果有,则发现存在的配置问题,并重复上述操作,直至不再存在类间问题相似度大于类别平均相似度的情况;当不再存在类间问题相似度大于类别平均相似度的情况时,遍历问题类别平均相似度矩阵,得到最优相似度阈值。本发明提供的文本相似度最佳阈值自动寻找及优化方法及装置能够自动寻找适合该机器人已配置数据集的相似度阈值。
主权项:1.一种文本相似度最佳阈值自动寻找及优化方法,其特征在于,包括:获取对话机器人的FAQ数据配置的问题列表;形成问题类别列表,使用NLP技术文本表示算法或深度学习预训练模型得到每个问题文本的向量表示;根据问题列表中每个问题的向量表示,计算问题相似度矩阵;选取问题列表中的一个问题;根据该问题的类别配置,计算该问题的类别平均相似度;根据问题相似度矩阵,判断与该问题有关的类间问题相似度是否大于类别平均相似度;若存在类间问题相似度大于类别平均相似度,则对对应的类别配置进行优化,并循环至获取对话机器人的FAQ数据配置的问题列表,直至不再存在类间问题相似度大于类别平均相似度的情况;当不再存在类间问题相似度大于类别平均相似度的情况时,遍历问题类别平均相似度矩阵,得到最优相似度阈值。
全文数据:
权利要求:
百度查询: 北京天润融通科技股份有限公司 文本相似度最佳阈值自动寻找及优化方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。