买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:江苏鑫合易家信息技术有限责任公司
摘要:本发明公开了一种基于LLM2Vec算法的文本查重方法及系统,用于文本查重技术领域,该基于LLM2Vec算法的文本查重方法及系统包括以下步骤:使用LLM2Vec算法将文本转换为特征向量;利用余弦相似度方法计算各特征向量之间的余弦相似度;预设相似度阈值,将计算得到的余弦相似度与相似度阈值比较,并判断本文之间是否相似。本发明通过生成高质量文本向量表示的文本编码器,不仅能够捕捉文本的丰富语义信息,还能够区分不同文本之间的细微差别,这对于各种自然语言处理任务都是非常有价值的。
主权项:1.一种基于LLM2Vec算法的文本查重方法,其特征在于,该基于LLM2Vec算法的文本查重方法及系统包括以下步骤:S1、使用LLM2Vec算法将文本转换为特征向量;S2、利用余弦相似度方法计算各特征向量之间的余弦相似度;S3、预设相似度阈值,将计算得到的余弦相似度与相似度阈值比较,并判断本文之间是否相似。
全文数据:
权利要求:
百度查询: 江苏鑫合易家信息技术有限责任公司 一种基于LLM2Vec算法的文本查重方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。