买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京中数睿智科技有限公司
摘要:本发明涉及数据处理技术领域,具体涉及用于特殊公文的大模型生成数据可靠性检测方法及系统。方法包括:获取会议内容和利用大模型生成的会议记录,并获取对应的词向量;分析会议内容的词向量与语料库中的词向量的相似情况,筛选直接相关词向量;结合直接相关词向量与非直接相关词向量之间的相似情况以及位置分布特征,筛选间接相关词向量;基于每种特征词向量对应的词语在文章中的相对位置关系以及出现的次数,得到每种特征词向量的核心程度值,特征词向量包括直接相关词向量和间接相关词向量;融合会议记录的每个词向量在语料库中出现的次数和核心程度值,对会议记录的可靠性进行评价。本发明提高了大模型生成数据可靠性检测结果的准确度。
主权项:1.一种用于特殊公文的大模型生成数据可靠性检测方法,其特征在于,该方法包括以下步骤:获取会议内容,基于所述会议内容利用大模型生成会议记录;并获取所述会议内容的词向量、所述会议记录的词向量以及语料库中的词向量;分析会议内容的词向量与语料库中的词向量之间的相似情况,筛选会议内容的每个词向量的直接相关词向量;结合每个直接相关词向量与每个非直接相关词向量之间的相似情况以及位置分布特征,筛选会议内容的每个词向量的间接相关词向量,所述非直接相关词向量为语料库中除所述直接相关词向量外的词向量;基于每种特征词向量对应的词语在文章中的相对位置关系以及出现的次数,得到每种特征词向量的核心程度值,所述特征词向量包括所述直接相关词向量和所述间接相关词向量;融合所述会议记录的每个词向量在语料库中出现的次数和所述核心程度值,对所述会议记录的可靠性进行评价。
全文数据:
权利要求:
百度查询: 北京中数睿智科技有限公司 用于特殊公文的大模型生成数据可靠性检测方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。