买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京万方数据股份有限公司;北京邮电大学
摘要:本公开实施例提供了一种学术不端文本识别方法、装置、电子设备和存储介质,涉及数据挖掘技术领域。方法包括:解析待识别文本,获取待识别文本中多个不同组成部分的内容文本;将多个内容文本,分别输入各内容文本对应的、预先训练的文本检测模型中,获取各文本检测模型输出的检测结果,检测结果用于指示基于对应文本内容预测待识别文本为学术不端文本的概率;根据各检测结果,确定待识别文本的识别结果,识别结果用于指示待识别文本是否为学术不端文本。通过解析得到待识别文本对应的内容文本并分别使用对应的文本检测模型进行检测,能够获取多个不同维度的检测结果,综合各检测结果确定识别结果,能够有效提高学术不端文本识别结果的准确性。
主权项:1.一种学术不端文本识别方法,其特征在于,包括:解析待识别文本,获取所述待识别文本中多个不同组成部分的内容文本;将多个内容文本,分别输入各内容文本对应的、预先训练的文本检测模型中,获取各文本检测模型输出的检测结果,所述检测结果用于指示基于对应文本内容预测所述待识别文本为学术不端文本的概率;根据各检测结果,确定所述待识别文本的识别结果,所述识别结果用于指示所述待识别文本是否为学术不端文本;其中,所述文本检测模型是根据携带标签的样本内容文本训练得到的,所述标签用于指示所述样本内容文本是否来源于学术不端文本。
全文数据:
权利要求:
百度查询: 北京万方数据股份有限公司 北京邮电大学 学术不端文本识别方法、装置、电子设备和存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。