恭喜苏州匠数科技有限公司吴一超获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜苏州匠数科技有限公司申请的专利一种文本纠错方法、装置、计算机设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119149675B 。
龙图腾网通过国家知识产权局官网在2025-04-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411651413.6,技术领域涉及:G06F16/334;该发明授权一种文本纠错方法、装置、计算机设备及存储介质是由吴一超;蔡可妍;潘霖;卞豪设计研发完成,并于2024-11-19向国家知识产权局提交的专利申请。
本一种文本纠错方法、装置、计算机设备及存储介质在说明书摘要公布了:本公开提供了一种文本纠错方法、装置、计算机设备及存储介质,涉及计算机技术领域,该方法能够确定训练样本首选真值标签对应的次选真值标签,并基于首选真值标签和次选真值标签对文本纠错模型进行训练,从而使训练好的文本纠错模型确定的训练样本的次选真值标签作为真值结果的概率小于首选真值标签作为真值结果的概率、且大于非真值标签作为真值结果的概率,从而规避掉训练时正确标签单一带来的过拟合弊端,降低错检。
本发明授权一种文本纠错方法、装置、计算机设备及存储介质在权利要求书中公布了:1.一种文本纠错方法,其特征在于,包括:构建待训练的文本纠错模型,以及,获取所述文本纠错模型的多条训练样本,所述训练样本为包括至少一个错误字符的语句,所述错误字符对应的正确字符为所述错误字符的首选真值标签;确定与所述训练样本的首选真值标签匹配的至少一个次选真值标签;利用携带有首选真值标签的所述训练样本,以及所述训练样本对应的所述次选真值标签,对所述待训练的文本纠错模型进行训练,得到训练好的文本纠错模型;所述训练好的文本纠错模型使得训练样本的次选真值标签作为真值结果的概率小于首选真值标签作为真值结果的概率、且大于非真值标签作为真值结果的概率;获取待纠错文本,将所述待纠错文本输入至所述训练好的文本纠错模型,得到所述待纠错文本的纠错结果;所述确定与所述训练样本的首选真值标签匹配的至少一个次选真值标签,包括:针对任一错误字符,基于所述错误字符在所述训练样本语句中的上下文信息,生成含有所述上下文信息以及待定字符的第一字符序列;所述待定字符为所述错误字符在所述第一字符序列中的占位符;从语料数据集中查找与所述第一字符序列匹配的多种第二字符序列,并确定每种第二字符序列对应的出现频次;根据所述出现频次,从所述多种第二字符序列中确定出第三字符序列;确定所述第三字符序列中,与所述待定字符匹配的字符为所述次选真值标签。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州匠数科技有限公司,其通讯地址为:215100 江苏省苏州市吴中区临湖镇东山大道4168号2幢4楼410室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。