买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:平安银行股份有限公司
摘要:本发明涉及人工智能技术,揭露一种文本定长纠错方法,包括:对数据增强后的文本集进行向量化,得到训练文本向量并输入至深度纠错模型中进行错误探查,得到拼写是否正确的输出结果,根据输出结果对训练文本向量进行软遮罩连接,得到嵌入数据,对嵌入数据进行纠错得到纠错结果,根据纠错结果计算所得的深度纠错模型的交叉熵损失值调整深度纠错模型的模型参数,输出标准深度纠错模型,将待纠错数文本输入至标准深度纠错模型中,基于预设的多轮纠错机制得到纠错后的正确文本。此外,本发明还涉及区块链技术,纠错结果可存储于区块链的节点。本发明还提出一种文本定长纠错装置、电子设备以及存储介质。本发明可以解决文本定长纠错的准确度较低的问题。
主权项:1.一种文本定长纠错方法,其特征在于,所述方法包括:获取原始文本集,对所述原始文本集进行数据增强处理,得到训练文本集;对所述训练文本集进行向量化处理,得到训练文本向量;将所述训练文本向量输入至预设的深度纠错模型的错误探查网络中进行错误探查,得到拼写是否正确的输出结果,包括:分别对所述训练文本向量进行正向编码和反向编码,得到正向编码向量和反向编码向量,对所述正向编码向量和所述反向编码向量进行横向合并,得到编码隐藏向量,将所述编码隐藏向量输入至全连接层中进行二分类处理,得到拼写是否正确的输出结果;根据所述拼写是否正确的输出结果,利用预设的遮罩系数公式和所述编码隐藏向量计算得到遮罩系数,根据所述遮罩系数、预设的软遮罩连接公式对所述训练文本向量中拼写错误的向量进行计算,得到嵌入数据;利用所述深度纠错模型的纠错网络中的多个编码层对所述嵌入数据进行编码处理,并取所述多个编码层中最后一个编码层的隐藏状态,对所述隐藏状态与所述训练文本向量进行残差连接,得到连接值,将所述连接值输入至所述纠错网络的全连接层中,得到纠错结果;根据所述纠错结果计算所述深度纠错模型的交叉熵损失值,并根据所述交叉熵损失值调整所述深度纠错模型的模型参数,输出标准深度纠错模型;将预获取的待纠错文本输入至所述标准深度纠错模型中,基于预设的多轮纠错机制,得到纠错后的正确文本。
全文数据:
权利要求:
百度查询: 平安银行股份有限公司 文本定长纠错方法、装置、设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。