首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于自编码网络的碑文文字修复模型及修复方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:齐鲁工业大学

摘要:本发明涉及一种基于自编码网络的碑文文字修复模型及修复方法,属于碑文文字修复领域。本发明采用上下文编码器,包括生成器和判别器,其中生成器采用变分自编码器,包括一个编码器和解码器;每一个卷积模块都有激活函数层,C2~C5层采用ReLU激活函数,C1层、C6~C9层和DC1~DC4层均采用ELU激活函数,C10层采用Tanh激活函数。本发明选择的基础模型是变分自编码器,变分自编码器的编码器不向解码器传递局部特征,降低了模型的复杂度。变分自编码器结合GAN网络使修复模型更稳定,模型易于训练,比较容找到模型的最优解。

主权项:1.一种基于自编码网络的碑文文字修复模型的修复方法,其特征在于,碑文文字修复模型采用上下文编码器,包括生成器和判别器,其中生成器采用变分自编码器,包括一个编码器和解码器;生成器包括卷积层C1层、4层扩张卷积C2~C5层,卷积层C6~C9层、4层反卷积DC1~DC4层以及卷积层C10层,判别器包括4层卷积层C11~C14层和一层全连接层;每一个卷积模块都有激活函数层,C2~C5层采用ReLU激活函数,C1层、C6~C9层和DC1~DC4层均采用ELU激活函数,C10层采用Tanh激活函数;生成器的编码器负责学习遮挡碑文文字的结构语义特征;编码器将学习到碑文文字的语义特征传递给生成器的解码器,解码器根据学习到的语义特征反卷积进行碑文文字的重建;前向传播完成后,通过均方差损失函数和交叉熵损失函数分别计算重建损失和对抗损失;将模型的梯度清零,反向传播,根据重建损失和对抗损失的联合损失使用Adam优化器优化模型的生成器和判别器;模型的生成器和判别器不断优化,最后达到一种平衡,生成器生成出的碑文文字能骗过判别器的识别判别器能识别出生成器生成的碑文文字和原碑文文字;模型的重建损失如下式所示: 其中,x是指原文字图像,M是掩码函数,将64*64大小的原图输入到掩码函数中,得到一张随机位置遮挡25%面积的遮挡图;G是模型的生成器,将遮挡图输入到生成器中,重建输出碑文文字;模型的对抗损失如下式所示: 其中,D是判别器,判别输入的碑文文字是原碑文文字还是生成器重建的碑文文字;联合损失函数是加权重建损失和对抗损失,如下所示: 其中,是重建损失,是对抗损失,λ是总的损失函数的权重;以柳公权的《玄秘塔碑》和《金钢经》中的碑文文字作为模型的训练集和测试集,其中模型训练集有4000张碑文文字图像;修复方法,包括以下步骤:1碑文数据集收集;2将收集的碑文数据集借用Opencv工具包进行数据预处理,首先对截取出的碑文文字做去噪处理,调用Opencv的去噪函数和高斯滤波器去噪;然后阈值处理,将碑文文字处理成单通道二值图像;最后重置碑文文字的大小,重置成模型输入的大小64x64x1;3将预处理后的图像进行标准化,并分配训练集和测试集;4将训练集输入碑文文字修复模型,对模型进行训练、测试,得到训练后的碑文文字修复模型;5将预处理后的待修复的碑文文字输入已训练好的碑文文字修复模型,遮挡碑文文字输入到生成器,经过编码器的学习和解码器的重建,模型的生成器输出修复好的碑文文字;6在模型输出重建后的碑文文字后对其进行像素向上取整纠错;步骤3中,图像像素值的范围是0-255,标准化是将像素值的范围从0-255压缩到-1~1之间,修复完后再扩大到0-255,单通道二值图为一个二阶矩阵,即将像素值压缩到-1~1之间。

全文数据:

权利要求:

百度查询: 齐鲁工业大学 一种基于自编码网络的碑文文字修复模型及修复方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。