【发明授权】基于分块编码与Transformer的中文字形字库自动生成方法及系统_北京大学_202111635060.7

导航：龙图腾网> 最新专利技术> 基于分块编码与Transformer的中文字形字库自动生成方法及系统_北京大学_202111635060.7

申请/专利权人：北京大学

申请日：2021-12-29

公开（公告）日：2024-06-21

公开（公告）号：CN114332260B

主分类号：G06T9/00

分类号：G06T9/00;G06T3/4038;G06N3/0455;G06N3/0464;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.06.21#授权;2022.04.29#实质审查的生效;2022.04.12#公开

摘要：本发明公布了一种基于分块编码与Transformer的中文字形字库自动生成方法及系统，包括第一阶段模型和第二阶段模型；基于分块编码的字形图片编码方法和基于Transformer的少样本高质量字形图片生成方法；通过设计用于降低Transformer计算成本的分块编码，只需要少量用户图片作为参考，将字形图片编码为适用于Transformer生成的序列格式，再使用Transformer生成带有目标风格的高分辨率汉字字形图片，最后对字形图片进行矢量化，得到完整的中文字形和字库文件。采用本发明技术方案，只需要少量用户图片作为参考，能够生成用户指定风格的高分辨率的字形图片和中文字库。

主权项：1.一种基于分块编码与Transformer的中文字形字库自动生成方法，包括：基于分块编码的字形图片编码方法和基于Transformer的少样本高质量字形图片生成方法；通过设计用于降低Transformer计算成本的分块编码，只需要少量用户图片作为参考，将字形图片编码为适用于Transformer生成的序列格式，再使用Transformer生成带有目标风格的高分辨率汉字字形图片，最后对字形图片进行矢量化，得到完整的中文字形和字库文件；包括以下步骤：第一步，获取用户输入汉字图片；第二步，选取已有字体，渲染所需字符集GB2312中字符对应的字形图片，得到预训练字形图片；渲染图片大小与用户输入汉字图片相同；并选择一种字体作为源字体；第三步，采用基于分块编码的字形图片编码方法，对第一步的用户输入汉字图片与第二步的预训练字形图片进行编码，将待编码的汉字字形图片编码为适用于Transformer处理的向量序列；包括以下步骤：31根据待编码字形图片I的分辨率H×W，确定图片区B×B、图片块P×P的大小，以及图片块长度、风格长度、内容长度、五笔编码向量长度，记为Lc，Lstyle，Lchar，Lw；其中，H为待编码字形图片高度；W为待编码字形图片宽度；B为图片区边长；P为图片块边长；H、W、B、P的单位均为像素；32根据图片块大小、字符种类数、字体风格种类数与步骤31中的向量长度，确定图片块、内容、风格、五笔编码表包含的向量个数与向量大小，并在正态分布中随机选取向量初始化编码表；33将待编码字形图片I划分为多个图片区，对于每一个图片区，进一步划分为多个图片块；34将步骤33中划分的每一个图片块展平为一个二进制数b；在图片块编码表中获得第b个图片块编码向量；进一步将得到的所有图片块编码向量组合为图片区编码向量xt；35根据待生成的目标字体编号、字符编号及其字符对应的五笔编码，在对应的编码表中获得相应的编码向量；并将步骤34得到的图片区编码向量xt与上述编码向量进行组合，得到字形编码向量x；36将步骤35得到的字形编码向量组合为一个序列，即得到适合Transformer处理的字形编码序列；第四步，使用编码后的预训练图片编码序列预训练模型参数，并使用编码后的用户输入图片编码序列微调并固定模型参数；模型包括第一阶段模型和第二阶段模型；第一阶段模型为“并行Transformer”模块，用于消除累计误差影响；第二阶段为“串行Transformer”模块，用于提高生成字形图片质量；预训练与微调模型参数过程包括：4A使用预训练数据对模型参数进行预训练；4Aa预训练第一阶段模型，其编码器输入为源字体字形图片编码序列Seqsource与参考图片字形编码序列Seqref；解码器输入为参考图片字形编码序列Seqref与空白图片字形编码序列Seqblank及其编码器输出，其中参考图片为目标风格的任意字形图片，空白图片为相同大小全部填充为白色的字形图片，第一阶段模型得到输出图片ITp；4Ab通过式1计算ITp与目标字形图片Itarget距离作为损失函数，并更新模型参数； 4Ac使用预训练的第一阶段模型，生成预训练数据对应的目标字形图片，并将其编码为序列；4Ad预训练第二阶段模型，其编码器输入为源字体字形图片编码序列Seqsource与第一阶段生成图片字形编码序列SeqTp；解码器输入为第一阶段生成图片字形编码序列SeqTp与目标图片字形编码序列SeqTs及其编码器输出；第二阶段模型得到输出图片ITs；4Ae通过式2计算ITs与实际目标字形图片Itarget距离作为损失函数，并更新模型参数； 4B使用用户数据对模型参数进行微调并固定参数，方法同步骤4A，区别在于使用用户输入汉字图片对应的字形编码序列对模型参数进行微调，并在训练后固定模型参数；第五步，使用固定参数的模型生成所需的目标字形图片。

全文数据：

权利要求：

百度查询：北京大学基于分块编码与Transformer的中文字形字库自动生成方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：升降销硬止动件_朗姆研究公司_202280073752.3

下一篇：用于处理车辆的路径选择的方法和系统_沃尔沃卡车集团_202311739282.2

相关技术

升降销硬止动件_朗姆研究公司_202280073752.3

用于处理车辆的路径选择的方法和系统_沃尔沃卡车集团_202311739282.2

紧急救援呼救方法、装置、系统及车辆_长城汽车股份有限公司_202410325030.3

一种高定向度W波段单定向耦合器_苏州伏波电子科技有限公司_202211653060.4

图像解码方法及其装置_LG电子株式会社_202280076929.5

用于提供更新的机器学习算法的系统和方法_西门子医疗有限公司_202311623232.8

一种微型电机防水密封检测装置_全南县超亚科技有限公司_202410179550.8

延时调节方法及装置、电子设备_北京小米移动软件有限公司_202211643851.9

一种基于无人机图像的安全帽与反光衣检测方法_东北林业大学_202410326065.9

一种隔振器_沈阳航空航天大学_202410227503.6

一种智能拍背装置_中日友好医院(中日友好临床医学研究所)_202410324763.5

一种基于遥测信号辅助的干涉测量带宽综合方法_北京航天飞行控制中心_202410175613.2

字形相关技术

一种人字形分料机构_创超科技(唐山)有限公司_202323143408.8

金属圆管件的T字形焊接结构_昆山嘉瑞汽车配件有限公司_202322844478.X

一种土字形外凸连接件_浙江亚厦装饰股份有限公司_202110623388.0

一种十字形采样头_石家庄禾柏生物技术股份有限公司_202323097049.7

一种十字形混凝土柱体结构_济南莱建置业有限公司_202323145917.4

品字形电抗器上下轭铁绕制机_陕西永生机电有限公司_202323174201.7

基于分块编码与Transformer的中文字形字库自动生成方法及系统_北京大学_202111635060.7

一种A字形换热器_浙江同星科技股份有限公司_202322567297.7

品字形电抗器上下轭铁翻转装置_陕西永生机电有限公司_202322905868.3

一种新型室外通信品字形光缆_长飞光电线缆(苏州)有限公司_202410266241.4

字库相关技术

字库生成方法、装置、电子设备和存储介质_约翰·楚_202211587257.2

基于帧插值的字库生成方法、电子设备、存储介质和系统_北京汉仪创新科技股份有限公司_202211244030.8

一种基于Web的智能中文字库在线协作设计系统_浙江大学_202311849748.4

一种热敏打印机本地字库管理方法以及相关装置_珠海芯烨电子科技有限公司_202410164453.1

轻量级字库显示方法、装置、微处理器及电子设备_深圳山灵数码科技发展有限公司_202311848818.4

一种热敏打印机本地字库管理方法以及相关装置_珠海芯烨电子科技有限公司_202410164453.1

一种字库绘制方法及系统_广州思林杰科技股份有限公司_202311686994.2

一种基于深度学习和部件拼接的中文字形及字库生成方法_北京大学_201911069573.9

一种模型训练及字库建立方法、装置、设备及存储介质_北京百度网讯科技有限公司_202111057836.1

TrueType字库的防盗信息嵌入方法及使用方法_富士施乐实业发展(中国)有限公司_201911242048.2

中文相关技术

基于知识库的中文文本自动校错系统及方法_长春职业技术学院_202410444832.6

一种基于语言预训练模型的中文文本匹配方法_苏州岽睿微电子科技有限公司_202410358147.1

国际中文教育行业发展的评估方法及电子设备_广东外语外贸大学_202410209787.6

基于边界增强和信息感知的中文讽刺目标识别方法_四川大学_202410273733.6

基于分块编码与Transformer的中文字形字库自动生成方法及系统_北京大学_202111635060.7

一种中文输入法候选词的搜索方法、终端及服务器_华为技术有限公司_201880090845.0

中文中乱码的处理方法、装置、设备及介质_深圳市瑞云科技股份有限公司_202410319362.0

中文医学命名实体识别方法、装置、电子设备和存储介质_中南大学_202410607772.5

基于小样本学习的多类型中文事件分类及要素抽取方法_中国电子科技集团公司第十研究所_202410283401.6

一种含错中文文本纠错识别分类设备_浙江大学_202111321911.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】基于分块编码与Transformer的中文字形字库自动生成方法及系统_北京大学_202111635060.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务