首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于图像处理技术的样本增广方法、系统及介质_浪潮金融信息技术有限公司_202111119925.4 

申请/专利权人:浪潮金融信息技术有限公司

申请日:2021-09-24

公开(公告)日:2024-06-07

公开(公告)号:CN113792815B

主分类号:G06V10/75

分类号:G06V10/75;G06V10/56;G06V10/28

优先权:

专利状态码:有效-授权

法律状态:2024.06.07#授权;2022.05.17#实质审查的生效;2021.12.14#公开

摘要:本发明公开了一种基于图像处理技术的样本增广方法、系统及介质,所述方法包括以下步骤:配置下载程序、图像捕捉模块和样本存放容器;设置基准色彩值;基于下载程序、图像捕捉模块、样本存放容器和基准色彩值创建字符手写样本集;配置二值化算法和形状集合表;设置占比值区间和第一色彩;基于字符手写样本集、二值化算法、形状集合表、占比值区间和第一色彩设定非中文字符样本和中文字符样本;配置样本处理方案;基于样本处理方案对非中文字符样本和中文字符样本执行样本增广操作,得到增广样本集;本发明能够筛查手写录入的样本,并得出最符合处理条件的样本,后续根据样本类别采用图像处理对样本进行多方面处理,得到高有效性字符样本。

主权项:1.一种基于图像处理技术的样本增广方法,其特征在于,包括以下步骤:样本采集步骤:配置下载程序、图像捕捉模块和样本存放容器;设置基准色彩值;基于所述下载程序、所述图像捕捉模块、所述样本存放容器和所述基准色彩值创建字符手写样本集;样本区分步骤:配置二值化算法和形状集合表;设置占比值区间和第一色彩;基于所述字符手写样本集、所述二值化算法、所述形状集合表、所述占比值区间和所述第一色彩设定非中文字符样本和中文字符样本;样本扩充步骤:配置样本处理方案;基于所述样本处理方案对所述非中文字符样本和所述中文字符样本执行样本增广操作,得到增广样本集;所述基于所述下载程序、所述图像捕捉模块、所述样本存放容器和所述基准色彩值创建字符手写样本集的步骤进一步包括:调用所述下载程序下载若干第一字符样本;调用所述图像捕捉模块捕捉若干第二字符样本;对若干所述第一字符样本和若干所述第二字符样本执行第一图像处理操作,得到若干第三字符样本;将若干所述第三字符样本置入所述样本存放容器中,得到所述字符手写样本集;所述第一图像处理操作包括:检测若干所述第一字符样本的若干第一色彩值以及若干所述第二字符样本的若干第二色彩值;设定与所述基准色彩值相匹配的所述第一色彩值和所述第二色彩值分别对应的所述第一字符样本和所述第二字符样本均为第一达标样本;设定若干所述第一字符样本和若干所述第二字符样本中除所述第一达标样本外的所述第一字符样本和所述第二字符样本均为未达标样本;对所述未达标样本进行去色处理,直至所述未达标样本的第三色彩值与所述基准色彩值相匹配,则得到第二达标样本;设定所述第一达标样本和所述第二达标样本均为所述第三字符样本;所述形状集合表中配置有若干字符形状;所述基于所述字符手写样本集、所述二值化算法、所述形状集合表、所述占比值区间和所述第一色彩设定非中文字符样本和中文字符样本的步骤进一步包括:调用所述二值化算法对若干所述第三字符样本进行二值化处理,得到若干待区分字符样本;识别所述待区分字符样本的第一形状以及所述待区分字符样本中对于所述第一色彩的第一占比值;判断所述形状集合表中是否存在与所述第一形状相匹配的字符形状,若存在,则判断所述第一占比值是否位于所述占比值区间内,若处于,则设定该待区分字符样本为所述非中文字符样本;设定若干所述待区分字符样本中除所述非中文字符样本外的所述待区分字符样本均为所述中文字符样本;所述配置样本处理方案的步骤进一步包括:配置第一方案模板和第二方案模板;设置与所述中文字符样本和所述非中文字符样本分别匹配的第一处理信息和第二处理信息;将所述第一处理信息填充至所述第一方案模板中,得到第一处理方案;将所述第二处理信息填充至所述第二方案模板中,得到第二处理方案;所述第一处理方案和所述第二处理方案均为所述样本处理方案;所述第一处理信息包括:第一缩进像素值、第一延长像素值、第一旋转角度、第一缩进处理位置和第一延长处理位置;所述第二处理信息包括:第二缩进像素值、第二延长像素值、第二放大倍数、第二缩小倍数、第二缩进处理位置和第二延长处理位置;所述样本增广操作包括:配置增广样本放置容器;基于所述第二处理方案对所述非中文字符样本执行非中文样本扩充步骤,得到扩充非中文样本;基于所述第一处理方案对所述中文字符样本执行中文样本扩充步骤,得到扩充中文样本;将所述扩充非中文样本和所述扩充中文样本置入所述增广样本放置容器中,得到所述增广样本集;所述非中文样本扩充步骤包括:按照所述第二延长处理位置和所述第二延长像素值对所述非中文样本进行延长处理,得到第一非中文样本;按照所述第二缩小倍数对所述第一非中文样本进行缩小处理,得到第二非中文样本;按照所述第二缩进处理位置和所述第二缩进像素值对所述第二非中文样本进行缩进处理,得到第三非中文样本;按照所述第二放大倍数对所述第三非中文样本进行放大处理,得到所述扩充非中文样本;所述中文样本扩充步骤包括:按照所述第一缩进处理位置和所述第一缩进像素值对所述中文字符样本的笔画端部进行缩进处理,得到第一中文样本;按照所述第一旋转角度对所述第一中文样本进行旋转处理,得到第二中文样本;按照所述第一延长处理位置和所述第一延长像素值对所述第二中文样本的笔画端部进行延长处理,得到所述扩充中文样本。

全文数据:

权利要求:

百度查询: 浪潮金融信息技术有限公司 一种基于图像处理技术的样本增广方法、系统及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。