首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于目标检测的吊线图族谱数字化方法、系统及设备_武汉大学_202211427898.1 

申请/专利权人:武汉大学

申请日:2022-11-15

公开(公告)日:2023-03-14

公开(公告)号:CN115797957A

主分类号:G06V30/416

分类号:G06V30/416;G06T7/62

优先权:

专利状态码:在审-实质审查的生效

法律状态:2023.03.31#实质审查的生效;2023.03.14#公开

摘要:本发明公开了一种基于目标检测的吊线图族谱数字化方法、系统及设备,首先预处理族谱图像,包括灰度化处理,二值化处理;得到吊线图水平投影图,并去除标题部分,再拼接两侧图片,并剔除世代标识;然后针对预处理后的族谱图像,基于最大稳定极值区域算法MSER,获得姓名区域;拆解出MSER对象中包含的姓名区域坐标和姓名区域边长,根据姓名区域的左上角坐标和姓名边长得到姓名区域左上和右下角的坐标coordinates;基于MSER对象得到的坐标coordinates,剔除重叠率高于阈值A的区域;接着基于几何位置融合偏旁部首,和识别吊线区域;最后识别姓名区域;本发明在族谱自动化录入方面,提高了族谱录入效率,提高了族谱数字化水平。

主权项:1.一种基于目标检测的吊线图族谱数字化方法,其特征在于,包括以下步骤:步骤1:预处理族谱图像,包括灰度化处理,对灰度图进行二值化处理;基于二值化图像,得到吊线图水平投影图;基于水平投影图特征,去除标题部分,再拼接两侧图片;基于拼接后图片的水平投影图,剔除世代标识;步骤2:针对预处理后的族谱图像,基于最大稳定极值区域算法MSER,得到文字区域大致位置;拆解出MSER对象中包含的文字区域坐标和文字区域区域边长,根据文字区域的左上角坐标和文字边长得到文字区域左上和右下角的坐标coordinates;基于MSER对象得到的坐标coordinates,剔除重叠率高于阈值A的区域;步骤3:基于几何位置融合偏旁部首;将步骤2中获得的文字区域作为候选区域,遍历候选区域,得到每个候选区域的几何中心,若两个候选区域几何中心之间的距离小于阈值B,按两区域最大范围融合;步骤4:剔除吊线区域以及非文字区域;根据图像中文字所占的像素面积大小,设置阈值C,遍历所有候选区域,若候选区域面积小于该阈值C,则判断该区域非文字区域;根据图像中识别到的吊线与汉字几何特征不同,设置候选区域的长宽比阈值D,若检测区域的长宽比大于阈值D,则判定为吊线区域;将非文字区域和吊线区域的坐标置0并集中删除;步骤5:融合文字区域为姓名区域;遍历候选区域,得到候选区域的几何中心,如果两个候选区域的几何中心小于阈值E,则视为两个文字同属一个姓名,按两区域最大范围融合,得到精确的姓名区域。

全文数据:

权利要求:

百度查询: 武汉大学 基于目标检测的吊线图族谱数字化方法、系统及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。