申请/专利权人:西北工业大学
申请日:2024-01-10
公开(公告)日:2024-04-26
公开(公告)号:CN117935241A
主分类号:G06V20/62
分类号:G06V20/62;G06V10/24;G06V10/25;G06V10/82
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.05.14#实质审查的生效;2024.04.26#公开
摘要:本申请的实施例涉及图像处理技术领域,公开了一种基于多项式拟合的场景文本检测方法,该方法包括:对样本图像上标注的文本区域框进行仿射变换,使得变换后的文本区域框的中心位于原点处且上长边的首尾两点的连线处于水平状态;对变换后的文本区域框进行多项式拟合,得到多项式系数,并将其标注为训练标签;将样本图像输入至初始网络中,获得预测多项式系数,并基于预测多项式系数和训练标签对初始网络进行迭代训练至收敛,得到训练完成的检测模型;将待检测图像输入至检测模型中,输出待检测图像中的文本区域。该方法需要学习的参数比较少且均符合视觉规律,模型训练压力较小,训练出的检测模型对于任意形状的文本区域都可以进行精准的识别。
主权项:1.一种基于多项式拟合的场景文本检测方法,其特征在于,包括:对样本图像上标注的文本区域框进行仿射变换,使得变换后的文本区域框的中心位于原点处且上长边的首尾两点的连线处于水平状态;对所述变换后的文本区域框进行多项式拟合,得到多项式系数,并将所述多项式系数标注为所述样本图像的训练标签;将所述样本图像输入至初始网络中,获得所述初始网络输出的预测多项式系数,并基于所述初始网络输出的预测多项式系数和所述训练标签,对所述初始网络进行迭代训练,直至所述初始网络收敛,得到训练完成的检测模型;将待检测图像输入至所述检测模型中,输出所述待检测图像中的文本区域。
全文数据:
权利要求:
百度查询: 西北工业大学 基于多项式拟合的场景文本检测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。