首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种试卷识别方法和系统 

申请/专利权人:江苏新狮科技有限责任公司;中国矿业大学

申请日:2024-03-24

公开(公告)日:2024-06-21

公开(公告)号:CN118230330A

主分类号:G06V30/146

分类号:G06V30/146;G06V30/148;G06V30/18

优先权:

专利状态码:在审-公开

法律状态:2024.06.21#公开

摘要:本发明公开了一种试卷识别方法和系统,识别方法包括如下步骤:对试卷内每页图片特征进行矫正;利用角度信息旋转矩阵对图片进行旋转,后将旋转后的图片转换为灰度图,利用OTSU二值化算法进行图片二值化,之后通过膨胀操作来增强图片的边界,通过轮廓检测方法计算出试卷边框;裁剪掉试卷的页码与其他干扰项获取试题内容,将试卷内容合并为一张长图;获取题目编号;通过题目编号计算题目坐标信息,对试卷题目进行分割处理并保存;获取文字区域坐标,将题目与示意图的对应关系;将分割后的图片题目内容分为公式区域与非公式区域,将公式区域内容识别成对应Latex公式,将非公式区域的文字与Latex公式进行拼接,获取完整题目。

主权项:1.一种试卷识别方法,其特征在于,包括如下步骤:S10:对试卷内每页图片特征进行矫正,将每页图片转成灰度图,使用Canny边缘检测算法对所述图片进行边缘检测,然后使用霍夫变换HoughTransform检测图片中的直线并计算角度;S20:利用角度信息旋转矩阵对图片进行旋转,后将旋转后的图片转换为灰度图,利用OTSU二值化算法进行图片二值化,之后通过膨胀操作来增强图片的边界,通过轮廓检测方法计算出试卷边框;S30:裁剪掉试卷的页码与其他干扰项获取试题内容,将试卷内容图片宽度进行统一后合并为一张长图;S40:通过对试卷的指定区域进行针对性识别,对识别内容进行处理后获取题目编号;S50:通过题目编号计算题目坐标信息,对试卷题目进行分割处理并以图片格式保存到本地;S60:调整分割后的图片,如果图片高度过小,则补充空白区域至图片上下部;S70:通过OCR识别题目并进行处理,获取文字区域坐标,将文字区域与示意图分割后分别进行保存,形成题目与示意图的对应关系;S80:对分割后的图片题目内容进行检测分为公式区域与非公式区域,将公式区域内容通过模型识别成对应Latex公式,对非公式区域进行文字识别,后将识别出的文字与Latex公式进行拼接,获取完整题目。

全文数据:

权利要求:

百度查询: 江苏新狮科技有限责任公司;中国矿业大学 一种试卷识别方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。