首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于图文识别后的文字学习校对系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:沈阳出版社有限公司

摘要:本发明公开了一种基于图文识别后的文字学习校对系统,涉及文字校对领域,包括用户登录模块、图文管理模块、图文识别模块、用户管理模块以及识别结果管理模块;该基于图文识别后的文字学习校对系统,将图文信息记录到图文数据表中,对用户输入的图文信息进行文字检测,其中文字检测包括错字检测以及行检测,对文字检测模块检测完成的图文数据进行文字调整,其中文字调整包括错别字调整以及位置调整,进行文字识别以及易混淆字识别,同时对易混淆字进行易混淆字调整,这样设置不仅可以实现对图文信息的文字识别同时在进行文字识别时有针对性的对易混淆字进行识别与调整,减少了文字识别过程中错误发生的概率。

主权项:1.一种基于图文识别后的文字学习校对系统,其特征在于,包括:用户登录模块,所述用户登录模块用于帮助用户注册和登录图文识别系统,然后进行图文图片的检测和识别,每当有新的用户进行注册后,用户表里就会记录新的用户名称以及密码;图文管理模块,所述图文管理模块用于负责管理用户输入的图文信息,当用户在系统中输入图文之后,图文的信息会被记录到图文数据表中,记录图文的信息可以保证每一次被识别的图文都有迹可循,方便以后的查阅和修改;图文识别模块,所述图文识别模块用于接收图文管理模块输入的图文数据,并对接收的图文数据进行文字检测、文字调整以及文字识别,所述图文识别模块包括:文字检测模块,所述文字检测模块用于对图文识别模块接收的图文管理模块输入的图文数据后进行文字检测,所述文字检测包括易混淆字检测、错字检测以及行检测;文字调整模块,所述文字调整模块用于对文字检测模块检测完成的图文数据进行文字调整,所述文字调整包括易混淆字调整、错别字调整以及位置调整;文字识别模块,所述文字识别模块用于对文字调整模块调整完成的图文数据进行文字识别,所述文字识别模块包括以下工作步骤:A1,为填充文字笔画内的细微孔洞,使用泛洪填充算法,将背景填充为白色像素点,对填充后的图像进行图像非运算,对原始图像和非运算操作后的图像进行图像异或运算,通过以上三个步骤,能够完全填充文字笔画内的细小空洞;A2,笔画区域仍然存在一些孤立的小点,通过开运算来进行消除;A3,笔画图像用RGB的三种不同权重进行处理,得到灰度图像,灰度处理的计算公式如下所示:其中R、G、B代表叶脉分割图像的三原色——红、绿、蓝的值,“Gray”表示灰度值;A4,为了保留更多笔画的细节,使用中值滤波平滑文字的轮廓并去除噪声点,具体包括以下步骤:A41,笔画图像的像素值被划分为[1,2,…,l]级,ni用来表示图像像素值的数量,因此,笔画图像的总像素值的计算公式如下所示:;A42,其中,图像中单个像素频率pi的计算公式如下所示:;A43,将两个变量定义为局部变量w0和变量w1频率值之和,二者关系如下公式所示:;A44,则笔画区域图像的前景像素频率u0和背景像素频率u1如下所示:其中,其中UT表示前景像素频率u0和背景像素频率u1之和;A5,使用最大类间方差法对图像进行二值处理;A6,为了测量笔画长度,最后再将原始形态学笔画算法融入,构建出细化算法从而获得没有毛刺的单像素笔画线;A7,通过组合获得的单像素笔画线从而得出待识别文字;用户管理模块,所述用户管理模块用于对用户的账户进行管理,维护用户信息;识别结果管理模块,所述识别结果管理模块用于负责管理识别结果,每当有一张新的图文传入系统时,识别出来的文字内容就会存储在识别结果数据表中。

全文数据:

权利要求:

百度查询: 沈阳出版社有限公司 一种基于图文识别后的文字学习校对系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。