首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种含数学公式的输入文本的智能提取方法及系统_北京智谱华章科技有限公司_202410349731.0 

申请/专利权人:北京智谱华章科技有限公司

申请日:2024-03-26

公开(公告)日:2024-06-21

公开(公告)号:CN118230348A

主分类号:G06V30/42

分类号:G06V30/42;G06V30/413;G06V30/19;G06V30/26;G06V30/244

优先权:

专利状态码:在审-公开

法律状态:2024.06.21#公开

摘要:本发明属于文本处理技术领域,涉及一种含数学公式的输入文本的智能提取方法及系统,所述方法包括:1输入文本的格式判定、转换和预处理;2对预处理后的图片格式的文本进行角度矫正;3进行公式检测;4进行版面分析;5对于嵌入公式,根据公式检测框判断矫正后的OCR检测框是否包含嵌入公式并对包含嵌入公式的OCR检测框进行拆分,以获得纯文本的OCR检测框;6进行公式识别,以获得公式识别结果;7进行文本识别,以获得文本识别结果;8结合版面分析框及其版面类别对公式识别结果与文本识别结果进行同行检测框判定和合并,以获得输入文本的提取结果。其能够有效提高含数学公式的输入文本的提取效率和准确性。

主权项:1.一种含数学公式的输入文本的智能提取方法,其特征在于,包括以下步骤:1判定输入文本的格式,若输入文本的格式为非图片格式,则将输入文本转换为图片格式的文本并对图片格式的文本进行预处理;2对预处理后的图片格式的文本进行文本检测以获得OCR检测框,通过OCR检测框的宽高比和文本方向分类器判断是否对预处理后的图片格式的文本进行角度矫正,并在需要进行角度矫正时进行角度校正以获得矫正后的图片格式的文本和OCR检测框;3对矫正后的图片格式的文本进行公式检测,以得到公式检测框及其公式类别,所述公式类别包括嵌入公式和行间公式;4对矫正后的图片格式的文本进行版面分析,以得到版面分析框及其版面类别,所述版面类别包括标题、正文、图片、图注释、表格、表格注释、公式、页眉、页脚和参考文献;5对于嵌入公式,根据所述公式检测框判断矫正后的OCR检测框是否包含嵌入公式并对包含嵌入公式的OCR检测框进行拆分,以获得纯文本的OCR检测框;6根据所述公式检测框在矫正后的图片格式的文本中进行裁剪,以获得公式区域,使用公式识别模型对所述公式区域进行公式识别并对输出的LaTeX进行格式简化,以获得公式识别结果;7针对不同的场景使用对应的OCR识别模型对纯文本的OCR检测框进行文本识别,以获得文本识别结果;8结合版面分析框及其版面类别对公式识别结果与文本识别结果进行同行检测框判定和合并,以获得输入文本的提取结果。

全文数据:

权利要求:

百度查询: 北京智谱华章科技有限公司 一种含数学公式的输入文本的智能提取方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。