首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种文档分析与识别系统 

申请/专利权人:云南中烟工业有限责任公司

申请日:2024-04-16

公开(公告)日:2024-06-25

公开(公告)号:CN118245452A

主分类号:G06F16/16

分类号:G06F16/16;G06F18/20

优先权:

专利状态码:在审-公开

法律状态:2024.06.25#公开

摘要:本发明公开了一种文档分析与识别系统,包括数据采集与预处理模块、文档解析与分析模块、文档分类与识别模块、信息提取与分析模块和结果展示与应用模块;所述数据采集与预处理模块用于系统对文档数据进行采集和预处理,采集和预处理后的文档数据传输至文档数据库,文档数据库的文档经文档解析与分析模块处理,处理后的文档数据传输至文档分类与识别模块,分类与识别后系统进行文档信息提取与分析,分类提取后的文档数据传输至系统数据库,系统将该数据库的相关信息传输至系统应用平台。

主权项:1.一种文档分析与识别系统,其特征在于,包括以下步骤:S1、数据采集与预处理:系统首先对文档数据进行采集,数据来源包括网络、数据库、文件系统;采集文档数据后进行预处理,预处理包括去除噪声、标准化格式、分割文档;S2、文档解析与分析:针对不同类型的文档,系统采用不同的解析技术;文本文档:采用自然语言处理技术进行分词、词性标注、句法分析,语义分析、情感分析以理解文档内容;图像文档:采用光学字符识别技术将图像中的文字转换为可处理的文档数据;音频文档:采用语音识别技术将音频中的语音转换为文字;S3、文档分类与识别:系统根据文档内容和特征采用深度学习法进行分类与识别;S31、文档分类:使用文档分类算法将文本文档划分到预定义的类别中;S32、图像分类:使用卷积神经网络模型对图像文档进行分类;S33、音频识别:使用循环神经网络模型对音频文档进行语音识别;S4、信息提取与分析:系统可以从文档中提取关键信息,关键信息包括实体识别、关键词提取、情感分析;S5、结果展示与应用:系统将分析结果展示给用户应用平台。

全文数据:

权利要求:

百度查询: 云南中烟工业有限责任公司 一种文档分析与识别系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。