医药影印件的信息提取方法和系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：上海海事大学

摘要：本发明公开了一种医药影印件的信息提取方法和系统，方法包含：将医药影印件文件转换成待识别电子文件；采用光学字符识别方法对所述待识别电子文件进行字符识别，得到电子文档和特征信息；根据所述特征信息对所述电子文档进行模糊分类；对经模糊分类处理的电子文档根据其所属的类别进行信息提取，得到初步提取结果；对初步提取结果进行纠错处理得到有效的电子文档；根据预设信息提取条件，对有效的电子文档进行第二次信息提取，得到关键信息；根据所述关键信息，对经有效的电子文档进行分类，得到分类结果，本发明可以实现在显著的减少人工成本的情况下具有更加精确的文字识别准确率，且能根据文本的特征自动识别并归类，达到统一化处理的目的。

主权项：1.一种医药影印件的信息提取方法，其特征在于，包含：步骤S1、将医药影印件文件转换成待识别电子文件；步骤S2、采用光学字符识别方法对所述待识别电子文件进行字符识别，得到电子文档和特征信息；步骤S3、根据所述特征信息对所述电子文档进行模糊分类；所述步骤S3包括：步骤S3.1、选择所述特征信息中的位于待识别电子文档的特定位置的标题作为第一判断依据；根据所述第一判断依据对所述待识别电子文件进行模糊分类；若采用所述第一判断依据对所述待识别电子文件进行模糊分类操作失败，则进入步骤S3.2；步骤S3.2、选择在所述医药影印件文件预先提取的字段作为第二判断依据；根据所述第二判断依据对所述待识别电子文件进行模糊分类；步骤S4、对经模糊分类处理的电子文档根据其所属的类别进行第一次信息提取，得到初步提取结果；步骤S5、对所述初步提取结果进行纠错处理得到有效的电子文档；所述步骤S5包括：步骤S5.1、采用语言模型对所述电子文档进行文字拼写错误纠正，并输出第一纠正电子文档；步骤S5.2、采用seq2seq模型对所述第一纠正电子文档进行语法错误纠正，得到第二纠正电子文档；步骤S5.3、采用所述语言模型对所述第二纠正电子文档进行语句检查，得到所述的有效的电子文档；步骤S6、根据预设信息提取条件，对所述有效的电子文档进行第二次信息提取，得到关键信息；所述步骤S6包括：采用预先训练好的第二神经网络对经所述有效的电子文档进行第二次信息提取，得到所述关键信息；所述第二神经网络包括卷积神经网络、循环神经网络、单隐藏层前馈神经网络和条件随机场；所述卷积神经网络用于根据接收到的所述有效的电子文档，将该所述有效的电子文档中的每一句子进行编码，得到所有所述句子的句子编码向量；所述循环神经网络用于根据接收到的每一所述句子编码向量提取与该句子对应的上下文句子编码向量，形成上下文句子编码向量序列；所述单隐藏层前馈神经网络用于根据上下文句子编码向量序列转换为与所述句子相对应的概率向量；所述条件随机场用于根据所述概率向量计算出每个待识别句子所属标签的概率值，概率值最高的标签为所述关键信息；步骤S7、根据所述关键信息，对经所述有效的电子文档进行分类，得到分类结果；所述步骤S7包括：所述分类结果包括以下几类：药品说明书类、药品生产许可证类、药品GMP证书类、药品再注册批件类和药品进口许可证类。

全文数据：

权利要求：

百度查询：上海海事大学医药影印件的信息提取方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种可拆卸式汽车斜坡支架

下一篇：一种用于固定装裱藏品的可拆卸网钩装置

相关技术

一种可拆卸式汽车斜坡支架

一种用于固定装裱藏品的可拆卸网钩装置

一种露天设备防尘防锈蚀装置

一种立式固井供液罐

冷却水泵的叶轮

一种小型铸件生产用铸造装置

一种电凝冲吸器

一种电动汽车高压线缆转接装置

血透导管接头保护装置

一种防结块的色母粒转运工装

一种降尘设备

一种减速机齿轮的表处理装置

信息相关技术

信息处理装置、信息处理方法、信息处理程序和信息处理系统_索尼集团公司_202380029230.8

信息处理装置、信息处理方法和信息处理系统_索尼集团公司_202380029192.6

信息处理装置、信息处理方法及信息处理程序_富士胶片株式会社_202380029966.5

信息配置方法、信息交互方法、以及地址信息更新方法_北京三星通信技术研究有限公司_202411197074.9

信息处理装置、信息处理方法以及信息处理程序_株式会社普利司通_202380029291.4

信息处理装置、信息处理方法和信息处理程序_索尼集团公司_202380028091.7

信息处理装置和信息处理方法_索尼集团公司_202380029290.X

信息处理装置、信息处理方法和程序_索尼集团公司_202380026150.7

一种信息工程网络信息服务器_南通能晖网络信息科技有限公司_202411228723.7

信息处理设备、信息处理方法和程序_飞力凯网路股份有限公司_202380029316.0

影印件相关技术

距骨植入件_上海三友医疗器械股份有限公司_201810975376.2

阀门连接件_深圳市立兴高精科技有限公司_202420166304.4

取件工装_青岛晟科材料有限公司_202420452324.8

吊杆连接件_李发焜_202320195227.0

试样保持件_京瓷株式会社_202380030105.9

连接件_青岛汉柏塑料科技有限公司_202323046396.7

阀组合件_道尼克斯索芙特隆公司_202210101593.5

集成电路封装件_台湾积体电路制造股份有限公司_202323369495.9

一种异型轴类零件辅助定位件及夹持单元_成都裕鸢航空智能制造股份有限公司_202323540600.0

铲件机构及应用其的铲件设备和3D打印设备_苏州铼赛智能科技有限公司_202323391385.2

方法相关技术

图像编码/解码方法和发送方法_LX半导体科技有限公司_202411300028.7

图像编码/解码方法和发送方法_LX半导体科技有限公司_202411300300.1

图像编码/解码方法和发送方法_LX半导体科技有限公司_202411300008.X

图像编码/解码方法和发送方法_LX半导体科技有限公司_202411300022.X

图像编码/解码方法和发送方法_LX半导体科技有限公司_202411300032.3

基板干燥方法与基板处理方法_株式会社斯库林集团_202380029428.6

图像编码/解码方法和发送方法_LX半导体科技有限公司_202411300005.6

切割方法_盐城高测新能源科技有限公司_202310504079.0

治疗方法_沃卢申伊缪诺制药公司_202080046367.0

轮胎安装方法、轮胎加工方法和轮胎保持装置_株式会社普利司通_202380027171.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

医药影印件的信息提取方法和系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务