Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜南京宇东科技发展有限公司刘夜获国家专利权

恭喜南京宇东科技发展有限公司刘夜获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜南京宇东科技发展有限公司申请的专利基于智能图像增强与自动分类的档案数字化方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119049066B

龙图腾网通过国家知识产权局官网在2025-05-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411481796.7,技术领域涉及:G06V30/19;该发明授权基于智能图像增强与自动分类的档案数字化方法和系统是由刘夜;单明辉设计研发完成,并于2024-10-23向国家知识产权局提交的专利申请。

基于智能图像增强与自动分类的档案数字化方法和系统在说明书摘要公布了:本发明公开了一种基于智能图像增强与自动分类的档案数字化方法和系统,该方法包括获取原始档案图像,并进行预处理,得到预处理后的高质量图像;基于预处理后的高质量图像,进行自适应多尺度图像增强处理,得到质量提升的增强图像;基于增强图像,进行智能文字识别与版面分析,得到文档的文本内容和逻辑结构;基于文档的文本内容和逻辑结构,进行语义理解与知识提取,得到文档的核心语义信息;基于文档的逻辑结构和核心语义信息,进行动态多维档案分类与索引构建,得到档案的分类索引结构。本发明能有效处理各类复杂档案,提高数字化质量和效率,支持智能检索和知识发现,适用于大规模档案数字化项目。

本发明授权基于智能图像增强与自动分类的档案数字化方法和系统在权利要求书中公布了:1.基于智能图像增强与自动分类的档案数字化方法,其特征在于,包括如下步骤:S1、获取原始档案图像,并进行预处理,得到预处理后的高质量图像;其中预处理包括对比度增强、降噪、倾斜校正和边界裁剪;S2、基于预处理后的高质量图像,进行自适应多尺度图像增强处理,得到质量提升的增强图像;其中自适应多尺度图像增强处理包括小波变换、系数调整、非线性锐化和局部对比度增强;S3、基于增强图像,进行智能文字识别与版面分析,得到文档的文本内容和逻辑结构;其中智能文字识别与版面分析包括文本区域提取、自适应二值化、字符分割、特征提取、字符识别和文档结构分析;S4、基于文档的文本内容和逻辑结构,进行语义理解与知识提取,得到文档的核心语义信息;其中语义理解与知识提取包括命名实体识别、关键词提取、概念图构建、重要性计算、语义标注和关系提取;S5、基于文档的逻辑结构和核心语义信息,进行动态多维档案分类与索引构建,得到档案的分类索引结构;其中动态多维档案分类与索引构建包括特征向量构建、降维处理、动态聚类、分类树构建和多维索引构建;步骤S4进一步为:S41、基于文档的文本内容,使用预训练的分词模型进行分词处理,得到第一词序列;基于第一词序列中的每个词,提取词特征,包括词本身、词性和上下文信息,形成特征向量;将所有特征向量组成特征序列,使用预训练的条件随机场模型处理特征序列,得到对应的标签序列;根据标签序列,识别出文本中的命名实体,形成命名实体集合;S42、基于文档的文本内容,进行分词和词性标注,得到第二词序列和对应的词性序列;基于第二词序列和对应的词性序列,构建词图;对词图中的每个节点迭代计算文本排序得分,直到收敛或达到预设的迭代次数,得到最终的文本排序得分;基于最终的文本排序得分,选择预定个关键词,形成关键词集合;S43、基于命名实体集合和关键词集合,构建概念图;使用PageRank算法计算概念图中节点的重要性得分;基于重要性得分,选取预定个节点,形成核心概念集合;基于核心概念集合,在预定义的本体库中查找最相似的本体概念;将找到的本体概念作为语义标签,得到语义标签集合,即为文档的核心语义信息;S44、在概念图中识别出带有语义标签集合中的标签的节点对;基于预设路径阈值,使用深度优先搜索算法查找每对节点对之间的所有有效路径;基于每条有效路径上的节点和边的特征,使用预定义的模式或机器学习模型,得到有效路径的语义关系;将所有有效路径的语义关系进行汇总,形成实体关系集合;步骤S5进一步为:S51、基于文档的逻辑结构,提取结构特征,包括标题层级和段落数量,形成结构特征向量;将核心语义信息中的语义标签转换为独热编码,形成语义特征向量;将实体关系集合中的实体关系表示为关系类型和关系强度的数值对,形成关系特征向量;将结构特征向量、语义特征向量和关系特征向量进行拼接,得到文档特征向量;S52、将文档特征向量与预先生成的随机投影向量做内积,得到内积结果;基于内积结果的正负,形成二进制编码;将所有二进制编码进行拼接,得到文档特征向量的局部敏感哈希编码;重复直到达到预定迭代次数,得到预定个局部敏感哈希编码,组成文档特征向量的最终低维表示;S53、基于最终低维表示,应用改进的密度聚类算法进行动态聚类,得到动态类别集合;基于动态类别集合,计算每个类别的中心点;使用非加权组平均算法对中心点进行层次聚类,得到树状结构;为树状结构中的每个节点分配语义标签,得到多层次分类树;S54、在最终低维表示中选择预定维度作为索引键;构建B+树的根节点,将索引键插入B+树的根节点,得到多维索引结构;将多层次分类树和多维索引结构进行结合,得到档案的分类索引结构。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京宇东科技发展有限公司,其通讯地址为:210044 江苏省南京市江北新区大厂街道丁家山路2号D321室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。