首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于卷积神经网络的电子文档识别加密及防伪检测方法_湖南工商大学_202311654510.6 

申请/专利权人:湖南工商大学

申请日:2023-12-04

公开(公告)日:2024-06-14

公开(公告)号:CN117668787B

主分类号:G06F21/16

分类号:G06F21/16;G06F21/64;G06N3/0464;G06N3/045;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.06.14#授权;2024.03.26#实质审查的生效;2024.03.08#公开

摘要:本发明公开了一种基于卷积神经网络的电子文档识别加密及防伪检测方法,通过对电子印章进行加密;获取待加密电子文档的特征信息;根据特征信息对待加密电子文档进行分类;根据待加密电子文档的分类,对待加密电子文档进行加密设计;在待加密电子文档中加入时间戳;获取电子文档建立和修改的时间并将其进行编码,作为时间戳信息指纹;提取待加密电子文档的文本信息指纹;结合文本信息指纹、时间戳信息指纹、以及加密电子文档的特征向量,生成第一防伪密文水印;将第一防伪密文水印嵌入到透明的图片后再将其嵌入到加密电子文档的页眉中,并将页眉锁定。本发明提高了数据和文档的安全性、可信度和可追溯性。

主权项:1.一种基于卷积神经网络的电子文档识别加密及防伪检测方法,其特征在于,包括以下步骤:对电子印章进行加密;获取待加密电子文档的特征信息;根据所述特征信息对待加密电子文档进行分类;其中,所述获取待加密电子文档的特征信息;根据所述特征信息对待加密电子文档进行分类包括:对输入的待加密电子文档进行预处理,将机密文档和非机密文档标记为不同的类型;采用BERT模型对待加密电子文档进行编码,得到待加密电子文档的语义信息表示,并将其表示为向量形式;采用CNN模型对BERT模型输出的文档向量进行卷积操作,CNN模型使用卷积核来提取文本的局部特征,采用池化操作将局部特征组合成全局特征;将BERT模型输出的文档向量和CNN模型输出的全局特征向量拼接在一起,形成一个统一的特征表示;对所述特征表示应用注意力机制,并对所述特征表示进行加权;采用全连接层对所述特征表示进行分类,以对加密电子文档进行机密和非机密类型的分类;根据待加密电子文档的分类,对所述待加密电子文档进行加密设计,其中,所述根据待加密电子文档的分类,对待加密电子文档进行加密设计包括:根据不同类型的电子文档进行不同的加密,判断电子文档是否为非机密类型,若是非机密类型,则采用对称加密算法方式进行加密;判断电子文档是否为机密类型,若是机密类型,则采用混合加密算法进行加密,所述混合加密算法是将对称加密算法和非对称加密算法相结合;提取待加密电子文档的时间戳信息,在待加密电子文档中加入时间戳;将获取的电子文档建立和修改的时间进行编码作为时间戳信息指纹;提取待加密电子文档的文本信息指纹;结合所述文本信息指纹、所述时间戳信息指纹、以及加密电子文档的特征向量,生成第一防伪密文水印;将所述第一防伪密文水印嵌入到透明的图片后再将其嵌入到加密电子文档的页眉中,并将所述页眉锁定;将锁定页眉的加密电子文档与加密的电子印章进行融合;将在所述页眉中提取的第二防伪密文水印和重新生成的第三防伪密文水印进行比对,检测加密电子文档是否被篡改,其中,所述将在所述页眉中提取的第二防伪密文水印和重新生成的第三防伪密文水印进行比对,检测加密电子文档是否被篡改的步骤包括:通过时间戳获取创建电子文档和修改电子文档的时间戳信息,将其转换为第四二进制序列,将加密电子文档内容编码为第五二进制序列,通过SM3算法计算第三哈希值,将获取的时间戳信息和第三哈希值重新结合采用SM3哈希算法计算重新生成密文数据;通过比对从加密电子文档页眉中提取到的防伪密文和重新生成的所述密文数据,判别加密电子文档是否被篡改,若无法提取到防伪密文,则说明加密电子文档被篡改;若所述密文数据比对不一致,则说明加密电子文档被篡改;若所述密文数据比对一致,则说明加密电子文档没有被篡改;其中,所述对所述特征表示应用注意力机制,并对所述特征表示进行加权的步骤包括:首先将拼接后的特征作为输入,通过全连接层得到一个隐层向量;然后,将隐层向量作为注意力机制的输入,计算注意力权重,采用多头注意力机制,将隐层向量分为多个头,每个头都学习到不同的注意力权重,将注意力权重与拼接后的特征表示相乘,得到加权的特征表示;最后将加权后的特征表示通过一个输出层得到分类结果;通过全连接层得到一个隐层向量H: ;其中,为隐层向量,X为拼接后的特征矩阵,和分别为全连接层的权重和偏置,f为激活函数;将隐藏向量作为注意力机制的输入,计算注意力权重为W: ;其中,为注意力权重,为注意力机制的权重矩阵,g为激活函数,softmax为归一化函数;采用多头注意力机制,将隐藏向量分为多个头,每个头学习到不同的注意力权重,将注意力权重与拼接后的特征表示相乘,得到加权的特征表示: ;其中,为加权的特征表示,表示第i个注意力头的输出,attn为点积注意力函数,表示第i个头的权重矩阵,concat为拼接函数,为多头注意力机制的权重矩阵;将加权后的特征表示用于输出层得到分类结果: ;其中,为分类结果,和分别为输出层的权重和偏置,softmax为归一化函数,g为激活函数,为加权的特征表示。

全文数据:

权利要求:

百度查询: 湖南工商大学 基于卷积神经网络的电子文档识别加密及防伪检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。