恭喜华东师范大学宋思程获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜华东师范大学申请的专利一种基于注意力学习的网络图数据提取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113963232B 。
龙图腾网通过国家知识产权局官网在2025-04-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111207757.4,技术领域涉及:G06V10/774;该发明授权一种基于注意力学习的网络图数据提取方法是由宋思程;王长波;李晨辉设计研发完成,并于2021-10-18向国家知识产权局提交的专利申请。
本一种基于注意力学习的网络图数据提取方法在说明书摘要公布了:本发明公开了一种基于注意力学习的网络图数据提取方法,其特点是采用文字提取深度神经网络提取图表中的文字数据,以及带有注意力模块的语义分割网络提取网络图可视化图表的像素特征,计算出结点与连接关系的数据,即可恢复出原始网络图的数据结构。本发明与现有技术相比具有较好的解决了网络图这一高级可视编码的数据挖掘问题,通过注意力机制解决了连接线的识别问题,提高模型的鲁棒性,能够在数据转换、可视化设计风格切换、知识产权保护等多种实际应用场景中对网络图可视化图表的位图进行数据提取,有较高的实用价值与良好的发展前景。
本发明授权一种基于注意力学习的网络图数据提取方法在权利要求书中公布了:1.一种基于注意力学习的网络图数据提取方法,其特征在于网络图数据的提取具体包括以下步骤:a步骤:输入一张大小为H×W网络图的光栅图像I;b步骤:构造网络图的语义数据集;c步骤:在网络图的语义数据集上训练一个基于u-Net且带有注意力模块的语义分割神经网络,所述神经网络包括特征提取部分、上采样部分、注意力模块AttentionGate、softmax模型的输出层;d步骤:训练一个文字提取的神经网络模型,所述神经网络包括文字定位部分CTPN、文字识别部分CRNN;e步骤:将d步骤文字提取的神经网络模型应用到a步骤所输入的光栅图像I,从CTPN中定位到文字信息的特征,然后从CRNN神经网络中的输出层输出每个文本框t的信息数组TextArrt,所述信息数组TextArrt包含{tx,ty,tw,th,ta,Text,Confidence},其中:tx,ty是该文本框中心点的坐标;tw,th是该文本框的宽和高;ta是该文本框的倾斜度;Text是该文本框的文字内容;Confidence是该文本框的置信度,默认置信度高于0.95的数值是可信的;f步骤:移除光栅图像I中的文本框部分,用文本框的背景色块进行填充,并对其进行Kernel=2,2的膨胀处理;g步骤:将f步骤中预处理后的图像I输入到c步骤中的语义分割网络中,输出大小为H×W的语义图Is,所述语义图Is中的每个像素值yi代表了像素i所属的类别,且由下述d式表示的背景类、连接线类、矩形结点类、椭圆结点类和菱形结点类; h步骤:根据输入的光栅图像I、文字信息数组TextArrt和语义图Is按下述步骤进行连通区域的数据分析计算:h1:将yi=0的像素点的颜色平均值赋给Cback;h2:在光栅图像I上提取yi=1,2,3的连通分量为结点类,并以Op,Hp,Wp,Cp,Tp分别为连通分量的中心像素的坐标值、中心像素的颜色RGB值以及像素高度、像素宽度和中心像素的yi值;h3:在光栅图像I上提取yi=1,2,3的连通分量为连接线类,并以这些连通分量边缘像素点的yi值,计算该连通分量与每个结点的连接置信度h4:将文字信息数组TextArrt中Confidence高于0.95的文本数据分配给距离最近的连通分量,其字体大小F为0.75th;上述Cback表示网络图的背景颜色RGB值;Op,Hp,Wp,Cp,Tp表示第p个结点的中心坐标值,高度值,宽度值,颜色RGB值和结点形状类型;F表示字体的大小;表示结点p和连接线q相接的置信度,初始值默认为0,每有一个重叠的像素点该置信度加1;i步骤:输出网络图的结点信息Node与连接信息Link,得到网络可视化提取到的原始数据,用户可对网络可视化提取到的原始数据进行重新设计或修改,得到更优布局或配色方案的可视化设计图。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华东师范大学,其通讯地址为:200241 上海市闵行区东川路500号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。