首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于公式引用图的公式检索方法与装置_北京大学_202011293008.3 

申请/专利权人:北京大学

申请日:2020-11-18

公开(公告)日:2024-06-11

公开(公告)号:CN114519132B

主分类号:G06F16/9532

分类号:G06F16/9532;G06F16/332;G06F16/33;G06F16/338

优先权:

专利状态码:有效-授权

法律状态:2024.06.11#授权;2022.06.07#实质审查的生效;2022.05.20#公开

摘要:本发明公布了一种基于公式引用图的公式检索方法与装置,公式检索装置包括:数学引用图构建模块、查询数学公式描述关键词自动生成模块,初始排序模块和重排模块。本发明通过设计构建公式引用图来表示公式之间的引用关系,对查询的公式进行关键词的扩充,并进一步增强语义检索性能,解决现有的公式检索系统无法较好的召回语义相同但结构不相似的数学公式而造成数学公式检索效率低下的问题,提高公式检索的准确性。

主权项:1.一种基于公式引用图的公式检索方法,包括如下步骤:1通过文章的公式和链接的关系构建公式引用图;公式引用图包含三个节点和三种边关系;节点为A节点、O节点和G节点,分别表示文章的标题、原始公式、泛化公式;边包括节点A与O之间的边rA-O、节点O与G之间的边rO-G、节点A和节点G之间的边rA-G;将原始公式o在文章ai中的重要性相对于所有包含原始公式o的文章的重要性之和的占比概率表示为:其中,wo,ai为文章ai与原始公式o的边上的概率,即边的值;Io,a表示原始公式o对于文章ai的重要性,no为数据集中包含原始公式o的文章数量;节点O与G之间的边的值为边的节点代表的泛化公式由原始公式泛化得来的概率;通过下式计算得到:其中counto,g表示在数据集中原始公式o被转换成泛化公式g的次数;ng表示原始公式o被转换成泛化公式g的个数;节点A和节点G之间的边的值为文章a与泛化公式g之间的联系的强弱,通过下式计算: 其中countg,a表示原始公式o在上下文中累计引用了文章a的次数累加和,na表示原始公式o引用了文章a的次数;2自动生成公式的描述关键词;文章的标题即关键词,每个相关的关键词可以通过以下计算获得: 其中,KPq,aj为文章aj与检索召回的公式q的相关性;woi,aj是边oi-aj的概率,woi,gk为边oi-gk的概率,wgk,aj为边gk-aj的概率;3通过初始排序方式进行初始排序,得到包含与查询公式高度相似的文章,作为所有相关文章的初始排序;4进行重排,得到更合理的最终检索结果列表:采用贪心匹配的方式,在公式引用图中找寻所有与查询公式语义相关的文章,并计算相关文章的语义相关性,并将相关文章的语义相关性来更新初始排序时所有文章的相关性得分,继而得到新的检索排序结果列表;具体包括如下过程:41以原始公式节点作为种子节点,首先从种子节点随机游走,找到相似度超过设定阈值的所有相关文章节点,随机游走的方式如下:Path={r0,r1,r2,...,ri|RWr}其中,Path是路径集合,从种子节点走到相关文章的路径;ri是第i条路径,路径通过RWr游走;RWr为随机游走算法;42通过下式计算被遍历的文章的相关性: 其中,wvi,vj是两个节点之间的边的概率; 其中,valueai即文章ai与查询公式的语义相关性得分;Sq,ai为公式q查询与文章ai的综合得分,即在初始排序时文章ai的得分;根据上述公式计算得到每个召回公式与查询公式的最终得分;依据得分从大到小排序,即得到公式检索的排序结果;通过上述步骤,实现基于公式引用图的公式检索。

全文数据:

权利要求:

百度查询: 北京大学 一种基于公式引用图的公式检索方法与装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。