首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种数学文本的语义分类方法_华中师范大学_202210469760.1 

申请/专利权人:华中师范大学

申请日:2022-04-28

公开(公告)日:2024-06-21

公开(公告)号:CN114756682B

主分类号:G06F16/35

分类号:G06F16/35;G06F40/30;G06N3/0455;G06N3/0442;G06N3/0499;G06N3/09

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2022.08.02#实质审查的生效;2022.07.15#公开

摘要:本发明提供了一种数学文本的语义分类方法。首先根据高等数学教材的层级结构,从中提取出数学文本数据集,然后利用BERT预训练模型得到数据集的词嵌入表达,分别对具有线性序列特征的自然语言文本词向量和具有树形结构特征的数学语言文本词向量采用平均聚合方法和Tree‑LSTM聚合方法,再对两个聚合向量进行拼接处理,最后将拼接向量送入多层前馈神经网络,采用HierachicalSoftmax回归模型输出分类结果。本发明的方法可以大大提高数学文本的分类精度。

主权项:1.一种数学文本的语义分类方法,其特征在于,包括:S1:对获取的数学资源进行标注,得到数学文本数据集,并划分出训练数据集;S2:通过BERT预训练模型得到数学文本数据集中的数学文本的词嵌入向量,其中,数学文本的词嵌入向量包括具有线性结构特征的自然语言文本词嵌入向量以及具有树形结构特征的数学表达式的词嵌入向量;S3:构建数学文本的语义分类模型,语义分类模型包括聚合模块、拼接模块、多层前馈神经网络和分层Softmax回归模型,其中,聚合模块用于对自然语言文本词嵌入向量采用直接平均聚合的方法得到文本聚合向量、对数学表达式的词嵌入向量采用树型长短期记忆网络的方法进行聚合得到数学表达式聚合向量,拼接模块用于对文本聚合向量和数学表达式聚合向量进行拼接,得到数学文本的嵌入矢量,多层前馈神经网络和分层Softmax回归模型用于根据数学文本的嵌入矢量进行语义分类;S4:利用训练数据集对数学文本的语义分类模型进行训练,得到训练好的语义分类模型;S5:利用训练好的语义分类模型进行数学文本的语义分类。

全文数据:

权利要求:

百度查询: 华中师范大学 一种数学文本的语义分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。