Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 山东健康医疗大数据有限公司荆晨获国家专利权

山东健康医疗大数据有限公司荆晨获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉山东健康医疗大数据有限公司申请的专利一种医学文本词向量化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114004225B

龙图腾网通过国家知识产权局官网在2025-07-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111185056.5,技术领域涉及:G06F40/289;该发明授权一种医学文本词向量化方法是由荆晨设计研发完成,并于2021-10-12向国家知识产权局提交的专利申请。

一种医学文本词向量化方法在说明书摘要公布了:本发明涉及面向自然语言处理的预训练领域,具体提供了一种医学文本词向量化方法,通过对原始医学文本数据探查建立词库对后续的向量化做准备,然后通过GLOVE模型进行医学数据词向量化;所述原始医学文本分为结构化数据、半结构化数据和非结构化数据,所述结构化数据中有固定的填写要求数据,所述半结构化数据包含一部分电子病历数据,半结构化数据中有固定标识,固定标识中的内容可能空,所述非结构化数据也包含一部分电子病历数据,非结构化数据没有标识,根据知识去提取。与现有技术相比,本发明收集数据较快速且准确。

本发明授权一种医学文本词向量化方法在权利要求书中公布了:1.一种医学文本词向量化方法,其特征在于,对原始医学文本数据建立词库,通过GLOVE模型进行医学文本数据词向量化; 所述原始医学文本分为结构化数据、半结构化数据和非结构化数据; 在GLOVE模型搭建中,包括大段文本搭建、细项文本搭建、全局及详情共现矩阵搭建和矩阵向量化;大段文本搭建是根据断句符将文本分成多条句子,得到T=[S1,S2,S3,…,Sn];对以上[S1,S2,S3,…,Sn]句子进行细项切割,得到S=[X1,X2,X3,…,Xn]; 因为GLOVE模型是根据全局信息去计算词向量,会缺失部分上下文之间的关系,所以对S和T文本都进行共现矩阵的计算,并对T文本计算出的共现矩阵取:Si=XSi=∑kXSik 在计算S文本生成的共现矩阵Xi时加入Si,以保留部分上下文之间联系; 在全局及详情共现矩阵搭建中,若每个分句无重复词:在分解T文本时对每个S文本打上标记C,使得之后的共现矩阵Xi带着标记用于Si去计算相应的子项,打上标记后的文本表示为: T’=[S1,C1,S2,C2,S3,C3,…,Sn,Cn] Si’=[X1,Ci,X2,Ci,X3,Ci,…,Xn,Ci] 若分句存在重复词情况:在分解T文本时对每个S文本打上标记C,使得之后的共现矩阵Xi带着标记用于Si去计算相应的子项,对于含有重复项的子项标记为CiCj,打上标记后的文本表示为: T”=[S1,C1,S2,C2,S3,C3,…,Sn,Cn] Si”=[X1,CiCj,X2,Ci,X3,CiCj,…,Xn,Ci]; 在矩阵向量化中,包括:设置入参,入参为通过全局及详情共现矩阵搭建中计算得出的共现矩阵;构建矢量矩阵;构建偏差项;通过梯度下降法进行训练;输出向量矩阵。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东健康医疗大数据有限公司,其通讯地址为:250117 山东省济南市槐荫区兴福街道西城西进时代中心D座1212室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。