首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种用于真实世界临床研究的智能化数据处理方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:广州源高网络科技有限公司

摘要:本发明提供了一种用于真实世界临床研究的智能化数据处理方法及系统,涉及数据处理领域,包括:对所有临床科研记录文本进行分句,对获得的所有分句结果进行数据处理,获得每个分句结果的有效分句结果;对所有有效分句结果的字集合进行分词,基于获得的每个有效分句结果的字集合的所有分词结果,获得每个临床科研记录文本的所有特异词和非特异词,基于所有临床科研记录文本的所有特异词和非特异词获得每个临床科研记录文本的所有重点词;基于所有有效分句结果的字集合的分词结果获得所有重点词的重要度,并获得所有临床科研记录文本的核心信息。本发明根据所有真实世界临床科研记录文本进行核心信息的归纳,提高了真实世界临床科研的效率。

主权项:1.一种用于真实世界临床研究的智能化数据处理方法,其特征在于,包括:S1:获取所有时刻的临床科研记录文本,对每个时刻的临床科研记录文本进行分句,获得每个时刻的临床科研记录文本的所有分句结果,并对每个时刻的临床科研记录文本的每个分句结果进行数据处理,获得每个时刻的临床科研记录文本的每个分句结果的有效分句结果;S2:对每个时刻的临床科研记录文本的所有有效分句结果的字集合进行分词,获得每个时刻的临床科研记录文本的每个有效分句结果的字集合的所有分词结果;S3:基于每个时刻的临床科研记录文本的所有有效分句结果的字集合的所有分词结果,获得每个时刻的临床科研记录文本的所有特异词和所有非特异词,基于所有时刻的临床科研记录文本的所有特异词和所有非特异词获得每个时刻的临床科研记录文本的所有重点词;S4:基于所有时刻的临床科研记录文本的所有有效分句结果的字集合的分词结果获得每个时刻的临床科研记录文本的每个重点词的重要度,基于所有时刻的临床科研记录文本的所有重点词的重要度获得所有时刻的临床科研记录文本的核心信息;其中,S4:基于所有时刻的临床科研记录文本的所有有效分句结果的字集合的分词结果获得每个时刻的临床科研记录文本的每个重点词的重要度,基于所有时刻的临床科研记录文本的所有重点词的重要度获得所有时刻的临床科研记录文本的核心信息,包括:将同时为对应时刻的临床科研记录文本的特异词的重点词,当作对应时刻的临床科研记录文本的第一重点词;将同时为对应时刻的临床科研记录文本的非特异词的重点词,当作对应时刻的临床科研记录文本的第二重点词;基于所有时刻的临床科研记录文本的所有有效分句结果的字集合的分词结果获得每个时刻的临床科研记录文本的每个第一重点词和第二重点词的重要度,包括: ;其中,为第一重点词的重要度,U为对应时刻的临床科研记录文本中的所有有效分句结果的字集合的所有分词结果的总数,ln为自然对数,且自然常数e的取值为2.718,maxH为第一重点词包含的所有字中左归属值和右归属值的最大差值,为第二重点词为的重要度,t为第二重点词在所有时刻的临床科研记录文本中的总出现次数,w为第二重点词在对应第二重点词最新出现过的临床科研记录文本中的总出现次数,W为第二重点词最新出现过的临床科研记录文本的所有分词结果的总数量,maxh为第二重点词包含的所有字中左归属值和右归属值的最小和值;将所有时刻的临床科研记录文本的所有重点词的重要度进行从大到小的排序,获得每个重点词的排序序数,将所有时刻的临床科研记录文本的所有重点词中排序序数小于预设序数阈值的重点词连接获得核心信息;其中,重点词包括第一重点词和第二重点词;预设序数阈值即为所有时刻的临床科研记录文本的所有重点词的总数与预设百分比的乘积。

全文数据:

权利要求:

百度查询: 广州源高网络科技有限公司 一种用于真实世界临床研究的智能化数据处理方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。