买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:慧算基因科技(上海)有限公司;上海津熙医学检验实验室有限公司;上海吾当智能技术有限公司
摘要:本申请提供了合并大规模药物数据列表方法、装置、设备和介质,通过根据最新的UMLS数据集筛选出符合药物概念语义类型的数据,并根据最新的MESH数据集,解析其中药物入口词与其同义词;在MESH数据集中通过药物的实体名称查询所有相同概念编号的药物名称以及同义词名称,并将合并的查询结果作为该药物的同义词集合,据以遍历所有药物的同义词集合;对任意至少两个具有相同元素的同义词集合并,以作为一个新药物的同义词集合;为每个药物定义药物编号,以表征该集合的标准化药物名称。本申请特别是当存在大量重复元素时,以显著提高合并过程的速度。
主权项:1.一种合并大规模药物数据列表方法,其特征在于,所述方法包括:根据最新的UMLS数据集筛选出符合药物概念语义类型的数据,并根据最新的MESH数据集,解析其中药物入口词与其同义词;在MESH数据集中通过药物的实体名称查询所有相同概念编号的药物名称以及同义词名称,并将合并的查询结果作为该药物的同义词集合,据以遍历所有药物的同义词集合;对任意至少两个具有相同元素的同义词集合并,以作为一个新药物的同义词集合;为每个药物的同义词集合定义药物编号,以表征该同义词集合的标准化药物名称;其中,定义药物的一个实体名称为一个列表,所有不同同义词名称构成该药物的n个列表,即上述中的药物的同义词集合;每个列表包括m个元素,该元素是指药物的名词术语;具体为:初始化:对于每个列表中的元素,将其作为节点加入并查集,并记录其所属列表的标识;遍历:遍历每个列表中的元素,检查其所属列表以及该元素是否已经存在于列表并查集中,如果存在,说明两个列表具有相同元素,将它们合并为一个集合;路径压缩:在进行合并的同时,采用路径压缩优化并查集;结果提取:通过查询并查集得到合并后的列表集合,即每个集合中包含具有相同元素的列表,即上述中的新药物的同义词集合;上述中提到的并查集具体算法中:初始构建并查集需要On*m的时间,而路径压缩和合并操作的复杂度为近似Oαn,其中αn是阿克曼函数的反函数,总体时间复杂度近似为On*m+αn。
全文数据:
权利要求:
百度查询: 慧算基因科技(上海)有限公司 上海津熙医学检验实验室有限公司 上海吾当智能技术有限公司 合并大规模药物数据列表方法、装置、设备和介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。