买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:MEDIDATA解决方案公司
摘要:本公开提供一种根据原始数据集生成合成纵向数据集的系统和方法。生成合成纵向数据集包括在定义患者事件序列的记录中识别子序列模式。基于子序列模式确定特征向量,每个特征向量描述相应的一条记录。特征向量被嵌入到低维空间中。从记录中迭代选择种子记录,并且在每次迭代中:在记录子集中识别子序列模式。将种子记录中的子序列模式实例替换为记录的子集中识别的类似子序列模式实例,以形成修改后的种子记录。重复迭代,直到所有记录都被选为种子记录。修改后的种子记录结合以形成合成数据集。
主权项:1.一种生成合成纵向数据集X'的方法,包括:识别定义N个患者的事件序列的N条记录r中的子序列模式,从而产生m个子序列模式,其中m和N为整数;至少部分基于所述m个子序列模式确定特征向量Y',每个所述特征向量描述所述记录r中相应的一个;将所述特征向量Y'嵌入维度为y的低维空间V中,以限定所述记录r在所述低维空间V中的位置,其中y为整数且my0;从所述记录r中迭代选择种子记录rs,并且在每次迭代中:在所述记录r的子集中识别子序列模式,所述子集至少部分基于所述记录r在所述低维空间V中的位置来确定;至少部分基于子序列模式的对应实例之间确定的距离,将所述种子记录rs中的子序列模式的一个或多个实例替换为所述记录r的子集中识别的相应子序列模式的实例,以形成修改后的种子记录rs';以及重复所述选择、所述识别和所述替换,直到所有所述记录r都已迭代选择为所述种子记录rs;以及将所述迭代产生的修改后的种子记录rs'合并到合成数据集X'中。
全文数据:
权利要求:
百度查询: MEDIDATA解决方案公司 根据原始数据集生成合成纵向数据集的系统和方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。