广州大学卓胜达获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广州大学申请的专利一种混合在线数据流场景下的半监督算法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115796301B 。
龙图腾网通过国家知识产权局官网在2025-07-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211382596.7,技术领域涉及:G06N20/00;该发明授权一种混合在线数据流场景下的半监督算法是由卓胜达;王宇;崔田莹;李银锋;肖翔仁;何锦淳;何日鑫;陈浩弘设计研发完成,并于2022-11-07向国家知识产权局提交的专利申请。
本一种混合在线数据流场景下的半监督算法在说明书摘要公布了:本发明涉及到半监督学习与在线学习领域,尤其涉及了在线任意数据流场景下的半监督算法,该算法框架主要分为任意数据流构建、通过高斯联结GC学习潜规则、通过局部密度峰值Local‑DPC学习数据的几何结构特征、加速收敛的在线组合算法四个部分。任意数据流构建是针对真实线上应用场景中所出现的混合、缺失两个情况的数据集;通过GC学习潜规则是利用观测数据空间通过边缘分布函数构建潜在数据特征空间;通过Local‑DPC学习数据特征空间的几何结构,构建缺失标签的伪标签。最终,针对不同的数据分布空间下的模型构建加速收敛的在线组合算法。混合在线数据流场景下的半监督算法模型不仅有效解决缺失数据填充问题,同时也解决缺失数据缺失标签问题。
本发明授权一种混合在线数据流场景下的半监督算法在权利要求书中公布了:1.一种混合在线数据流场景下的半监督算法,其特征在于,包括以下步骤: S1、任意数据流构建 所包括的数据类型有序数值、离散值、二值、连续值; S2、潜在空间学习 利用GC模型从观测空间缺失中学习各个不同变量之间的边缘分布特征,并通过在线最大期望Online-EM,找到观测空间缺失中缺失值的填充值; 所包括的内容有: 1)定义在线混合数据场景下的GC模型: 其中,为截断函数,z∈R是连续正态,累积分布函数CDF为Fz和;潜在空间向量为; 2)缺失数据空间重构 其中,是观测空间所对应的潜在空间,是中对应的缺失分布空间,和表示相关性的子矩阵,其行和列分别对应于(,)和(,)的特征指数,为最大估计函数; 3)Online-EM参数评估 定义,其中是一个标准的正态CDF,对应于第个特征的真实但未知的CDF; 其中,规模H=|B||B|+1保证了一个有限的输出,B为在线混合数据流的缓冲区大小;对于离散特征,将截止点定义为的一个特例,即用第个特征的概率质量替换其样本平均值,定义如下: 其中,表示第个输入的第个特征;为了消除歧义,将表示为前一轮获得的经验相关性,将表示为本轮要近似的目标;在当前回合的目标,对数似然函数表示为: 其中,初始化为一个初始矩阵; S3、几何结构学习; 采用两个指标来描述每个到达的实例的特征;即局部密度和距离,定义为: 其中,衡量和在重建的通用特征空间U t中的欧氏距离,d cut是自适应调整的截止距离; S4、集成算法 让=⟨,表示对的潜在表示进行的预测;集合预测为,其中;和的值分别决定了两个基础分类器和的重要性; 其中,是一个调整过的参数;两个基础分类器的集合使我们的学习者具有一个很好的特性。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州大学,其通讯地址为:510006 广东省广州市大学城外环西路230号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。