首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】点击数据去噪方法、装置、电子设备及存储介质_北京百度网讯科技有限公司_202111650357.0 

申请/专利权人:北京百度网讯科技有限公司

申请日:2021-12-30

公开(公告)日:2024-06-21

公开(公告)号:CN114428887B

主分类号:G06F16/9035

分类号:G06F16/9035;G06F16/906;G06F16/9038

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2022.05.20#实质审查的生效;2022.05.03#公开

摘要:本公开提供了一种点击数据去噪方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及大数据及云服务技术领域,包括:获取点击数据集;利用图模型提取出各个第一点击数据的特征向量;将多个特征向量划分为至少两个特征向量集;利用至少两个特征向量集对至少两个二分类模型进行训练,得到至少两个训练后的二分类模型;利用至少两个训练后的二分类模型对每个特征向量进行预测,得到与各个特征向量对应的至少两个预测值;根据每个特征向量对应的至少两个预测值计算出各个特征向量的预测标签;根据至少两个第一点击数据和各个第一点击数据的真实标签与预测标签去除至少两个第一点击数据中的噪声数据。

主权项:1.一种点击数据去噪方法,包括:获取点击数据集,所述点击数据集中包含至少两个第一点击数据和各个第一点击数据一一对应的真实标签,所述第一点击数据表征向用户推荐的推荐内容,所述第一点击数据对应的真实标签表征该用户是否点击了推荐的推荐内容;其中,所述获取点击数据集,包括:获取与各个第一点击数据关联的用户标识和推荐内容标识;根据每个第一点击数据关联的用户标识和推荐内容标识获取与各个第一点击数据关联的用户数据和内容数据;利用图模型提取出各个第一点击数据的特征向量;将多个特征向量划分为至少两个特征向量集;利用所述至少两个特征向量集对至少两个二分类模型进行训练,得到至少两个训练后的二分类模型;利用所述至少两个训练后的二分类模型对每个特征向量进行预测,得到与各个特征向量对应的至少两个预测值;根据每个特征向量对应的至少两个预测值计算出各个特征向量的预测标签;响应于第一点击数据对应的真实标签为用户点击了推荐内容;将该第一点击数据确定为第二点击数据;根据所述至少两个第二点击数据的预测标签去除所述至少两个第二点击数据中的噪声数据,所述噪声数据为用户因为误点击推荐内容而产生的点击数据。

全文数据:

权利要求:

百度查询: 北京百度网讯科技有限公司 点击数据去噪方法、装置、电子设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。