首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于小波特征聚类的广告流量反作弊方法及装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:上海数川数据科技有限公司

摘要:本发明涉及网络信息技术领域,具体涉及一种基于小波特征聚类的广告流量反作弊方法及装置,方法包括:获取网站的流量数据;对网站流量数据进行小波分析,重构为作弊流子带和背景流子带;根据重构的作弊流子带和背景流子带,提取多个不同维度的小波特征;综合多个不同维度的小波特征,对多个网站进行聚类;根据网站聚类结果,找出流量数据作弊的网站。本发明利用提取到的特征进行网站聚类,进一步识别正常网站和作弊网站,以解决现有技术较难检测低速率作弊流量而导致无法识别作弊网站的问题。

主权项:1.一种基于小波特征聚类的广告流量反作弊方法,其特征在于,所述基于小波特征聚类的广告流量反作弊方法包括:获取网站的流量数据;所述获取网站的流量数据,包括:收集用户对网站访问的请求日志,并解析字段;将请求对应的流量以秒为单位进行聚合,生成待检测时间序列,作为网站的流量数据;对网站流量数据进行小波分析,重构为作弊流子带和背景流子带,包括:利用离散小波函数和尺度函数将网站流量做J层分解,分解公式如下: ,其中,为小波系数,表示细节信息;为近似系数,表示近似信息;选取J层中的多层小波系数重构为作弊流子带,其中,作弊流子带反映信号低频信息;将其余层系数重构为背景流子带,其中,背景流子带反映正常用户流量趋势;采用Db3小波对网站流量作5层小波分解,计算频率,选取3,4,5层小波系数重构形成作弊流子带,反映信号低频信息;其他系数重构形成背景流自带,反映正常用户流量趋势;通过重构,各流量自带频率更加清晰,便于后续特征提取;对网站流量数据进行小波分析,重构为作弊流子带和背景流子带;根据重构的作弊流子带和背景流子带,提取多个不同维度的小波特征;综合多个不同维度的小波特征,对多个网站进行聚类;根据网站聚类结果,找出流量数据作弊的网站;所述提取多个不同维度的小波特征,包括:提取作弊流子带的平均值;提取作弊流子带的标准差;提取作弊流的频谱能量;提取背景流子带的平均值;提取网站流量的脉冲因子;所述提取作弊流子带的平均值,包括:计算作弊流子带平均值,满足下述公式: ,其中,N为时间序列长度,低速率作弊流量频率主要集中在低频部分,反映了作弊流平均强度;正常流量主要为高频成分,较小;作弊流较大;所述提取作弊流子带的标准差包括:计算作弊流子带标准差,满足下述公式: ,其中,,描述了作弊流波动程度,当存在作弊行为时,网络流量突发脉冲信号,波动程度加大,升高,平时大多正常用户访问,波动程度较小,较低;所述提取作弊流的频谱能量,包括:计算作弊流的频谱能量,满足下述公式: ,其中,表示了信号在窗内的能量强度;所述提取背景流子带的平均值,包括:计算背景流子带平均值,满足下述公式: ;背景流反映的是正常用户流量行为,某些网站缺乏正常用户浏览,致使其混入作弊流量提高广告点击收益,此时,减小;所述提取网站流量的脉冲因子,包括:计算网站流量脉冲因子I,满足下述公式: ;衡量流量中脉冲信号的强度,正常网站流量比较平稳,虽有突发情况,但突发概率较低,一般和节假日或者实时新闻相关,当混入作弊流量后,低速率作弊流量以近似脉冲方式发起,隐藏在正常流量中,脉冲因子会增大。

全文数据:

权利要求:

百度查询: 上海数川数据科技有限公司 基于小波特征聚类的广告流量反作弊方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。