首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于营销裂变的作弊探测方法、系统和电子设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:杭州摸象大数据科技有限公司

摘要:本申请涉及一种基于营销裂变的用户作弊探测方法,其中,该方法包括:获取营销行为相关的产品数据和用户行为数据,标记其中的作弊样本数据;分别对产品数据和用户行为数据进行特征提取,抽取在预设时间窗口和预设记录窗口下的用户特征和产品特征得到多个区间特征,按照时序组合区间特征得到时序组合特征;对时序组合特征依据特征的相似性进行聚类,生成多个类簇,根据类簇中特征的信息增益确定类簇的最大差异性特征;基于类簇,根据最大差异性特征构建规则决策树,并确定作弊样本数据对应在规则决策树中的节点,将节点中的全部对象判定为作弊数据。通过本申请,解决了相关技术中无法探测人工作弊行为的问题,提升了对人工作弊行为探知的准确性。

主权项:1.一种基于营销裂变的作弊探测方法,其特征在于,所述方法包括:获取营销行为相关的产品数据和用户行为数据,标记其中的作弊样本数据;分别对所述产品数据和所述用户行为数据进行特征提取,分别得到用户特征和产品特征;抽取在预设时间窗口和预设记录窗口下的所述用户特征和所述产品特征得到区间特征,并通过Skip-n方式按照时序重新组合所述区间特征得到时序组合特征;采用k均值kmeans聚类算法,依据所述时序组合特征的相似性进行聚类,生成多个类簇,根据所述类簇中特征的信息增益确定最大差异性特征,其中,在聚类结束后,该时序组合特征中属于且仅属于一个最近的类簇;所述依据所述时序组合特征的相似性进行聚类,生成多个类簇包括:初始化多个聚类中心,获取所述时序组合特征到所述聚类中心的欧氏距离;依次比较所述时序组合特征至所述聚类中心的距离,将所述时序组合特征逐个分配到所述欧氏距离最近的聚类中心中进行聚类,生成多个所述类簇,其中,所述时序组合特征属于且仅属于一个所述类簇,其中,通过计算类簇中特征对象在各个维度的均值确定类簇中心,通过如下公式计算类簇中心和欧式距离,其中,dis,表示样本与聚类中心的距离,m表示每个向量的维度长度,表示样本在第t个维度上的值,表示聚类中心在第t个维度上的值,是类簇中心: ;;特征对象到类簇中心的距离反映为相似度,一个特征对象到类簇中心的距离越小,则该特征对象与该类簇的相似度越高;另外,所述信息增益是集合D的经验熵HD与特征A在给定条件D下的条件经验熵HD|A之差,通过如下公式计算该信息增益: (D(D|A)通过如下计算经验熵H(D)和条件经验熵HD|A,其中,D表示训练数据集,A表示训练数据集中的特征,HD|A表示特征A相对于数据集D的经验条件熵,n表示数据集D的特征总数,特征A被固定为时的条件熵,表示特征A的概率; 基于所述类簇,根据所述最大差异性特征构建规则决策树,并确定所述作弊样本数据对应在所述规则决策树中的节点,将所述节点中的全部特征对象判定为作弊数据,所述基于所述类簇,根据所述最大差异性特征构建规则决策树包括:以所述最大差异性特征作为判定条件将所述类簇拆分为多个子节点;计算所述子节点的最大差异性特征,以所述子节点的最大差异性特征作为判定条件拆分所述子节点,直到所述子节点中的样本点在预设阈值范围之内,或者所述子节点中所述特征对象的相似度达到预设范围;基于所述类簇、所述子节点和所述判定条件构建决策树。

全文数据:

权利要求:

百度查询: 杭州摸象大数据科技有限公司 一种基于营销裂变的作弊探测方法、系统和电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。