首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

数据处理方法、数据处理系统和计算机可读介质 

申请/专利权人:谷歌有限责任公司

申请日:2019-08-21

公开(公告)日:2024-06-25

公开(公告)号:CN112771512B

主分类号:G06F16/2458

分类号:G06F16/2458;G06Q30/02

优先权:

专利状态码:有效-授权

法律状态:2024.06.25#授权;2021.05.25#实质审查的生效;2021.05.07#公开

摘要:促进资源和空间高效的大规模数据集分析的数据处理方法、数据处理系统和计算机可读介质,包括编码在计算机存储介质上的计算机程序。数据处理方法包括获取数据集中的对象的活动数据。对于数据集中的每个数据项,使用对象的标识符生成具有二进制表示的散列参数。基于散列参数从一组寄存器中识别一寄存器。确定所述对象的散列参数对聚合量做出贡献,所述聚合量指定数据集中所述对象的出现次数。基于该确定,更新存储在所述寄存器中的聚合量。基于存储在所述一组寄存器中的聚合量,生成报告输出,该报告输出基于数据集中对象的活动数据提供对象的聚合分布。

主权项:1.一种计算机实现的数据处理方法,包括:获取数据集中的多个对象的活动数据,其中数据集中的每个对象在数字环境中执行活动,并且活动数据表示所述活动;对于数据集中的每个数据项:使用数据项中指定的对象的标识符,生成所述对象的散列参数,其中所述散列参数具有二进制表示;基于散列参数的二进制表示的第一部分从一组寄存器中识别一寄存器,其中所述一组寄存器中的每个寄存器包括存储关于数据集中的对象的数据的数据结构,其中所述一组寄存器中的每个寄存器的数据结构具有第一字段、第二字段和第三字段,并且其中所述第一字段存储指定接收到的散列参数的第二部分中的前导零的数量的数据,所述第二字段存储指定接收到的散列参数的第二部分中的尾随比特的数据,和所述第三字段存储表示数据集中所述对象的出现次数的聚合量;基于散列参数的二进制表示,确定所述对象的散列参数对聚合量做出贡献;和响应于确定所述对象的散列参数对聚合量做出贡献,更新存储在所述寄存器的第三字段中的聚合量;和基于存储在所述一组寄存器中的聚合量,生成指示一组数据项的报告输出,其中所述一组数据项中的每个数据项识别数据集中以特定聚合量在数字环境中执行活动的对象的估计数量。

全文数据:

权利要求:

百度查询: 谷歌有限责任公司 数据处理方法、数据处理系统和计算机可读介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。