买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南京邮数通信息科技有限公司
摘要:本发明提供了一种基于联邦学习的家庭路由器数据流识别方法的识别架构,识别架构包括智能家庭基础设施层、家庭路由器节点层和云平台层。在训练阶段,家庭路由器利用路由器管理平台下发的域名配置文件,实时采集流量数据,形成初始数据集,利用初始模型、基于初始数据集在深度学习管理平台的调度下实现联邦学习模型训练。在识别阶段,家庭路由器流转发策略表,根据深度学习模型的流分类结果,依据IP进行不同优先级的路由转发。通过本发明的识别方法可以有效解决联邦学习应用于流量识别领域时,无法在线自动标记数据形成数据集的问题,同时通过节点选择降低了参与全局训练的节点数量,大大减少计算量和通信资源消耗。
主权项:1.一种基于联邦学习的家庭路由器数据流识别方法,其特征在于,包括:步骤1:在家庭路由器管理平台中对应用流量进行域名提取,生成域名配置文件;步骤2:在家庭路由器中,依据域名配置文件进行流量标记,生成初始数据集;具体包括:家庭路由器从家庭路由器管理平台获取域名配置文件,在采集前,修改路由器驱动,在其代码内嵌入钩子函数;在采集时,利用驱动中的钩子函数把网卡驱动收到的数据拷贝到环状缓冲区,再从环状缓冲区中获取以用户数据报协议为载体的UDP数据和以传输控制协议为载体的TCP数据;逐一分析UDP数据中的DNS回复包,检查是否包含与域名配置文件一致的域名,若有,则将该DNS回复包中的所有合法IP生成该域名的域名解析IP列表,并记录应用名称;若没有,则继续分析采集到的下一个DNS回复包,直至将获取的所有DNS回复包分析完毕;解析UDP数据和TCP数据,检查采集到的UDP和TCP数据包中IP层的来源IP、目的IP是否在上述域名解析IP列表中,若在,则将该源目IP的所有流量包提取出来进行形成上行下行的双向数据流,对这些数据流进行流特征提取并打上对应的应用标签,形成初始数据集;若不在,则继续检查下一收到的数据;其中,流特征提取方法为:对TCP数据和UDP数据提取流特征,首先使用五元组来标识数据包,提取形成上行下行的数据流,然后对上行下行的数据流分别计算特征:1五元组作为流的标记,保存在hash表中,同时保存有流的第一个数据包的时间戳、最后一个数据包的时间戳;如果一个流的持续时间超过120秒,则把流截断、输出一次特征并且把hash表中的信息清除,后续的数据包作为新的流计算特征;2TCP数据包的FIN标识作为流的结束标识,FIN标识出现后立刻输出该流的AI特征并且把hash表中的信息清除;3指标计算中,把符合TCPSYN包的srcIP–dstIP方向的数据包称为“正向”,反之称为“反向”;没有TCPSYN包的流,取第一个数据包的srcIP–dstIP方向称为“正向”,反之称为“反向”;4每个流输出20个特征,且输出特征时根据AI芯片的输入要求转换成8位;步骤3:在深度学习管理平台的调度下,家庭路由基于初始模型利用初始数据集进行联邦训练,生成家庭路由器深度学习模型;步骤4:家庭路由器管理平台根据应用类型制定流转发策略表并进行下发,家庭路由器使用基于联邦训练的家庭路由器深度学习模型对采集的流量进行应用分类,并根据流转发策略表和IP进行不同优先级的路由转发。
全文数据:
权利要求:
百度查询: 南京邮数通信息科技有限公司 基于联邦学习的家庭路由器数据流识别方法和识别架构
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。