首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种面向高速网络的多平台视频流量早期识别方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:东南大学

摘要:本发明公开了一种面向高速网络的多平台视频流量早期识别方法,首先从多个平台采集原始流量,然后根据流的握手或者请求信息对视频流和非视频流进行标记。接着基于协议无关原则构建用于分类视频和非视频流量的特征空间,并对已标记的流量提取特征向量构建数据集。最后,使用有监督机器学习方法,对包含视频和非视频流量的数据集离线构造分类模型。该分类模型结合前面提出的特征空间,可以在高速网络采样数据采集情景下准确地识别高速网络中的视频流量。本发明提出的特征空间可以从流的少量数据包中提取稳定的特征向量,可以在流传输的早期阶段识别视频流量。本发明可以在有限的内存和合理时间内实现对海量高速流量中视频流量的实时识别,能够用于网络流量分析和网络管理。

主权项:1.一种面向高速网络的多平台视频流量早期识别方法,其特征在于,该方法包括以下步骤:步骤1通过数据采集设备对不同平台的视频播放流量进行采集;步骤2将采集到的流量进行预处理,并标记视频和非视频流;步骤3对步骤2中标记好的流量提取特征,基于规则构建特征空间,然后获得带有标签的样本集;步骤4将步骤3中获得的样本集作为训练集,然后使用有监督机器学习方法训练得到可以区分视频流和非视频流的分类模型;步骤5设置采样比,对高速网络中的流量按分组进行系统采样,然后对采样后的分组组流,并提取特征;步骤6应用步骤4得到的分类模型对未知流进行预测,识别视频流量;所述步骤1中,采集视频流量的方法如下:1.1在实验室主机和安卓设备上分别抓取流量,在主机端使用Wireshark直接抓取流量;安卓设备则连接主机上的热点,通过Wireshark抓取安卓设备视频播放进程的流量,抓取视频流量时,禁用其它应用的联网权限;1.2选择不同平台的视频网站,播放视频并按以下策略抓取流量:设定每个视频的最大抓取时间为5分钟,然后结束抓取并保存为pcap文件;1.3编写自动化脚本实现步骤1.2,批量抓取视频流量,所述步骤2中,流量的预处理和标记具体包含以下步骤:2.1对步骤1中获取的不同平台的视频流量,将五元组即源IP、源端口、目的IP、目的端口和传输层协议相同的数据包组成同一条双向流,并丢弃分组数量少于N的流;2.2判断双向流所采用的传输协议,若为非加密视频流,进行2.3;否则进行2.4;2.3从双向流中提取包含传输的文件类型的URL请求信息,根据文件类型关键字判断该流是否为视频流并进行标记;2.4从双向流中的握手信息中提取包含域名信息的SNI字段,根据SNI中包含的关键字,判断该流是否为视频流并进行标记,所述步骤3中,构建带标签样本集的具体步骤如下:3.1对已被标记的双向流记录如表1所示的统计值;表1统计值及描述 统计值 统计值的描述 f_pck 上行方向传输的数据包数量 b_pck 下行方向传输的数据包数量 f_len 上行方向传输的字节数 b_len 下行方向传输的字节数 f_d_p 上行方向传输的带载荷数据包数量 b_d_p 下行方向传输的带载荷数据包数量 f_d_l 上行方向传输的带载荷的数据字节数 b_d_l 下行方向传输的带载荷的数据字节数 p_len 双向流中每个数据包携带的载荷字节数 tmGap 双向流的有效传输时间 3.2对收集到的信息进一步处理,通过统计计算消除数据包采样对特征稳定性的影响;3.3从视频流量本身传输的三大特性出发即上下行流量传输的不对称性、高传输速率以及有效载荷长度分布,对双向流构建如表2所示的特征空间;表2特征空间及其包含的特征的描述 3.4基于构建好的特征空间,对采集到的流量提取特征向量构建样本集,所述步骤4中,训练分类模型具体包括以下步骤:4.1将样本集按3:1划分为训练集和测试集;4.2使用随机森林算法对训练集进行训练,并通过测试集对特征向量进行降维处理,并确定算法的参数;4.3获得用于视频流量识别的分类模型,所述步骤5中,采集高速网络流量并提取特征向量具体包含以下步骤:5.1在高速网络中部署流量采集设备,并使用tcpdump持续抓取流量;5.2设置采样比,对获取的数据进行系统采样,并按五元组重组流;5.3设置提取特征所需的数据包数量M,从采样后的流的前M个数据包中提取特征向量,所述步骤6中,将步骤5提取的高速网络流量的特征向量输入步骤4获得的分类模型,从中识别视频流量并输出结果。

全文数据:

权利要求:

百度查询: 东南大学 一种面向高速网络的多平台视频流量早期识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。