首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种云平台上加密TLS应用流量分类方法及系统_北京工业大学;国家计算机网络与信息安全管理中心_202110669055.1 

申请/专利权人:北京工业大学;国家计算机网络与信息安全管理中心

申请日:2021-06-17

公开(公告)日:2024-05-07

公开(公告)号:CN113723440B

主分类号:G06F18/2415

分类号:G06F18/2415;G06F18/25;G06N3/045;G06N3/0464;G06N3/0442;G06N3/084

优先权:

专利状态码:有效-授权

法律状态:2024.05.07#授权;2021.12.17#实质审查的生效;2021.11.30#公开

摘要:本发明公开了一种云平台上加密TLS应用流量分类方法及系统,该方法包括训练阶段和分类阶段;训练阶段包括:对加密TLS应用流量样本进行统一处理;对训练数据进行学习训练,构建应用分类模型;分类阶段包括:对未分类的加密TLS应用流量样本进行统一处理;根据训练阶段得到的应用分类模型,对待测流量样本的应用类型进行判别,并输出判别结果。本方法及系统通过提取网络流的报文长度序列并结合门限机制、自注意力机制等,从而实现了准确率、效率更优的“云”平台上加密TLS应用流量分类。

主权项:1.一种云平台上加密TLS应用流量分类方法,其特征在于,包括训练阶段和分类阶段;所述训练阶段包括如下步骤:1以已知所属类型的加密TLS应用流量为输入,将每条流量转换为格式化的报文长度值序列;2以步骤1得到的报文长度值序列作为输入,形成训练数据集,采用有监督学习的方式,构建加密TLS应用流量分类模型;所述分类阶段包括如下步骤:3以网络流量数据为输入,获取未分类的加密TLS应用流量,并将待测加密TLS应用流量转换为与步骤1相同格式的报文长度值序列;4根据训练阶段中步骤2得到的加密TLS应用流量分类模型,对待分类的加密TLS应用流量进行类型判别,并输出判别结果;步骤1进行加密TLS应用流量到报文长度值序列转换的具体操作方法是:1-1从加密TLS应用的协议流量中,提取一条完整流量的全部报文,并按序排列;1-2统计报文序列中每个报文的字节长度,将报文长度值按报文顺序排列,得到报文长度值序列;1-3根据应用分类模型输入格式要求,如果报文长度值序列的总长小于指定值,则在尾部补零,如果报文长度值序列总长大于指定值,则仅保留报文长度值序列前部,丢弃超过指定值的长度值,得到格式化报文长度值序列;步骤2构建所述加密TLS应用流量分类模型的方法是:2-1嵌入表征操作:以步骤1得到的格式化报文长度值序列为输入,使用嵌入表征生成层,将各个报文长度值转化为给定维度的嵌入向量,得到样本嵌入向量作为输出;2-2位置信息嵌入操作:以步骤2-1得到的样本嵌入向量为输入,根据向量中各元素坐标生成对应的位置嵌入表征向量,并将位置嵌入表征向量与样本嵌入向量整合,得到初始表征向量作为输出;2-3表征扩充操作:以步骤2-2得到的初始表征向量为输入,使用具有不同尺寸的多个卷积层,并行地生成分支表征向量,并融合得到表征向量作为输出;2-4自注意力特征提取操作:以步骤2-3得到的表征向量作为输入,使用不少于一层的自注意力模块进行特征提取,得到自注意力特征向量作为输出;2-5类别敏感的特征提取及判别操作:以步骤2-4得到的自注意力特征向量为输入,与可分类的加密TLS应用类型对应进行类特征提取,得到加密TLS应用流量样本的类判别向量作为输出;2-6以步骤2-5得到类型判别与样本真实的应用类型为输入,计算模型分类准确率、损失函数值指标,若指标满足终止条件L,则停止模型构建流程,输出应用分类模型;若指标不满足终止条件L,则根据指标更新网络参数,重复步骤2-1~步骤2-6;步骤2-4所述的自注意力特征提取操作的具体操作方法是:2-4-1以2-3得到的表征向量为输入,使用多个彼此独立的自注意力计算单元,分别进行自注意力计算操作,得到各个自注意力计算单元对应的自注意力特征分量;2-4-2将同一样本生成的所有自注意力特征分量在序列中单个元素的特征表示的维度连接;连接前后,序列长度这一维度大小保持不变;2-4-3使用可训练的参数矩阵,与连接后的自注意力特征向量进行矩阵乘法,得到自注意力特征向量,自注意力特征向量的向量维度与的2-3得到的表征向量维度相同;2-4-4应用分类模型能够顺序使用多个自注意力特征提取模块;如果应用分类中使用大于一个的自注意力特征提取模块,则后续的自注意力特征提取操作以其前序的自注意力特征提取操作得到的自注意力特征向量为输入,重复步骤2-4-1至2-4-3;步骤2-4-1所述的自注意力计算操作的具体操作方法是:2-4-1-1以2-3得到的表征向量为输入,将表征向量转换为三个不同的自注意力计算分量,设计算分量表示为Q、K、V,报文字节长度值序列的长度为l,则计算分量Q、K、V维度分别为l×dq、l×dk、l×dv,且有dq=dk;2-4-1-1使用如下自注意力算法公式,得到自注意力特征分量O:

全文数据:

权利要求:

百度查询: 北京工业大学;国家计算机网络与信息安全管理中心 一种云平台上加密TLS应用流量分类方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。