首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种车联网场景下基于MEC的NOMA上行功率分配优化方法_吉林大学_202311726837.X 

申请/专利权人:吉林大学

申请日:2023-12-14

公开(公告)日:2024-06-11

公开(公告)号:CN118175632A

主分类号:H04W72/044

分类号:H04W72/044;H04W4/44;H04W72/53;G06N3/006;G06N20/00

优先权:

专利状态码:在审-公开

法律状态:2024.06.11#公开

摘要:本发明涉及一种车联网场景下基于MEC的NOMA上行功率分配优化方法。其方法为:首先建立一个非正交多址接入技术NOMA辅助的多路侧单元RSU和多车辆的多接入边缘计算MEC系统场景;其次根据车联网场景得出面向不同时延敏感型任务的上行传输阶段功率分配数学模型;最后通过基于混合NOMA分组策略UCGD‑FN的强化学习功率分配算法解决功率优化问题模型,并将数学模型最优解所对应的功率分配优化方法作为最终上行功率分配优化方法;本方法基于不同时延敏感型任务的车联网场景,提出了混合NOMA分组策略UCGD‑FN,利用强化学习功率分配算法对NOMA上行功率分配过程进行优化,将时延与能耗纳入综合考量,进一步降低了上行传输阶段车辆用户的任务完成时延,提高MEC系统性能。

主权项:1.一种车联网场景下基于MEC的NOMA上行功率分配优化方法,应用在一个典型的多接入边缘计算MEC系统辅助车联网场景下,一条被远端云服务器覆盖的双向道路,路侧单元RSU位于道路沿线,每个路侧单元RSU配备一个多接入边缘计算MEC服务器,每个路侧单元RSU及其配备的多接入边缘计算MEC服务器构成一个基站,车辆随机产生对时延敏感程度不同的任务,即不同时延敏感型任务,并通过多接入边缘计算MEC服务器或远端云服务器进行不同时延敏感型任务的卸载计算,利用车辆与路边基础设施V2I技术可实现车载设备和路边基础设施之间的通信,将5G网络中的非正交多址接入技术NOMA应用于多接入边缘计算MEC系统中,提出混合NOMA分组策略UCGD-FN,对每个基站下的车辆用户进行NOMA分组,利用基于混合NOMA分组策略UCGD-FN的强化学习功率分配算法对NOMA上行功率分配过程进行优化,有效降低车辆用户的任务完成时延,提高车联网系统性能,其特征在于,本方法的步骤如下:步骤一,建立一个非正交多址接入技术NOMA辅助的多路侧单元RSU和多车辆的多接入边缘计算MEC系统场景:由路侧单元RSU、多接入边缘计算MEC服务器、远端云服务器和车辆构成;具体过程为:建立一个非正交多址接入技术NOMA辅助的多路侧单元RSU和多车辆的多接入边缘计算MEC系统场景指的是:考虑一条被远端云服务器覆盖的双向道路,M个路侧单元RSU位于道路沿线,每个路侧单元RSU都配备了一个多接入边缘计算MEC服务器,每一个路侧单元RSU及其配备的多接入边缘计算MEC服务器组合为一个基站,把这些路侧单元RSU用集合来表示,其中,表示第m个路侧单元RSU,因为一个路侧单元RSU对应一个基站,所以m也表示第m个基站,每个路侧单元RSU都有自己的可用带宽资源量Dm、存储资源量Vm和计算资源量Fm,第m个路侧单元RSU的可用资源集合用来表示;定义这条双向道路上实际行驶的车辆用户数为N0,混合NOMA分组策略UCGD-FN的分组车辆用户数为N,当实际行驶的车辆用户数N0能够被4整除时,N=N0;当实际行驶的车辆用户数N0不能被4整除时,MEC通过设置χ≤3的虚拟车辆用户使混合NOMA分组策略UCGD-FN的分组车辆用户数N能够被4整除,此时,N=N0+χ,车辆集合表示为其中,n表示第n辆车,每辆车在一个时间周期内随机产生一个不同时延敏感型的计算任务,任务类型表示为其中,A表示对时延敏感程度高的任务,即时延敏感型任务,B表示对时延敏感程度低的任务,即非时延敏感型任务,N辆车产生的任务集合表示为其中第n辆车产生的计算任务被描述为dn代表第n辆车的任务数据量大小,cn代表计算任务每比特数据所需要的CPU周期数,代表第n辆车的最大传输功率,代表第n辆车的任务所能容忍的最大延迟;假设在多接入边缘计算MEC系统模型中每个车辆用户计算能力是有限的,其不直接处理任务,即所有车辆用户将自己产生的计算任务全部卸载,不考虑对任务进行本地计算,每个车辆用户的计算任务可以在远端云服务器或基站进行处理;步骤二,根据车联网场景得出面向不同时延敏感型任务的上行传输阶段功率分配数学模型;具体过程为:1非正交多址接入技术NOMA非正交多址接入技术NOMA允许多个车辆用户共享相同的频率资源块,这使得在功率域上,基站能够根据车辆用户的信道质量,在车辆用户发送信号时给同一频率资源块上的叠加车辆用户分配不同的发送功率,在接收端,根据车辆用户的信道质量和发送功率大小来区分和识别用户,实现对同一频率资源块的复用;2用户分组方案非正交多址接入技术NOMA通过用户分组使多个车辆用户共享相同的频率资源块,本方法提出了一种远近分组法和UCGD分组法相结合的用户分组方案,即混合NOMA分组策略UCGD-FN,通过混合NOMA分组策略UCGD-FN对所有车辆用户进行两两分组,得到个组,每个组称为一个用户对,在上行传输阶段进行功率分配的过程中,在每个用户对中选择功率系数αn进行功率优化,调整功率分配方案,从而得到更优的系统性能;根据信道增益,将所有车辆用户划分为四个集合,依次为强集、次强集、次弱集和弱集,强集和次弱集采用UCGD分组方案,次强集和弱集采用远近分组方案,混合NOMA分组策略UCGD-FN既避免了远近分组法中间用户组的信道差异较小的问题,又获得了比UCGD分组法更大的弱用户信道增益,混合NOMA分组策略UCGD-FN表示为: 其中,hn表示上行传输过程中路侧单元RSU和第n辆车之间的信道增益;3上行传输模型每个路侧单元RSU与其配备的多接入边缘计算MEC服务器构成一个基站,每个基站会根据其架设位置覆盖一定数量的车辆用户,即每个基站与其覆盖的车辆用户相关联,能够进行任务卸载,每个路侧单元RSU的可用带宽资源量为Dm,假设路侧单元RSU具有车辆用户的完备的信道状态信息,每个路侧单元RSU可用的带宽资源量Dm被划分为多个相同的频率资源块,每个频率资源块的带宽为D,那么每个路侧单元RSU包含相同的频率资源块的总数为K=DmD,每个基站覆盖的车辆用户分散在路侧单元RSU的各个频率资源块中,同一个频率资源块上的车辆用户形成一个NOMA集群,即每个路侧单元RSU上有K个NOMA集群,假设无线信道是在不同的路侧单元RSU之间正交共享且每个NOMA集群所在的频率资源块与其他频率资源块正交,定义每个路侧单元RSU中的NOMA集群的集合为假设道路上在基站覆盖下的所有车辆用户的信道增益排序为其中,表示第n辆车是否与第m个基站的第k个NOMA集群相关联,且满足道路上所有的车辆用户以所在集群为单位向其相关联的路侧单元RSU进行不同时延敏感型任务的卸载计算,在任务卸载过程中,经过串行干扰消除SIC处理之后,第m个路侧单元RSU在第k个NOMA集群上接收到的第n辆车的信号yn为: 其中,表示第m个路侧单元RSU要为第n辆车计算的目标信号,中的hn表示上行传输过程中第m个路侧单元RSU和第n辆车之间的信道增益,表示第n辆车的传输功率,其中,αn∈0,1],指的是第n辆车的功率系数,即本方法要优化的变量,能够决定上传功率的大小,xn表示第n辆车包含卸载任务的发送信号,上式中的表示来自同一频率资源块的其他用户卸载任务的干扰,其中,pi是与第n辆车在同一NOMA集群中的第i辆车的传输功率,xi表示车辆i包含卸载任务的发送信号,zn表示加性高斯白噪声;路侧单元RSU通过将其他车辆用户的信号视为噪声来解码目标信号,第n辆车的信噪比表示为: 上式中,表示第n辆车的归一化信道增益,表示第i辆车的归一化信道增益,其中,σ2为噪声功率谱密度,表示第i辆车是否与第m个基站的第k个NOMA集群相关联,且满足通过第n辆车的信噪比可计算其数据传输速率Rn表示为:Rn=Dlog21+SINRn第n辆车将其计算任务卸载到其连接的第m个路侧单元RSU的上行链路传输延迟由下式给出: 4数学计算模型通过以上过程得到的数学计算模型优化问题被描述为: 其中,表示第n辆车上传的任务所占权重,αn∈0,1],是第n辆车的功率系数,即本方法要优化的变量,pn是第n辆车传输任务的发送功率,表示第n辆车是否与第m个基站的第k个NOMA集群相关联;步骤三,通过基于混合NOMA分组策略UCGD-FN的强化学习功率分配算法解决功率优化问题模型,并将数学模型最优解所对应的功率分配优化方法作为最终上行功率分配优化方法;具体过程为:考虑到时延敏感程度不同的A、B类任务,为了尽可能满足A类任务的时延需求,根据混合NOMA分组策略UCGD-FN,在每个用户对中选择功率系数αn进行优化时,建立一个考虑四种不同任务分组情况的功率优化决策表,通过功率优化决策表选择要优化的功率系数αn,考虑四种不同任务分组情况的功率优化决策表的内容如下:当任务类型为A,A时,高信道增益用户的功率系数αn=1,低信道增益用户的功率系数αn待优化;当任务类型为A,B时,高信道增益用户的功率系数αn=1,低信道增益用户的功率系数αn待优化;当任务类型为B,A时,高信道增益用户的功率系数αn待优化,低信道增益用户的功率系数αn=1;当任务类型为B,B时,高信道增益用户的功率系数αn=1,低信道增益用户的功率系数αn待优化;根据本方法要解决的问题,算法的适应度函数表示为: 其中,ζ表示功率系数优化矩阵,表示从所有用户对中选择出来的待优化的个功率系数αn,本方法的目标是将适应度函数最大化,采取的算法是强化学习Q-learning算法,Q-learning算法是智能体通过与环境的交互,采取一个动作之后,系统转移到下一个状态,并且会得到一个回报值,智能体会根据回报值的大小调整选择动作的策略,如果一个动作的回报较大时,智能体会更倾向于选择该动作,回报较小或者为负数则会尽量避免选择该动作,通过不断的试错过程,智能体会逐渐收敛到一个最优策略,Q-learning算法具体过程如下:过程一,相关参数设置及初始化这一过程一中需要进行一些基本参数的设置,包括车辆用户数N、路侧单元RSU的数量M以及每个路侧单元RSU的可用资源集合A类任务可容忍的最大时延和B类任务可容忍的最大时延当前迭代次数Iter、最大迭代次数maxIter,并对Q-learning算法的动作空间、状态空间、Q表及任务类型进行初始化;状态空间表示为:动作空间表示为:初始Q表赋值为零矩阵,环境反馈回报值定义为: 其中,表示适应度奖励函数,系统总时延越小,奖励越大,回报值越大;表示能耗惩罚函数,β是能耗惩罚因子,本方法中β取10,将系统能耗作为回报值的一项,进行系统时延与能耗的综合考量,系统能耗越大,回报值越小,表示超时惩罚函数,C是超时惩罚因子,本方法中C取100,若A类任务卸载时延超出A类任务的最大容忍时延或B类任务卸载时延超出B类任务的最大容忍时延ψ为1,给予惩罚;若A类任务卸载时延未超出A类任务的最大容忍时延且B类任务卸载时延未超出B类任务的最大容忍时延ψ为0,没有惩罚,智能体会根据环境反馈回报值选择最大环境反馈回报值对应的动作,从而选择最大动作对应的最优的功率分配优化方案;过程二,选择动作、更新状态和Q表在Q-learning算法的过程中,选择使用贪婪ε-greedy探索策略来对Q表进行更新,其原理是以1-ε的概率选择当前状态下Q值最大的动作,以ε的概率随机选择动作,本方法中ε取0.1,这样能够保证智能体即使陷入局部最小解的情况下,依然存在一定的概率可以跳出该种情况,智能体基于当前的状态,使用贪婪ε-greedy探索策略选择动作,计算环境反馈回报值Reward,进入到下一状态,并更新Q表,Q表更新规则为:Q's,a=Qs,a+λ[Reward+θmaxQs',a'-Qs,a]其中,Qs,a表示更新前的Q值,Q's,a表示更新后的Q值,maxQs',a'表示当前状态连接的所有下一状态的Q值的最大值,λ表示智能体的学习速率,θ表示折扣因子,且λ∈0,1,θ∈0,1;过程三,循环阶段当前迭代次数Iter的值加1,跳转到过程二,进入循环阶段,当循环次数达到maxIter时,算法终止,得到优化后的功率系数优化矩阵包含个已优化的功率系数αn,优化后的功率系数优化矩阵即为最终上行功率分配方案。

全文数据:

权利要求:

百度查询: 吉林大学 一种车联网场景下基于MEC的NOMA上行功率分配优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术