南京大学学报(自然科学), 2024, 60(3): 416-428 doi: 10.13232/j.cnki.jnju.2024.03.006

移动边缘计算中资源供给不确定下的最优投资和定价问题

林德铭1,2, 林姿琼1,2, 郑艺峰1,2, 杨敬民1,3, 张文杰,1,2

1.闽南师范大学计算机学院,漳州,363000

2.数据科学与智能应用福建省高校重点实验室,闽南师范大学,漳州,363000

3.台北科技大学电子工程系,台北,106344

Optimal investment and pricing under uncertain resource supply in mobile edge computing

Lin Deming1,2, Lin Ziqiong1,2, Zheng Yifeng1,2, Yang Jingmin1,3, Zhang Wenjie,1,2

1.School of Computer Sciences,Minnan Normal University,Zhangzhou,363000,China

2.Fujian Provincial University Key Laboratory of Data Science and Intelligent Application,Minnan Normal University,Zhangzhou,363000,China

3.Department of Electronic Engineering,Taipei University of Technology,Taipei,106344,China

通讯作者: E⁃mail:zhan0300@ntu.edu.sg

收稿日期: 2023-11-04  

基金资助: 国家自然科学基金.  62141602
福建省自然科学基金.  2021J011002.  2021J011004.  2020J01813
教育部人文社科青年项目.  20YJC870002

Received: 2023-11-04  

摘要

为了缓解能源性能的瓶颈,满足更多用户的资源需求,将移动边缘计算(Mobile Edge Computing,MEC)与能量收集(Energy Harvesting,EH)技术相结合,其中,EH技术可以通过捕获环境中的绿色能量来促进设备的可持续计算,提出一个具有随机能量收集的EH⁃MEC系统,以研究资源供给不确定性的投资和定价问题.用户可以租赁MEC系统的固有资源,也可以使用EH装置收集的资源.由于无线环境的时变性,EH收集的能源具有不确定性,所以,在MEC系统中找到MEC服务器和用户之间的平衡是值得研究的问题.针对这一问题,提出一种序贯决策方法,将用户的投资和MEC服务器资源定价的交互行为建模为一个四阶段的Stackelberg博弈,利用逆向归纳法得到用户与MEC服务器在利润最大化下的纳什均衡解,证明MEC服务器的最优能量收集时间、最优租赁资源和定价决策遵循良好的阈值结构.实验结果表明,绿色资源获取可以显著提高MEC服务器和用户的预期收益.

关键词: 移动边缘计算 ; Stackelberg博弈 ; 能量收集 ; 资源分配 ; 投资与定价

Abstract

To alleviate the bottleneck of energy performance and meet the resource demand of more users,Mobile Edge Computing (MEC) combined with Energy Harvesting (EH) technology has been considered,in which EH technology facilitates sustainable computing in devices by capturing green energy from environment. Thus,a stochastic EH⁃MEC system is proposed to study the investment and pricing problem with uncertain resource supply. Users can either rent the inherent resources of MEC system or use the resources harvested by EH. Due to the time⁃varying nature of wireless environment,the energy collected by EH has the feature of uncertainty. Therefore,how to find a balance between MEC servers and users in MEC systems is a problem worth studying. To address this problem,a sequential decision⁃making method is proposed,and the interaction between users' investment and MEC server's resource pricing is formulated as a four⁃stage Stackelberg game. Then,backward induction is used to obtain Nash equilibrium for the users and MEC server under profit maximization. The MEC server optimal energy collection time,optimal leasing resources and pricing decisions has been demonstrated to follow a good threshold structure. Experimental results show that green resource acquisition can significantly improve the expected revenue of MEC servers and users.

Keywords: mobile edge computing ; stackelberg game ; energy harvesting ; resource allocation ; investment and pricing

PDF (1164KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

林德铭, 林姿琼, 郑艺峰, 杨敬民, 张文杰. 移动边缘计算中资源供给不确定下的最优投资和定价问题. 南京大学学报(自然科学)[J], 2024, 60(3): 416-428 doi:10.13232/j.cnki.jnju.2024.03.006

Lin Deming, Lin Ziqiong, Zheng Yifeng, Yang Jingmin, Zhang Wenjie. Optimal investment and pricing under uncertain resource supply in mobile edge computing. Journal of nanjing University[J], 2024, 60(3): 416-428 doi:10.13232/j.cnki.jnju.2024.03.006

随着5G移动通信技术和物联网的发展,在智能手机、可穿戴智能设备和传感器等移动设备上运行计算密集型和延迟敏感型应用已成为趋势1.由于自身计算能力与功耗的限制,移动设备通常不具备运行这类应用的条件,而移动边缘计算(Mobile Edge Computing,MEC)将计算任务从移动设备卸载到计算资源相对丰富的边缘服务器上执行,实现了在移动设备上运行计算密集型和延迟敏感型应用的愿景2.与移动云计算不同,MEC服务器通常部署在网络边缘,避免移动用户和远程云中心之间的长距离数据传输,可以显著降低延迟和移动用户的能量消耗3.因此,MEC是5G网络的关键技术,获得了业界的广泛关注.

为了提高MEC的性能,科研人员进行了各种研究.资源问题是MEC系统设计中的重要组成部分,可以极大地提升网络性能,因而受到了广泛的关注4-5.目前,资源分配主要有两种主流的分析模式6.第一种以最小化能耗或时延为优化目标,从技术层面对资源分配的问题进行研究.例如,郭延超等7在不考虑网络情况与高刷新率导致的高耗能的背景下,提出基于马尔可夫决策过程的能耗优化模型.李振江和张幸林8采用遗传算法和基于分割时间槽的资源分配算法来搜索最优决策,以减少云端通信流量.Wang et al9研究了多天线多用户的MEC系统,从离线优化和在线优化两个方面对下行传输功率分配方案进行研究.Zhao et al10在满足时延约束的前提下联合优化任务卸载和资源分配来最小化能耗.Zhang et al11研究了多用户多任务MEC系统中服务缓存、计算卸载和计算资源分配的联合优化问题,并提出基于半定松弛方法和交替优化的高效近似算法来最小化所有用户的计算和延迟成本.第二种分析模式以最大化利润为优化目标,由于自私性和计算成本,假设边缘服务器在无任何激励下自愿协作计算是不现实的,因此有必要从经济层面对MEC资源分配和定价问题进行研究12.例如,吴雨芯等13对资源进行基于成本的统一定价,并通过仿真实验证明在统一定价下的最大价格就是资源供应商获得最大利润的最优价格.Liu and Liu14提出基于定价策略的分布式方法来管理用户的计算卸载任务,建立Stackelberg博弈模型来分析MEC服务器与用户间的交互.Jie et al15考虑一个MEC服务器和多个终端用户的场景,设计了一个以终端用户作为领导者、MEC服务器充当跟随者的Stackelberg博弈模型.林艳等16提出一种基于交通流量预测的车联网边缘计算迁移方案,采用McAfee拍卖算法来解决车辆与边缘服务器之间的资源双重拍卖问题,旨在提高车辆的计算迁移率,同时改善边缘服务器的资源利用率.张海波等17提出由层次分析法排序、任务投标、获胜者决策三个部分组合而成的多轮顺序组合拍卖机制.针对MEC资源交易市场中存在的用户多样性问题,Huang et al18提出一种由期货市场和现货市场组成的混合市场资源交易机制.为了激励节点参与编码机器学习,Ding et al19在完全信息和多维不完全信息下,分别提出基于Stackelberg博弈和契约理论的激励机制.

然而,上述资源分配和定价分析模型通常没有考虑多资源获取的问题,而单一的资源获取渠道无法支撑延迟敏感和计算密集型应用(如增强现实(Augmented Reality,AR)20和虚拟现实(Virtual Reality,VR)21)的运行,也制约了MEC的可持续计算.为了缓解移动边缘设备可用资源紧张问题,能量收集(Energy Harvesting,EH)技术作为资源的另一种获取途径被引入MEC系统22,EH技术能捕获环境中的绿色能量(风能、太阳能等),促进设备的可持续计算23-24.随着EH技术的成熟和发展进步,研究人员提出了具有能量收集的MEC系统.例如,Min et al25针对具有EH装置的物联网设备,提出一种基于强化学习的任务卸载方案.Huang et al26考虑一个MEC服务器和多个具有EH装置的无线设备的MEC场景,在时变无线信道条件下提出一种深度强化学习算法来优化任务卸载决策和无线资源分配方案.Chen et al27考虑一种具有EH功能的移动设备和多个基站的MEC系统,将卸载决策问题建模为马尔可夫决策过程,通过深度强化学习来得到最优策略.马惠荣等28提出一种利用EH技术和设备间通信技术的绿色任务卸载框架来最小化任务执行成本.EH技术面临的一大挑战是分配收集的资源,过于保守会浪费收集的能源,过于激进会导致能源供给不足.大多数现有工作都假设EH通信系统是完全已知的,根据确定性模型中的数据剖面或随机模型中的参数来表示无线环境特性29.然而在实践中,无线环境是时变的,移动设备通过EH装置捕获的能源也不是固定的,这给资源的有效分配带来巨大的挑战.

本文考虑一个具有随机能量收集的MEC(EH⁃MEC)系统,用户可以支付一定的费用租赁MEC系统的固有能量,也可以使用EH装置捕获的能源,但会产生一笔收集成本.与传统MEC系统的固定能源供给不同,由于无线环境的时变性和突发性,EH⁃MEC系统收集的能量是变化的,还可以通过动态调整能量收集时间来满足用户的实际需求.因此,EH⁃MEC需要在考虑最大化MEC服务器收益的前提下,提高终端用户的服务体验(Quality of Earnings,QoE),同时,终端用户的决策也会反作用于MEC服务器对固有资源的定价和对绿色资源的收集.一般情况下,与租赁相比,通过EH装置得到的能源更环保且成本更低廉,但由于无线环境的随机性,通过EH装置获得的能源具有不确定性.因此,当收集资源存在不确定性时,在MEC系统中找到合理的平衡来确保MEC服务器获取足够的资源并同时满足用户的需求是一个值得研究的问题.为了解决上述挑战,本文使用Stackelberg博弈进行系统建模,以MEC服务器为博弈模型中的领导者,终端用户为博弈模型中的追随者,通过构建双方的动态博弈决策模型来进行讨论.首先,引入无线环境随机因子对绿色资源的不确定性进行分析;然后,将MEC服务器收益最大化问题建模为Stackelberg博弈序贯决策的优化问题;之后,终端用户确定其最优需求决策,也就是MEC服务器实际资源获取决策,通过四阶段分析求解得到博弈的纳什均衡状态,最后,实验证明该算法可以最大化MEC服务器利润与终端用户服务体验.

1 系统模型与问题分析

首先介绍EH⁃MEC系统模型,再对能量收集模型以及MEC服务器和用户间的博弈过程进行具体阐述.

1.1 系统模型

EH⁃MEC系统模型如图1所示.MEC服务器具有固定的计算资源并配备了EH装置,该装置从环境中收集能源并存储在电池中.传统固定资源称为租赁资源C,通过EH装置收集的资源称为绿色资源H,两种不同资源在MEC服务器的调配下为多用户设备提供服务.MEC服务器的覆盖范围内有若干用户设备,定义为=1,,I.用户设备自身资源不足时会向MEC服务器请求服务,所有用户资源的总需求为W.一般地,租赁资源C的获取成本较高,令PcC的单位租赁价格,但租赁资源供应较稳定,转换技术也更成熟,MEC服务器获取租赁资源C几乎无损耗.绿色资源H的单位收集成本Ph相对较低PhPc,但由于无线环境的时变性,绿色资源H具有很大的不确定性,只有αH的资源被转换为实际可用资源α0,1,其中,α为无线环境随机因子,即绿色资源H在实际环境中转换为可用资源的转换率.因此,根据用户的需求在资源获取成本和资源不确定性之间找到平衡,最大化MEC服务器的收益,同时满足用户的需求是一个很重要的问题.

图1

图1   EH⁃MEC系统模型图

Fig.1   System model of EH⁃MEC


整个系统的处理流程为:MEC服务器分别获取绿色资源与租赁资源(αH+C),然后向终端用户公布统一资源定价π(MEC服务器在作出定价决策时需考虑资源价格对终端用户需求的影响),终端用户根据自身情况与MEC服务器公布的资源价格π决定资源购买量W.

1.2 EH能量收集模型

EH⁃MEC系统可以通过动态调整能量收集时间来满足用户的需求.令P表示EH装置在单位时间内收集的能源,T为能量收集时间.理想的能量收集模型如下:

H=PT

其中,H为在不考虑无线环境随机性的条件下,MEC服务器可获得的绿色资源总量.假设EH装置在单位时间内收集的能源P相对稳定,则EH⁃MEC系统可以通过动态调整能量收集时间来满足用户的需求,因此,确定绿色资源总量H的关键在于确定能量收集时间T.

由于无线环境的时变性和突变性,将绿色资源总量H转换为用户可使用的资源时需考虑无线环境中的随机因素,即当MEC服务器获取绿色资源H时,只有αH部分可以被用户使用.

1.3 Stackelberg博弈

利用Stackelberg博弈对MEC服务器与用户之间的交互决策进行建模,MEC服务器是博弈模型中的领导者,用户是模型中的追随者.首先确定第一阶段的能量收集时间T,得到可利用的绿色资源量αPT;根据第一阶段获取的绿色资源量,确定第二阶段MEC服务器获取租赁资源量C;第三阶段,MEC服务器根据实际总资源供给量αPT+C确定向用户公布的资源单价π;第四阶段,终端用户选择最大化个人收益的资源需求W.具体流程如图2所示.

图2

图2   四阶段Stackelberg博弈流程

Fig.2   The flow chart of four⁃stage Stackelberg game


2 四阶段博弈过程的逆向归纳求解

Stackelberg博弈属于动态博弈的一种,其一般解为概念子博弈的纳什均衡(Subgame Perfect Equilibrium,SPE).确定SPE的一种通用技术是逆向归纳法,首先从第四阶段开始,在MEC服务器的投资和定价决策下分析用户行为,然后在第三阶段分析MEC服务器在给定投资决策的情况下作出的资源定价,最后分别在第二阶段和第一阶段推导出MEC服务器的最优租赁决策和MEC服务器的最佳能量收集时间.逆向归纳揭示了四阶段MEC服务器最优决策的顺序依赖性.

2.1 第四阶段用户最佳资源需求

在第四阶段,终端用户根据第三阶段公布的单位资源价格π来确定资源总需求WW=iωiωi表示用户i的资源需求.

每个用户都可以与MEC服务器进行通信获取资源服务,资源可以是绿色资源也可以是租赁资源,其通信过程由MEC服务器主导,相互独立且互不干扰.令riωi为用户i的收益评价函数,它是一个严格的凸函数并满足以下约束:ri0=0ri' ωi>0riωi<030,这三个约束基本保障了用户资源获取的风险规避性.显然,更多的资源会给用户带来更多收益,但随着ωi不断增大,riωi的增长趋势会变缓,若用户此时仍然选择获取更多的资源,反而会带来损失.因此,本文将用户收益函数定义为:

riωi=aiωi2+biωi

其中,ai<0bi>π>0.aibi为每个用户相对独立的特质参数,每个用户只知道自己的本地信息ai,bi,不知道其他用户的任何信息.

用户的效益函数(payoff)定义为从资源ωi获得的收益与其向MEC服务器支付的金额之间的差,是一个关于用户资源需求ωi与单位资源价格π的函数.其具体的定义表示如下:

uiπ,ωi=aiωi2+biωi-πωi

定理1

第四阶段最大化用户效益的资源需求的计算如下所示:

ωi*π=maxπ2ai-bi2ai,0

证明 用户的效益函数uiπ,ωi关于资源ωi的二阶导数uiωi=2ai<0,且一阶导数为:

duiπ,ωidωi=2aiωi+bi-π

令一阶导数为0可以得到极值点π2ai-bi2ai,因此有ωi*π=maxπ2ai-bi2ai,0.

π>bi时,由于ai<0,极值点小于0,满足效益最大的资源需求为0,此时可以忽略该用户与MEC服务器的交互行为,因此,本文只考虑π<bi的情况.将用户特质参数ai,bi聚合表示为A=i12ai<0B=ibi2ai<0,则用户资源总需求W可以表示为:

W=iωi*π=iπ2ai-bi2ai=Aπ-B

式(3)可知,资源定价高,用户对资源的总需求就会下降,因此MEC服务器在第三阶段的定价必须合理.接下来考虑MEC服务器如何基于用户总需求在第一至第三阶段中进行资源投资和定价,下文将证明,MEC服务器总会在第三阶段选择一个价格,使总需求不超过总供给.

2.2 第三阶段最优资源定价策略

根据第二阶段的资源总供给αPT+C和第四阶段得到的用户总需求W,MEC服务器需要在第三阶段确定最优资源定价π.MEC服务器的效益函数(payoff)可以表示为:

RT,C,π=minπωi*π,παPT+C-PTPh+CPc

式(7)第一部分为出售资源得到的收入,第二部分为租赁固有资源和收集绿色能源的成本,MEC服务器的效益为二者的差.求最小化操作min表示MEC服务器只能满足用户可用供给的需求.第三阶段的目标是找到最优价格π*使得MEC服务器效益最大化,即:

RT,C=maxπ0RT,C,π

下标“Ⅲ”代表第三阶段的最佳效益.由于在第三阶段,能源收集时间T和租赁资源量C均已知,因此总成本PTPh+CPc是个定值.唯一的优化就是选择最优价格π以最大化式(7)的第一部分,即:

π*=argmaxπ0minπωi*π,παPT+C

Dπ=πiωi*π=Aπ2-BπSπ=παPT+C图3显示了DπSπ之间的三种可能的关系,其中,Sjπj=1,2,3表示三种可能关系中的每一种,取决于αPT+C.

图3

图3   最优价格π取值⁃讨论两函数不同的交集情况

Fig.3   Optimal value of price π⁃ different intersection cases of Dπ and Sπ


情形I,S1π(过度供给ES):与Dπ没有交集.

情形Ⅱ,S2π(过度供给ES):当Dπ斜率非负时,与Dπ相交一次.

情形Ⅲ,S3π(保守供给CS):当Dπ斜率为负时,与Dπ相交一次.

在过度供给的情况下,

π*=argmaxπ0minDπ,Sπ=argmaxπ0minDπ

即最优解π*Dπ取最大值时得到,即π*=B2A,在此价格下总供给大于用户资源总需求.

在保守供给的情况下,

π*=argmaxπ0minDπ,Sπ

最优解为DπS3π相交的地方,有π*=αPT+C+BA.根据上述讨论,得到定理2.

定理2

第三阶段MEC的最优资源定价和对应的最优效益可由表1给出.

表1   第三阶段MEC的最优资源定价决策与效益

Table 1  Optimal resource pricing decisions and benefits for MEC servers in Phase Ⅲ

资源供给情况最优价格选择π*最优效益RШ*T,α,C
过度供给(ES):αPT+CAπ-B=-B2πES=B2AREST,α,C=-B24A-PTPh+CPc
保守供给(CS):αPT+C<Aπ-B=-B2πCS=αPT+C+BARCST,α,C=αPT+C+BAαPT+C-PTPh+CPc

新窗口打开| 下载CSV


在过度供给情况下,一些资源未被出售,即Sπ*>Dπ*,这是由于获得的资源太多,出售所有的资源会导致价格非常低,降低了MEC的效益.因此,在过度供给的情况下,MEC服务器可以通过减少第一阶段和第二阶段获得的资源来提高效益.所以,在第三阶段,最佳资源定价策略取决于先前提到的资源供给情况,即过度供给和保守供给.对于不同的资源供给情况,MEC服务器会根据价格曲线的斜率变化来选择最佳定价策略.在资源供给过多时选择较低的价格来维护用户效益,在资源供给相对不足时适当提高价格以保证MEC服务器的效益,这种阈值结构在不同情境下引导了定价策略的选择.

2.3 第二阶段最佳资源租赁策略

在第二阶段,MEC服务器根据得到的绿色资源αPT来确定最优租赁资源量C*,表示为:

RΠT=maxC0RT,C

根据表1给出的两类资源供给情况,将RΠT,C分解为两个子问题.

问题1 在过度供给的状态下,即Cmax-B2-αPT,0,收益RΠT,C可以表示为:

RΠT=maxCmax-B2-αPT,0REST,C=-B24A-PTPh+CPc

在过度供给的情况下,C越大,RШ越小.因此,当C=0时,不获取租赁资源就是最佳选择.将C=0代入式(11),可得:

RES3T=-B24A-PTPh

问题2 在保守供给的状态下,即0C-B2-αPT,收益RΠT,C可以表示为:

RT=max0C-B2-αPTRCST,C=αPT+C+BAαPT+C-PTPh+CPc

租赁资源成本Pc越大,在保守供给的情况下,用户对资源的需求越少.为了最大化MEC服务器的效益,设资源需求的阈值ζ=-B2+Pc,因此,MEC服务器会尽可能使总资源量为ζ.当获得的绿色资源不足时,MEC服务器会增加租赁资源的量以达到阈值.根据以上观察和分析,可以得出的结论如定理3.

定理3

第二阶段最优租赁资源决策和最优效益如表2所示.

表2   第二阶段最优资源配置策略

Table 2  Optimal resource allocation strategy in Phase Ⅱ

Ι阶段获得αPT最优租赁资源量C*第二阶段最优利润RП*T,α
CS1:αPTζCCS1=ζ-αPTRCS1T=ζ+BζA-PTPh+Pc*ζ-αPT
CS2:αPTζ,-B2CCS2=0RCS2T=αPT2+BαPTA-PTPh
ES3:αPT>-B2CES3=0RES3T,α=-B24A-PTPh

新窗口打开| 下载CSV


针对保守供给和过度供给的情况,MEC服务器选择不同的租赁资源量.保守供给时,MEC服务器追求资源供给的平衡,根据阈值来决定绿色资源和租赁资源的分配.过度供给时,租赁资源的需求减少,无须租赁资源.这一阈值结构在资源租赁决策中发挥了关键的作用,帮助指导租赁资源的决策过程.

2.4 第一阶段最佳能量收集时间

在第一阶段,MEC服务器考虑无线环境随机因子α的不确定性,确定能量收集时间T,决定最佳绿色资源获取量,以最大化其预期利润.MEC服务器需要解决以下问题:

RΙ=maxT0RT

假设能量收集时间T的取值范围为Tmin,Tmax,根据给定的服务器资源需求的最佳阈值ζ以及用户最佳资源需求-B2,能量收集时间T可以分以下几种情形进行讨论.

(1)在保守供给的CS1情况下,αPTζ,即TζαP时,需要确定使MEC服务器利润RCS1T取最大值的能量收集时间T,即求解下式:

R=maxT0RT=ζζ+BA-PTPh+Pc*ζ-αPT=ζζ+BA-ζPc+αPc-PhPT

G=ζζ+BA-ζPc,则RT=G+αPc-PhPTG为与T无关的量.当αPc-Ph0时,RПT随着T的增加而递增,即TTmax时,RCS1取最大值.当αPc-Ph<0时,RT随着T的增加而递减,当T=Tmin时,RCS1取最大值.

(2)在保守供给的CS2情况下,αPT

ζ,-B2,即T-ζαP,-B2αP,MEC服务器的利润RCS2T可以表示为:

RІ=maxT0RT=αPT2+BαPTA-PTPh=αP2AT2+BαA-PhPT

式(15)的二阶导数为:

d2RCS2Td2T=2αP2A<0

因此,式(15)存在唯一极大值点使RCS2T取最大值,定义为EP.EP可以通过令式(15)的一阶导数为0得到,即EP=PhA-Bα2Pα2.

①当EP>-B2αP时,式(12)在T

ζαP,-B2αP单调递增,因此RCS2TT=-B2αP时取最大值.

②当EP<ζαP时,式(12)在T

ζαP,-B2αP单调递减,RCS2TT=ζαP时取最大值.

③当EPζαP,-B2αP时,RCS2TT

ζαP,-B2αP存在极大值点,最大值在极值点T=EP=PhA-Bα2Pα2得到.

(3)在过度供给的ES3情况下,αPT>-B2,即T>-B2αP时,使MEC服务器利润RES3T最大的能量收集时间T如下:

RІ=maxT0RES3T=-B24A-PPhT

RES3T的一阶导数dRES3TdT=-PhP<0RES3TT取值的减小而增大.因此,RES3TT=-B2αP时取最大值.

根据能量收集时间上限Tmax和下限Tmin,并结合上述三种供给关系,总结如下六种可能出现的情况.

情况1:横跨CS1,CS2,ES3三个区间,即Tmin<ζPTmax>-B2P.对比三个区间内取得的RCS1T,RCS2TRES3T,最佳MEC服务器效益为三者的最大值,即maxRCS1T,RCS2T,

RES3T,其对应的T为最佳能量收集时间.

情况2:在CS1区间内,即Tmax<ζP,此时最佳MEC服务器效益为RCS1T.

情况3:在CS2区间内,即Tmin>ζPTmax<-B2PRCS2T即为最佳MEC服务器效益.

情况4:在ES3区间内,即Tmin>-B2P,在这种情况下,RES3T为最佳MEC服务器效益.

情况5:横跨CS1,CS2两个区间,即Tmin<ζPζP<Tmax<-B2P.对比两个区间内取得的RCS1TRCS2T,最佳MEC服务器效益为maxRCS1T,RCS2T,其对应的T为最佳能量收集时间.

情况6:横跨CS2,ES3两个区间,即ζP<Tmin<-B2PTmax>-B2P.最佳MEC服务器效益为二者中的较大值,即maxRCS2T,RES3T,其对应的T为最佳能量收集时间.

定理4

第一阶段最优能量收集时间T*与最优效益RІ*(T)表3所示,表中临界值CV1=ζP,临界值CV2=-B2P,极值点EP=PhA-Bα2Pα2G=ζ+BζA-ζPc.

表3   第一阶段最优能量收集时间策略

Table 3  Optimal energy harvesting time strategy in Phase I

时间T取值条件判断最优时间T*第一阶段最优利润RІ*T
TCV1PhαPcT*=CV1RІT=G+αPc-Ph×CV1
Ph>αPcT*=0RІT=G
CV1TCV2EP<CV1T*=CV1RІT=α2ACV12+BαA-Ph×CV1
CV1<EP<CV2T*=EPRІT=α2AEP2+BαA-Ph×EP
EP>CV2T*=CV2RІT=α2ACV22+BαA-Ph×CV2
T>CV2T*=CV2RІ(T)=-B24A-CV2×Ph

新窗口打开| 下载CSV


3 实验结果

通过仿真实验来验证所提算法的有效性.采用Python搭建平台,模拟程序运行的系统为64位Windows 10,处理器为Inter(R) Core(TM) i5⁃10400F CPU @ 2.90 GHz.在满足用户i收益评价函数一般性的情况下,设用户i的特质参数取值范围为ai-3,-1,bi3,5,用户数量为200.默认的相关参数设置为:无线环境随机因子α=0.4,绿色算力资源获取成本Ph=0.6,租赁算力资源获取成本Pc=2.首先基于以上的讨论,对均衡状态下MEC服务器的能量收集时间、租赁资源决策、资源定价决策以及用户的资源需求进行仿真,再讨论无线环境不确定性因子对绿色资源获取和总体效益的影响.

3.1 均衡状态结果分析

为了方便分析,在仿真中将用户特质参数ai,bi归一化为用户的积聚无线特性A,B.由于MEC服务器最佳能量收集时间T*和服务器最佳资源获取量C*与用户的积聚无线特性A,B呈线性关系,因此,可以根据用户聚集的无线特性对最优能量收集时间和租赁资源决策进行归一化讨论.

图4展示了归一化最优能量收集时间T*在给定租赁资源获取成本下随着能量收集成本Ph的变化情况.由图可见,最优能量收集时间T*随着收集成本Ph的增加而减少,当收集成本Ph增加到临界值时,最优收集时间T*直接变为0.对比不同租赁资源获取成本下的三条曲线,可以发现当能量收集成本Ph相同时,租赁资源成本Pc越小,最优收集时间T*越先进入临界状态,即T*=0.对于给定的Pc,最优收集时间T*随着Ph的增加而减少,当Ph>αPc时,即能量收集成本过高时,其不确定性带来的损失远远大于成本较低带来的收益,此时T*降为零,即不进行绿色资源的获取.临界值的判定点为E=αPc-Ph,当E>0时,MEC服务器更倾向于获取成本较低的绿色资源;当E<0时,MEC服务器更倾向于获取更稳定的租赁资源;随着租赁资源成本Pc的增加,E=αPc-Ph进入临界值,此时MEC服务器转而倾向于获取租赁资源.说明在Pc更大的情况下,MEC服务器更倾向于获取成本更小的绿色资源,与理论分析一致.

图4

图4   Pc不同时最优能量收集时间T*与收集成本的关系

Fig.4   Optimal EH harvesting time T* as a function of Ph with different Pc


图5展示了归一化最优能量收集时间T*在给定无线环境随机因子α下随着能量收集成本Ph的变化情况.由图可见,最优能量收集时间T*随着无线环境不确定因子α减小而增加,并且随着α的增加,T*进入临界状态的时刻会推迟,这意味着当无线环境不确定性增加(即α减小)时,MEC会更趋向获取更稳定的租赁资源.当α=1时,即在最理想情况下,绿色资源几乎无损耗,同时资源收集成本小于租赁成本时,MEC服务器会全部选择稳定性相同但是成本更低的绿色资源.

图5

图5   α不同时最优能量收集时间T*与收集成本的关系

Fig.5   Optimal EH harvesting time T* as a function of Ph with different α


图6展示了归一化最优租赁资源获取量C*在低能量收集成本Ph下随无线环境随机因子α的变化.由图可见,随着α的变大,即绿色资源更稳定时,MEC服务器会逐步减少对租赁资源的需求,直至变为0,转而全部获取绿色资源.α越高,对租赁资源的需求越小,绿色资源的获取量越大.当α高于临界值时,MEC服务器转为全部获取绿色资源,不再获取租赁资源.因此,随着α的不断增加,三条线都收敛到0,也验证了2.3中最优租赁决策的阈值结构,即收集的绿色资源达到阈值时,不需要再获取租赁资源.此外,随着Pc的增加,最优租赁资源获取量C*呈下降趋势.通过对比不同的曲线可以看出,随着租赁资源获取成本的降低或绿色资源收集成本的提高,MEC服务器会选择获取更多的租赁资源.

图6

图6   低能量收集成本下最优租赁资源获取量与α的关系

Fig.6   Optimal lease resources C* as a function of α with low energy harvesting cost


图7展示了归一化最优租赁资源获取量C*在高能量收集成本Ph下随无线环境随机因子α的变化.由图可见,与图6展示的低能量收集成本相比,在高能量收集成本下,最优租赁资源量C*的获取策略更加两极分化,没有图6中呈斜线的过渡阶段,当无线环境随机因子α达到临界值时,MEC即会从全部获取租赁资源转换为获取绿色资源.与图6中很快进入临界值不同,当Ph增大时,进入临界值的无线环境随机因子更大,同时直接进入2.3的CS1保守供给状态.

图7

图7   高能量收集成本下最优租赁资源获取量与α的关系

Fig.7   Optimal lease resources C* as a function of α with high energy harvesting cost


最优定价策略π*与用户的聚集无线特性AB有关,绿色资源收集时间T*和最佳租赁资源获取量C*AB呈线性关系,因此,最佳资源获取总量与AB之间的关系也是线性的,每个用户的“平均”资源分配在均衡状态时是“恒定的”.这表示价格必须独立于用户数量而变化,否则分配给每个用户的资源会随着价格的变化而发生相应的变化.图8展示了低能量收集成本下,最优价格与α的关系.由图可见,第三阶段的最优定价策略π*在绿色资源获取过低时是不会增加的,因为在绿色资源利用率过低时,实际可供用户使用的资源数量较少,MEC服务器会转而使用租赁资源,使总资源量达到阈值ζ.在这种情况下,π*是一个与α无关的常数.随着绿色资源获取量的增加,随着α的增加,总资源获取量增加,同时最优价格降低,使效益最大化.因此,最优价格策略π*先为一个常数,在α大于一个阈值时开始下降.

图8

图8   低能量收集成本下最优价格与α的关系

Fig.8   Optimal price π* as a function of α with low energy harvesting cost


图9展示了高能量收集成本下,最优价格与α的关系.与图8对比可知,随着能量收集成本的减少或租赁资源获取成本的增加,MEC服务器的绿色资源获取量也会增大,导致阈值α的变化,降低最优资源定价π*的值.同时,当租赁资源获取成本更大时,最优资源定价π*也随之变大.

图9

图9   高能量收集成本下最优价格与α的关系

Fig.9   Optimal price π* as a function of α with high energy harvesting cost


3.2 绿色资源获取不确定性的仿真

图10展示了MEC服务器预期利润与能量收集成本的关系.由图可见,最优期望利润是Ph的函数,获取绿色资源可以得到更好的最优预期利润.实际上,当Ph<0.8时,绿色资源的获取与不获取带来的利润对比十分明显.而当能量收集成本变得过于昂贵时,MEC服务器会选择不进行绿色资源收集,以实现与基线情况相同的利润.因此,MEC服务器的最优预期利润总是受益于绿色资源的可用性.

图10

图10   MEC服务器预期利润与能量收集成本的关系

Fig.10   MEC server's expected profit as a function of energy harvesting cost Ph


图11展示了MEC服务器预期利润与α的关系.由图可见,在获取绿色资源的情况下,MEC服务器的实际利润都随着α的增大而增大,但在α达到一定阈值后,函数值开始大于基准值,并不断增加.临界点是保守供给情况下的临界值,在利用率过低时将不获取绿色资源,在α达到临界值后才进行绿色资源的收集.所以,MEC服务器在能量收集成本较低的情况下,可以通过获取绿色资源来提高收益.

图11

图11   MEC服务器预期利润与α的关系

Fig.11   MEC server's expected profit as a function of α


图12展示了用户i的归一化利润ui*α的关系.由图可见,在不获取绿色资源时,用户i的归一化利润ui*是一个固定的常数.在进行绿色资源收集时,若α大于一个阈值,用户收益随着α的增加而增加,同时,在绿色资源收集成本Ph较低时,可以得到更高的利润.临界点的出现是在CS1情况下,利用率过低不获取绿色资源,在达到临界值后再获取绿色资源.所以,获取绿色资源比不获取绿色资源能带给用户更多的利润,同时,在绿色资源获取成本Ph更低时,用户会更积极地进行绿色资源的收集.

图12

图12   归一化用户利润与α的关系

Fig.12   User's normalized profit as a function of α


4 结论

本文提出了MEC和EH技术相结合的具有随机能源收集的EH⁃MEC系统,研究并解决了MEC系统中资源供给不确定性下用户资源投资和服务器资源的定价问题.考虑到绿色资源的获取受随机因素的影响,本文旨在实现资源供给和获取成本之间的均衡,以最大化MEC服务器和用户的效益.利用Stackelberg博弈来模拟MEC服务器与用户之间的互动,并通过逆向归纳法获得纳什均衡解.理论分析和实验结果证明了博弈均衡结果的重要性,有助于在双方效益最大化的前提下提高决策效率,同时,MEC服务器的最优能量收集时间、最佳租赁资源量以及最佳定价策略都遵循了良好的阈值结构.绿色资源的收集总是会提升MEC服务器的预期效益,并且当绿色资源获取决策由MEC服务器执行时,用户的利润也会随着MEC服务器决策利润的增加而增加.

参考文献

张文丽郭兵沈艳.

智能移动终端计算迁移研究

计算机学报,201639(5):1021-1038.

[本文引用: 1]

Zhang W LGuo BShen Yet al.

Computation offloading on intelligent mobile terminal

Chinese Journal of Computers,201639(5):1021-1038.

[本文引用: 1]

Mao Y YYou C SZhang Jet al.

A survey on mobile edge computing:The communication perspective

IEEE Communications Surveys & Tutorials,201719(4):2322-2358.

[本文引用: 1]

李邱苹赵军辉贡毅.

移动边缘计算中的计算卸载和资源管理方案

电信科学,201935(3):36-46.

[本文引用: 1]

Li Q PZhao J HGong Y.

Computation offloading and resource management scheme in mobile edge computing

Telecommunications Science,201935(3):36-46.

[本文引用: 1]

李子姝谢人超孙礼.

移动边缘计算综述

电信科学,201834(1):87-101.

[本文引用: 1]

Li Z SXie R CSun Let al.

A survey of mobile edge computing

Telecommunications Science,201834(1):87-101.

[本文引用: 1]

郑远鹏张天魁朱光宇.

MEC系统中面向网络切片的3C联合资源分配算法

北京邮电大学学报,202144(5):41-47.

[本文引用: 1]

Zheng Y PZhang T KZhu G Yet al.

Network slicing⁃oriented joint allocation algorithm of 3C resources in MEC systems

Journal of Beijing University of Posts and Telecommunications,202144(5):41-47.

[本文引用: 1]

梁俊斌张海涵蒋婵.

移动边缘计算中基于深度强化学习的任务卸载研究进展

计算机科学,202148(7):316-323.

[本文引用: 1]

Liang J BZhang H HJiang Cet al.

Research progress of task offloading based on deep reinforcement learning in mobile edge computing

Computer Science,202148(7):316-323.

[本文引用: 1]

郭延超高岭王海.

移动边缘计算中基于内容动态刷新的能耗优化

计算机研究与发展,201855(3):563-571.

[本文引用: 1]

Guo Y CGao LWang Het al.

Power optimization based on dynamic content refresh in mobile edge computing

Journal of Computer Research and Development,201855(3):563-571.

[本文引用: 1]

李振江张幸林.

减少核心网拥塞的边缘计算资源分配和卸载决策

计算机科学,202148(3):281-288.

[本文引用: 1]

Li Z JZhang X L.

Resource allocation and offloading decision of edge computing for reducing core network congestion

Computer Science,202148(3):281-288.

[本文引用: 1]

Wang FXing HXu J.

Real⁃time resource allocation for wireless powered multiuser mobile edge computing with energy and task causality

IEEE Transactions on Communications,202068(11):7140-7155.

[本文引用: 1]

Zhao M XYu J JLi W Tet al.

Energy⁃aware task offloading and resource allocation for time⁃sensitive services in mobile edge computing systems

IEEE Transactions on Vehicular Technology,202170(10):10925-10940.

[本文引用: 1]

Zhang G LZhang SZhang W Qet al.

Joint service caching,computation offloading and resource allocation in mobile edge computing systems

IEEE Transactions on Wireless Communications,202120(8):5288-5300.

[本文引用: 1]

Wang Q YGuo S TLiu J Det al.

Profit maximization incentive mechanism for resource providers in mobile edge computing

IEEE Transactions on Services Computing,202215(1):138-149.

[本文引用: 1]

吴雨芯蔡婷张大斌.

移动边缘计算中基于Stackelberg博弈的算力交易与定价

计算机应用,202040(9):2683-2690.

[本文引用: 1]

Wu Y XCai TZhang D B.

Computing power trading and pricing in mobile edge computing based on Stackelberg game

Journal of Computer Applications,202040(9):2683-2690.

[本文引用: 1]

Liu M YLiu Y.

Price⁃based distributed offloading for mobile⁃edge computing with computation capacity constraints

IEEE Wireless Communications Letters,20187(3):420-423.

[本文引用: 1]

Jie Y MTang X YChoo K K Ret al.

Online task scheduling for edge computing based on repeated Stackelberg game

Journal of Parallel and Distributed Computing,2018122159-172.

[本文引用: 1]

林艳闫帅张一晋.

基于交通流量预测的车联网双边拍卖边缘计算迁移方案

通信学报,202041(12):205-214.

[本文引用: 1]

Lin YYan SZhang Y Jet al.

Flow⁃of⁃traffic prediction program based mobile edge computing for Internet of vehicles using double auction

Journal on Communications,202041(12):205-214.

[本文引用: 1]

张海波栾秋季朱江.

基于移动边缘计算的V2X任务卸载方案

电子与信息学报,201840(11):2736-2743.

[本文引用: 1]

Zhang H BLuan Q JZhu Jet al.

V2X task offloading scheme based on mobile edge computing

Journal of Electronics & Information Technology,201840(11):2736-2743.

[本文引用: 1]

Huang X WGong S MYang J Met al.

Hybrid market⁃based resources allocation in mobile edge computing systems under stochastic information

Future Generation Computer Systems,202212780-91.

[本文引用: 1]

Ding N NFang Z XDuan L Jet al.

Optimal incentive and load design for distributed coded machine learning

IEEE Journal on Selected Areas in Communications,202139(7):2090-2104.

[本文引用: 1]

Ren J KHe Y HHuang Get al.

An edge⁃computing based architecture for mobile augmented reality

IEEE Network,201933(4):162-169.

[本文引用: 1]

Wang LJiao LHe Tet al.

Service entity placement for social virtual reality applications in edge computing

2018 IEEE Conference on Computer Communications. Honolulu,HI,USAIEEE2018468-476.

[本文引用: 1]

Ma DLan G HHassan Met al.

Sensing,computing,and communications for energy harvesting IoTs:A survey

IEEE Communications Surveys & Tutorials,202022(2):1222-1250.

[本文引用: 1]

Panatik K ZKamardin KShariff S Aet al.

Energy harvesting in wireless sensor networks:A survey

2016 IEEE 3rd International Symposium on Telecommunication Technologies. Kuala Lumpur,MalaysiaIEEE201653-58.

[本文引用: 1]

Wang HJasim A FChen X D.

Energy harvesting technologies in roadway and bridge for different applications:A comprehensive review

Applied Energy,20182121083-1094.

[本文引用: 1]

Min M HXiao LChen Yet al.

Learning⁃based computation offloading for IoT devices with energy harvesting

IEEE Transactions on Vehicular Technology,201968(2):1930-1941.

[本文引用: 1]

Huang LBi S ZZhang Y J A.

Deep reinforcement learning for online computation offloading in wireless powered mobile⁃edge computing networks

IEEE Transactions on Mobile Computing,202019(11):2581-2593.

[本文引用: 1]

Chen X FZhang H GWu Cet al.

Performance optimization in mobile⁃edge computing via deep reinforcement learning

2018 IEEE 88th Vehicular Technology Conference. Chicago,IL,USAIEEE20181-6.

[本文引用: 1]

马惠荣陈旭周知.

绿色能源驱动的移动边缘计算动态任务卸载

计算机研究与发展,202057(9):1823-1838.

[本文引用: 1]

Ma H RChen XZhou Zet al.

Dynamic task offloading for mobile edge computing with green energy

Journal of Computer Research and Development,202057(9):1823-1838.

[本文引用: 1]

Ku M LLi WChen Yet al.

Advances in energy harvesting communications:Past,present,and future challenges

IEEE Communications Surveys & Tutorials,201618(2):1384-1412.

[本文引用: 1]

Su C XYe FLiu T Tet al.

Computation offloading in hierarchical multi⁃access edge computing based on contract theory and Bayesian matching game

IEEE Transactions on Vehicular Technology,202069(11):13686-13701.

[本文引用: 1]

/