南京大学学报(自然科学), 2023, 59(5): 777-789 doi: 10.13232/j.cnki.jnju.2023.05.006

融入用户风险偏好的三支协同过滤推荐模型

黄树添1, 胡诗琳1, 卜祥智1, 李华雄2, 刘久兵,1

1.汕头大学商学院,汕头,515063

2.南京大学工程管理学院,南京,210023

Three⁃way collaborative filtering recommendation model integrating user risk preferences

Huang Shutian1, Hu Shilin1, Bu Xiangzhi1, Li Huaxiong2, Liu Jiubing,1

1.School of Business, Shantou University, Shantou, 515063, China

2.School of Management and Engineering, Nanjing University, Nanjing, 210023, China

通讯作者: E⁃mail:jiubingliu@163.com

收稿日期: 2023-06-19  

基金资助: 国家自然科学基金.  62106135.  62176116
广东省自然科学基金.  2023A1515011390.  2022A1515011571.  2023A1515011029
广东省基础与应用基础研究青年项目.  2020A1515110434
广东省哲学社会科学“十三五”规划青年项目.  GD20YGL13
广东烟草汕头市有限责任公司项目.  2023440500260003

Received: 2023-06-19  

摘要

基于用户的不同风险偏好特征,提出一种融入用户风险偏好的三支协同过滤推荐模型来提高推荐规则的准确性.首先,考虑用户的不同风险偏好对项目评分的影响,基于用户⁃项目评分矩阵定义用户关于项目的偏好概率测度,建立用户⁃项目偏好概率模型,从理论上证明了该模型是现有模型的推广和拓展.其次,利用决策粗糙集,推导出用户在不同风险偏好下的三支推荐模型阈值表达.然后,以上述工作为基础,将推荐准确性和推荐成本作为优化目标,设计基于粒子群优化算法的用户偏好概率模型参数确定方法.最后,在MovieLens数据集上的实验验证了提出模型的有效性.

关键词: 协同过滤 ; 风险偏好 ; 三支推荐 ; 偏好概率模型

Abstract

Based on the characteristics of different risk preferences of users,a three⁃way collaborative filtering recommendation model integrating user risk preferences is proposed to improve the accuracy of recommendation rules. First,considering the impact of different risk preferences of users on item ratings,a user's preference probability measure for items is defined based on the user⁃item rating matrix,and a user⁃item preference probability model is established,which is theoretically proved to be a generalization and extension of the existing model. Second,by using decision⁃theoretic rough set,mathematical expressions for the threshold of three⁃way recommendation under different risk preferences of users are deduced. Moreover,based on the aforementioned work,taken recommendation accuracy and recommendation cost as optimization objectives,a method for determining parameters of the user's preference probability model is designed based on particle swarm optimization algorithm. Finally,experiments on the MovieLens dataset verify the effectiveness of the proposed model.

Keywords: collaborative filtering ; risk preference ; three⁃way recommendation ; preference probability model

PDF (886KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

黄树添, 胡诗琳, 卜祥智, 李华雄, 刘久兵. 融入用户风险偏好的三支协同过滤推荐模型. 南京大学学报(自然科学)[J], 2023, 59(5): 777-789 doi:10.13232/j.cnki.jnju.2023.05.006

Huang Shutian, Hu Shilin, Bu Xiangzhi, Li Huaxiong, Liu Jiubing. Three⁃way collaborative filtering recommendation model integrating user risk preferences. Journal of nanjing University[J], 2023, 59(5): 777-789 doi:10.13232/j.cnki.jnju.2023.05.006

互联网时代数据爆炸,信息过载,庞大的信息体量在给用户带来巨大内容冲击的同时也消弭了用户的注意力与判断力,因此,过滤无用信息并筛选出用户感兴趣的内容成为一个重要的研究课题.推荐系统因其有效的过滤机制为该类问题提供了新的解决范式,它通过挖掘用户的行为与偏好来捕捉用户感兴趣但未曾留意的商品信息.在推荐系统研究领域,协同过滤是应用最广泛的算法之一1-2,它利用用户对项目的历史评分数据来预测用户对未评分项目的喜好程度,并根据预测评分对用户进行推荐.

传统的推荐系统通常选择推荐或不推荐,但若信息不充分或获取信息代价较高,直接推荐或不推荐可能会带来较大的推荐成本.因此,Zhang et al3-4首次将三支决策引入推荐系统,在传统的推荐或不推荐的基础上,引入第三种策略——延迟推荐,提出三支推荐的概念.

作为三支推荐的理论基础,三支决策(Three⁃Way Decision)是一种符合人类认知习惯的决策理论,自提出以来便获得学者的广泛关注5-11,已在多个领域得到应用,如医疗诊断12、投资管理13、人脸识别14和机器学习15等.在推荐系统领域,叶晓庆等16在三支推荐的基础上,利用粒计算来弥补传统协同过滤算法评分信息单一的缺陷.Ma et al17提出一种结合全局和局部信息的三支推荐方法,在预测评分时考虑了全局和局部的信息.Liu and Ye18将三支决策与矩阵分解相结合,提出多粒度信息下的动态三支推荐算法,根据不同粒度来动态地调整推荐列表.秦琴和张恒汝19提出一种基于信任传递机制的三支推荐模型,将信任约束引入矩阵分解,可以更好地预测评分.Ye and Liu20提出一种基于协同主题回归的可解释性序贯三支推荐策略,实现可解释的多层次推荐.Zhang et al21提出三支朴素贝叶斯协同过滤推荐模型,结合朴素贝叶斯与协同过滤算法来处理用户评分信息的稀疏性.Ye and Liu22提出一种基于成本敏感、时空特征和多粒度决策的三支推荐方法.Ye et al23基于协同深度学习,提出一种多粒度序贯三支推荐方法.

通常,在三支推荐过程中,需要考虑推荐规则的划分阈值与用户对项目的偏好概率,二者均会对推荐结果产生影响,而现有文献较少对后者进行深入研究.在计算偏好概率时,一般的做法是在本质上将用户的风险态度考虑为风险中立型,然而,不同用户的风险态度可能是多样的24,将所有用户的风险态度都划分为同一种会导致偏好概率测度失真,降低推荐质量.

因此,本文在已有研究的基础上,提出一种融入用户风险偏好的三支协同过滤推荐模型.首先,基于用户已有的评分信息,利用协同过滤算法预测用户对未评分项目的评分.其次,考虑用户的不同风险态度,结合效用理论,定义用户对项目的偏好概率测度,构建用户⁃项目偏好概率模型,并通过理论证明了该模型是现有模型的推广.随后,利用偏好概率模型与决策粗糙集,导出三支推荐模型的阈值表达,进而设计基于粒子群优化算法的用户偏好概率模型参数确定方法.最后,利用MovieLens数据集中用户对电影的评分数据对模型进行验证.本文从用户的风险态度的视角出发,提供了一个新的具有可拓展性的测度用户偏好概率的方法,使三支推荐的决策规则划分更加准确,进一步提高了推荐质量.

1 预备知识

1.1 经典协同过滤算法

协同过滤算法是目前应用最广泛的推荐算法之一,主要包括基于用户的协同过滤25和基于项目的协同过滤26,后者的性能和推荐质量在很多情形下优于前者26.因此,本文主要讨论基于项目的协同过滤.对于目标用户u和候选项目i,首先计算用户u已评分的项目与项目i之间的相似度,选出与项目i最相似的k个近邻项目,利用近邻项目的信息预测用户u对项目i的可能评分.主要步骤如下.

步骤1.计算项目之间的相似性.

表1为用户⁃项目评分矩阵,其中U=u1,u2,

表1   用户⁃项目评分矩阵

Table 1  User⁃Item rating matrix

用户项目
i1i2in
u1R11R12R1n
u2R21R22R2n
umRm1Rm2Rmn

新窗口打开| 下载CSV


,um表示用户集合,I=i1,i2,,in表示项目集合,R=U×I表示用户u对项目i的评分Rui构成的集合.根据该评分矩阵可以计算项目之间的Pearson相关系数,其取值范围为-1,1.该系数越接近1说明两个项目越相似,越接近0说明两个项目之间的差异性越大.具体计算如下:

simi,j=uKRui-R¯iRuj-R¯juKRui-R¯i2uKRuj-R¯j2

其中,simi,j表示项目ij之间的Pearson系数,用来测度ij之间的相似程度;K表示同时评价项目ij的用户集合;Rui表示用户u对项目i的评分;R¯i表示项目i已有评分的平均数.

步骤2.预测用户对目标项目的评分.

选择用户u已评分项目中与目标项目i最相似的k个项目,根据这k个近邻项目与项目i之间的Pearson系数以及相关评分数据,预测用户u对未知评分项目i的评分Rui*.具体计算如下:

Rui*=R¯i+j=1ksimi,jRuj-R¯jj=1ksimi,j

其中,simi,j表示目标项目i与近邻项目j之间的相似度,Ruj表示用户u对项目j的真实评分,R¯iR¯j分别表示项目ij已知评分的平均数.

1.2 三支决策

传统协同过滤推荐是一种二支推荐,只有推荐与不推荐两种状态.然而,当信息不充分或获取信息代价较高时,很难即时作出推荐或不推荐的判定,若此时强行将项目推荐给用户,可能会产生较大的误推荐成本.基于此,本文参考三支决策的延迟策略,将传统的二支决策推荐拓展为三支决策推荐,减少在信息不充分的时候因错误决策造成的严重损失.

三支决策来源于决策粗糙集理论27-28,它为决策粗糙集正域、负域、边界域给出了一种合理的语义解释.不同的域对应不同的决策规则,正域对应接受规则,负域对应拒绝规则,边界域对应不承诺或延迟决策规则.若在信息不充分的情况下仍然只考虑接受或拒绝两种选择,类似接受或拒绝一个假设,就可能会作出弃真或择假的错误决策.换言之,此时贸然作出接受或拒绝的判定,将产生错误接受或错误拒绝的成本,这两种决策成本可能高于不作任何判定的成本.在这种情形下,边界域提供的延迟决策选项能更好地体现定量决策的容错性.

根据三支决策理论1029Ω=T,¬T表示对象属于T和不属于T的状态集合,Λ=aP,aB,aN表示对于以上两种状态,分别采取接受决策、延迟决策或拒绝决策三种行动.在不同状态下采取三种行动的损失各不相同,表2给出了其决策代价损失.当对象处于状态T时,采取行动aPaBaN分别产生代价损失λPPλBPλNP;当对象处于状态¬T时,采取行动aPaBaN分别产生代价损失λPNλBNλNN10.

表2   代价损失矩阵

Table 2  Cost loss matrix

行动状态
TP¬TN
aPλPPλPN
aBλBPλBN
aNλNPλNN

新窗口打开| 下载CSV


对于对象x,采取aPaBaN三种行动产生的期望损失分别为:

RaPx=λPPPrTx+λPNPr¬Tx
RaBx=λBPPrTx+λBNPr¬Tx
RaNx=λNPPrTx+λNNPr¬Tx

已知PrTx+Pr¬Tx=1,由贝叶斯最小风险决策理论可知决策规则如下:

(P)若RaPxRaBxRaPxRaNx,则xPOST

(B)若RaBxRaPxRaBxRaNx,则xBNDT

(N)若RaNxRaPxRaNxRaBx,则xNEGT.

根据文献[1029-31],规则(P)⁃(N)为三支决策,三个规则对应的域分别为正域、边界域和负域.考虑一种合理情形,即满足λPPλBP<λNPλNNλBN<λPN,假设边界域存在,则需满足λBP-λPPλBN-λNN<λPN-λBNλNP-λBP.此时,上述(P)⁃(N)规则可简化为(P1)⁃(N1).

(P1)若PrTxα,则xPOST;

(B1)若β<PrTx<α,则xBNDT

(N1)若PrTxβ,则xNEGT

其中,

α=λPN-λBNλPN-λBN+λBP-λPP
β=λBN-λNNλBN-λNN+λNP-λBP

从(P1)⁃(N1)可知,比较条件概率与阈值αβ的大小可以确定每个对象x的决策行动.

2 融入用户风险偏好的三支协同过滤推荐

三支协同过滤推荐在传统协同过滤仅有推荐和不推荐两种策略的基础上,增加了第三种策略——延迟推荐,这有利于降低推荐成本.在三支协同过滤推荐中需要确定用户关于项目的偏好概率,该概率可以利用用户对项目的预测评分来进行测度16-23,但不同用户的评分标准各不相同.例如,有的用户倾向给项目打更高的分数,整体评分偏高;有的则倾向较低的分数,整体评分偏低.如果仅仅考虑预测评分,则用户评分标准的不同带来的评分偏差可能会降低偏好概率的准确度.文献[161821]采用最小最大值归一化方法来测度偏好概率,消除评分偏差,但值得注意的是,该方法假定所有用户的风险偏好均为风险中立型.事实上,用户对风险的态度可分为风险中立型、厌恶型和偏好型32,不同风险偏好的用户评分的偏差不尽相同,仅把用户当作中立型不足以消除评分偏差.因此,在构建三支协同过滤推荐模型时,需要考虑不同用户的风险偏好.为此,本文提出一种新模型,给定用户u与候选推荐项目i,构建用户⁃项目对u,i,利用协同过滤算法预测用户对项目的评分Rui*.根据预测评分,基于用户⁃项目偏好概率模型得到用户u对项目i的偏好概率Probui;根据决策成本矩阵得出推荐规则的阈值对αβ;最后,利用用户偏好概率与阈值生成三支推荐规则,如表3所示.首先,构建用户⁃项目偏好概率模型,继而根据决策粗糙集与偏好概率导出三支推荐阈值对αβ的数学表达,最后提出确定用户偏好概率模型具体参数的方法.

表3   三支推荐规则

Table 3  Rules of three⁃way recommendation

划分条件决策区域决策规则
ProbuiαPOSP推荐R
β<Probui<αBNDP延迟推荐B
ProbuiβNEGP不推荐N

新窗口打开| 下载CSV


2.1 用户⁃项目偏好概率模型构建

在微观经济学中,效用是指消费者从消费某种物品中得到的满足程度;在决策领域,效用是决策者对于决策后果或决策损益值的一种感受、反应或倾向,是决策者的价值观和偏好在决策活动中的综合反映28.用户在决定是否购买某种商品或服务时,既是消费者,也是决策者.作为决策者,用户的风险偏好会影响其对效用的估计,进而影响消费行为.风险中立型、厌恶型或偏好型2433的用户对应不同的效用函数,同一类型的用户由于具体偏好的差异,效用函数也不尽相同.

根据上述分析,用户对项目评分的高低反映项目对用户的效用大小及用户对项目的喜好程度.一般地,评分越高说明项目对于用户的效用越高,用户喜欢该项目的概率越大,但是,用户对项目的喜好程度不是影响用户对项目评分的唯一因素,用户自身的风险偏好同样会影响其对项目的评分.例如,同一效用水平下,和风险偏好型用户相比,风险厌恶型用户的评分会偏低,而风险中立型用户的评分介于二者之间,如图1所示.因此,考虑用户的不同风险偏好,基于表1,本文采用L⁃A拟合法2434来刻画不同风险偏好下用户关于项目的效用函数.具体地,假设:

UtilityuRui=qRui+dρ

其中,Rui表示用户u对项目i的评分,q为尺度参数,d为位置参数,ρ为用户u的风险偏好系数,UtilityuRui0,1.

图1

图1   L⁃A拟合法下的用户⁃项目效用函数

Fig.1   L⁃A simulation method for User⁃Item utility function


图1所示,当0<ρ<1时,用户u为风险厌恶型,其效用曲线是上凸的;当ρ=1时,用户u为风险中立型,其效用曲线是直线;当ρ>1时,用户u为风险偏好型,其效用曲线是上凹的.Ru1Ru0为用户u的效用阈值,即当用户u对项目的评分不小于Ru1时,用户认为该项目对其的效用为1;当用户u对项目的评分不大于Ru0时,用户认为该项目对其的效用为0;当用户u对项目的评分介于Ru0Ru1之间时,该项目对用户的效用可由式(3)表示.并且,设置推荐系统的评分范围为R̲,R¯,例如,淘宝平台的评分范围通常为1~5,则R̲Ru0<Ru1R¯.

预测评分是判断用户对候选推荐项目偏好程度的依据,通常预测评分越高,说明该项目对用户的效用越大,用户偏好该项目的概率越高.受文献[35]的启发,下面给出用户⁃项目效用偏好概率模型的定义.

定义

设在表1所示的评分系统中,用户对项目的评分范围为R̲,R¯Rui*为用户u关于项目i的预测评分,则用户u关于项目i的偏好概率Probui定义为:

Probui=1,Ru1Rui*R¯qRui*+dρ,Ru0<Rui*<Ru10,R̲Rui*Ru0

其中,Ru1Ru0为用户u的效用阈值,q为尺度参数,d为位置参数,ρ为用户u的风险偏好系数.

图2式(4)对应的图像.当0<ρ<1时,用户u为风险厌恶型,对于被推荐到不喜欢的项目的容忍度较低,偏好概率相同时其评分较低;当ρ>1时,用户u为风险偏好型,对于被推荐到不喜欢的项目的容忍度较高,相同的偏好概率下其评分较高;当ρ=1时,用户u为风险中立型,在偏好概率相同时,其评分介于上述两者之间.

图2

图2   用户⁃项目效用偏好概率模型

Fig.1   User⁃Item utility preference probability model


式(4)中的参数qdρ可用三个效用点确定,分别为Ru1,1,Ru0,0Rum,m,其中,Ru0<Rum<Ru10<m<1.则三个参数的解析式为:

ρ=-lnmlnRu1-Ru0-lnRum-Ru0d=-Ru0q=1Ru1-Ru0ρ

下面用具体的例子来说明前面的定义.

在某电影网站中,用户对电影的评分系统为五分制,最低分为1,最高分为5,评分步长为0.5.假设用户u1的三个效用点分别为1.5,02,0.55,1,用户u2的三个效用点分别为1,03,0.55,1,用户u3的三个效用点分别为1,0,3.5,0.54.5,1.基于式(4)和式(5),可以分别得到用户u1u2u3的偏好概率Probu1iProbu2iProbu3i.具体如下:

Probu1i=1,Ru1i*=50.64Ru1i*-1.50.356,1.5<Ru1i*<50,1Ru1i*1.5
Probu2i=1,Ru2i*=50.25Ru2i*-1,1<Ru2i*<50,Ru2i*=1
Probu3i=1,Ru3i*=50.076Ru3i*-12.06,1.5<Ru3i*<50,1Ru3i*1.5

用户u1的风险系数ρ1=0.356<1,风险厌恶型;用户u2的风险系数ρ2=1,风险中立型;用户u3的风险系数ρ3=2.06>1,风险偏好型.

根据定义,可得如下命题.

命题

RumaxRumin分别为用户u已知评分的最大和最小值,且令Ru1=RumaxRu0=Rumin.当用户u为风险中立型(即ρ=1)时,下式恒成立:

Probui=1,RumaxRui*R¯Rui*-RuminRumax-Rumin,Rumin<Rui*<Rumax0,R̲Rui*Rumin

证明

ρ=1,则Ru1=RumaxRu0=Rumin时,根据式(5),可以解得:

ρ=1d=-Ruminq=1Rumax-Rumin

ρdq代入式(4),即可得式(6).因此,命题成立.

从命题可知,式(6)是最小最大值归一化模型,换句话说,该模型是本文提出的用户⁃项目偏好概率模型的一种特例.因此,本文提出的模型是文献[161821]中最小最大值归一化模型的拓展,更具有一般性.

2.2 融入用户风险偏好的三支推荐阈值推导

表3所示,三支推荐中给定用户u和项目i,最优推荐结果取决于用户对项目的偏好概率以及阈值对αβ.利用构建的用户⁃项目偏好概率模型,可计算出用户关于项目的偏好概率.下面根据决策粗糙集推导出阈值对,获得三支推荐规则.

表4给出喜欢和不喜欢两种状态下采取三种推荐策略的成本,其中λRPλBPλNP分别表示当用户喜欢(P)某项目时,将该项目推荐(R)、延迟推荐(B)及不推荐(N)给用户时产生的成本;λRNλBNλNN分别表示用户不喜欢(N)时,将该项目推荐(R)、延迟推荐(B)及不推荐(N)给用户时产生的成本.其中,λRPλNN表示正确推荐的成本;λBPλBN表示延迟推荐产生的学习成本,即推荐系统暂时无法确定用户偏好,需要进一步学习相关信息时产生的成本;λNPλRN表示错误推荐的成本,其中,λNP表示系统拒绝给用户推荐其喜欢的项目时产生的成本,λRN表示系统将用户不喜欢的项目推荐给该用户时产生的成本.通常,延迟推荐的成本远小于错误推荐的成本,正确推荐的成本小于延迟推荐的成本,即表4的成本满足:

表4   三支推荐成本的矩阵

Table 4  The matrix of three⁃way recommendation cost

决策规则用户对项目的偏好
喜欢(P)不喜欢(N)
推荐(R)λRPλRN
延迟推荐(B)λBPλBN
不推荐(N)λNPλNN

新窗口打开| 下载CSV


λRPλBP<λNP,λNNλBN<λRN

基于用户对项目的偏好概率Probui,决策规则(详见表3)和成本矩阵(详见表4),三种推荐策略的成本为:

CR=λRPProbui+λRN1-Probui
CB=λBPProbui+λBN1-Probui
CN=λNPProbui+λNN1-Probui

其中,CRCBCN分别表示采取推荐、延迟推荐和不推荐策略时产生的决策成本.

根据贝叶斯决策理论10,可得如下规则:

(R)当CRCNCRCB时,则u,iPOSP;

(B)当CBCRCBCN时,则u,iBNDP;

(N)当CNCRCNCB时,则u,iNEGP.

基于式(7),三支推荐规则(R)⁃(N)可进一步简化为规则(R1)⁃(N1):

(R1)当ProbuiαProbuiγ时,u,iPOSP;

(B1)当ProbuiαProbuiβ时,u,iBNDP;

(N1)当ProbuiβProbui<γ时,u,iNEGP.

其中,

α=λRN-λBNλRN-λBN+λBP-λRPβ=λBN-λNNλBN-λNN+λNP-λBPγ=λRN-λNNλRN-λNN+λNP-λRP

假设:

λRN-λBNλNP-λBP>λBP-λRPλBN-λNN

则三支推荐规则(R1)⁃(N1)可简化为规则:

(R2)当Probuiα时,u,iPOSP

(B2)当β<Probui<αu,iBNDP

(N2)当Probuiβ时,u,iNEGP.

特别地,当

λRN-λBNλNP-λBPλBP-λRPλBN-λNN

时,三支协同过滤推荐算法退化为二支协同过滤推荐算法,此时三支推荐规则(R1)⁃(N1)简化为:

(R3)当Probuiγ时,u,iPOSP

(N3)当Probuiγ时,u,iNEGP.

下面,以2.1和2.2的工作为基础,提出确定用户⁃项目偏好概率模型参数的方法.

2.3 基于粒子群优化的偏好概率模型参数确定

基于表1,可利用式(4)构建用户的偏好概率模型,但特定评分下用户的偏好概率是未知的,难以使用拟合方法确定用户的偏好概率模型参数.对于用户⁃项目偏好概率模型,其测度越精确,三支推荐的准确性会越高,推荐成本也越低;反之,当推荐准确性越高、推荐成本越低时,偏好概率模型的测度越精确.因此,可以将这两个指标作为目标,从优化的角度出发,使用粒子群优化算法来确定用户偏好概率模型的参数,以最大化推荐准确性和最小化推荐成本,使用户⁃项目偏好概率模型的测度尽可能准确.

由定义可知,用户的偏好概率模型由三个参数qdρ决定.由式(5),令Rum=Ru0.5m=0.5,则三个参数的表达式为:

ρ=ln2lnRu1-Ru0-lnRu0.5-Ru0d=-Ru0q=1Ru1-Ru0ρ

式(8)所示,参数dρq可由Ru1,1,

Ru0,0Ru0.5,0.5这三个效用点对应的用户评分来确定.因此,确定用户的偏好概率的问题可以转化为确定用户对应的最优评分组合Ru1Ru0Ru0.5,使模型能够更好地预测用户对项目的偏好概率,优化三支推荐的准确性,降低推荐成本.

表5中,nRPunBPunNPu分别表示将用户u喜欢的项目推荐、延迟推荐和不推荐给该用户的项目数量;nRNunBNunNNu分别表示将用户u不喜欢的项目推荐、延迟推荐和不推荐给该用户的项目数量.则用户u的三支推荐准确性(Accuracyu)定义为36

Accuracyu=nRPu+nNNunRPu+nNPu+nRNu+nNNu

表5   三支推荐数量矩阵

Table 5  The matrix of three⁃way recommendation number

决策规则用户对项目的偏好
喜欢(P)不喜欢(N)
推荐(R)nRPunRNu
延迟推荐(B)nBPunBNu
不推荐(N)nNPunNNu

新窗口打开| 下载CSV


基于表4表5,用户u的推荐成本(TCu)可表达为:

TCu=λRPnRPu+λBPnBPu+λNPnNPu+λRNnRNu+λBNnBNu+λNNnNNu

在三支推荐中,推荐准确性越高,推荐成本通常越低.然而,在计算推荐准确性时(见式(9))没有考虑划分到延迟推荐域的项目,可能导致大量项目被划分到延迟推荐域,使延迟推荐的成本显著增加,产生准确性很高但推荐成本很大的问题,这是不符合优化目标的.因此,在进行粒子群优化时,需要综合考虑准确性和推荐成本两个目标,即准确性越大越好,推荐成本越小越好.本文使用线性加权法将二者合成一个单一的目标函数Goalu,优化目标为Goalu最小,具体如下:

Goalu=ω1TCu/TCumax-ω2Accuracyu

其中,TCumax表示对用户u进行推荐时可能产生的最大推荐成本,TCu/TCumax表示对TCu进行标准化,TCu/TCumaxAccuracyu均在0~1;ω1ω2分别表示推荐成本与推荐准确性的权重系数,满足ω1+ω2=1.

当用户u对应的Ru1Ru0Ru0.5给定时,可以计算用户u的偏好概率模型参数dρq,得到用户对应的偏好概率模型.利用该模型对训练集的项目进行预测,可得到目标函数值Goalu.Ru1Ru0Ru0.5变化时,Goalu也随着变化.下面采用粒子群算法来确定使目标函数Goalu最小的评分组合Ru1Ru0Ru0.5,进而得到用户u的偏好概率模型.

粒子群优化算法37(Particle Swarm Optimization,PSO)是一种基于群体智能的优化算法,它模拟了鸟群、鱼群等生物集体行为的过程,通过迭代搜索找到最优解,具有较强的全局搜索能力和较好的收敛性.在粒子群算法中,假设有N个粒子和D维空间,每个粒子i i=1,2,,N拥有一个位置向量Xi=xi1,xi2,,xiD和速度向量Vi=vi1,vi2,,viD.在每次迭代中,粒子i的个体最优位置为Pbi=Pbi1,Pbi2,,PbiD,整个粒子群的全局最优位置为Gb=Gb1,Gb2,,GbD.利用个体最优位置和全局最优位置,可以分别采用式(12)和式(13)更新粒子i的速度和位置:

vidt+1=ηtvidt+c1r1Pbidt-xidt+c2r2Gbdt-xidt                                              
xidt+1=xidt+vidt+1

其中,t表示第t次迭代;c1c2表示学习因子,通常设置为2;r1r2表示两个在0,1中随机产生的数;ηt为线性递减惯性权重,满足38

ηt=0.9-0.9-0.4tTmax

其中,Tmax表示最大迭代次数.

本文中D=3,将Ru0Ru0.5Ru1分别作为每个粒子i的位置向量,即令xi1=Ru0xi2=Ru0.5xi3=Ru1,以式(11)作为适应函数,通过粒子群算法搜寻最优评分组合Ru0Ru0.5Ru1,具体步骤如下.

算法 基于PSO的用户偏好概率模型最优评分组合确定算法

输入:

1.用户⁃项目评分信息,推荐系统的评分最小值R̲和最大值R¯

2.给定三支推荐成本矩阵;

3.初始化粒子群算法的参数,包括适应函数式(11)、学习因子c1c2、最大迭代次数Tmax、粒子维度D、粒子群总数N.

输出:用户的偏好概率模型最优评分组合Ru0Ru0.5Ru1.

1.begin

2.for i=1 to N do % 初始化粒子位置与速度

3.xi1=R̲

4.xi2=R̲+R¯/2

5. xi3=R¯

6. for d=1 to D do

7. vid=2×rand-1

8. end

9.end

10.基于粒子初始位置、式(8)与成本矩阵求得目标函数值Goalu

11.for i=1 to N do

12. Pbesti=Goalu % 初始化每个粒子的最优目标函数值

13. Pbid=Xi % 初始化每个粒子的最优位置

14.end

15.Gbest=Goalu % 初始化所有粒子的最优目标函数值

16.for d=1 to D do

17. Gbd=xi1 % 初始化所有粒子的最优位置

18.end

19.t=1 % 记录迭代次数

20.while tTmax do

21. ηt=0.9-0.9-0.4×t/Tmax

22. for i=1 to N do

23. for d=1 to D do

24. 用式(12)更新速度vidt+1

25. 当vidt+1>1vidt+1<-1时调整速度

26. 用式(13)更新位置xidt+1

27. 当xidt+1>R¯xidt+1<R̲时调整位置

28. end

29. 基于标准化后的粒子位置和式(8)确定用户此时的偏好概率模型参数,进而求出目标函数值Goalu

30. if Pbesti>Goalu then

31. Pbesti=Goalu

32. Pbi=Xit+1 % 更新粒子最优位置

33. end

34. if Gbest>Pbesti then

35. Gbest=Pbesti

36. Gb=Pbi % 更新所有粒子最优位置

37. end

38. end

39.end

40.输出Gb中的用户偏好概率模型最优评分组合Ru0Ru0.5Ru1

41.end

基于上述算法得到用户最优评分组合,利用式(8)可得到参数qdρ,进而得到用户的偏好概率模型.

3 实验分析

3.1 数据集

使用MovieLens⁃100k电影评分数据集(https:∥grouplens.org/datasets/movielens/latest)39进行实验,该数据集的评分在0.5~5,评分步长为0.5.将60%的数据随机划分为预测评分训练集,将20%的数据划分为用户偏好概率模型训练集,剩下20%的数据为测试集.同时,参考文献[40],清洗评分量过少且不具有意义的数据,所得数据集的基本信息如表6所示.

表6   MovieLens⁃100k数据集的描述

Table 6  The description of MovieLens⁃100k dataset

数据集用户数项目数评分数量稀疏度
MovieLens⁃100k59916507371392.54%

新窗口打开| 下载CSV


3.2 实验设置

对于提出的融入用户风险偏好的三支协同过滤推荐(P_CF),首先,基于协同过滤算法,利用预测评分训练集预测剩余40%的用户⁃项目集的评分.然后,基于前文算法与式(8),利用用户偏好概率模型训练集得出每个用户的偏好概率模型,其中,经调参后目标函数式(11)中的权重取ω1=0.1ω2=0.9,三支推荐成本矩阵取λRP=λNN=0λBP=λBN=0.25λRN=λNP=0.8.最后,对测试集进行三支推荐,将P_CF的推荐结果与基于最大最小值归一化模型161821的三支协同过滤推荐算法,即仅将用户视为风险中立型的算法(M_CF)的结果进行对比.

为了衡量推荐结果,需要判断用户对项目的真实偏好.对于五分制评分系统,遵循推荐系统研究的通常做法40-41,将用户的喜好阈值设置为3.5分.

选取推荐成本(TC)、准确性(Accuracy)、覆盖率(Generality)、精准度(Precision)、召回率(Recall)和得分(F)作为衡量指标1841-42.精准度、召回率和得分是传统二支推荐的常用指标,也适用于三支推荐;准确性和覆盖率更适合用来衡量三支推荐的质量,准确性指三支推荐将项目划分到推荐和不推荐域时正确划分的比例,覆盖率指划分到推荐和不推荐域的项目占所有待推荐项目的比例,覆盖率越高表示越多用户得到系统的推荐.通常,准确性和覆盖率之间存在权衡,即为了给更多的用户推荐项目,需要牺牲一部分准确性;反之,为了更准确地向用户推荐项目,需要牺牲一部分覆盖率36.上述指标的定义如下:

TC=λRPnRP+λBPnBP+λNPnNP+λRNnRN+λBNnBN+λNNnNN
Generality=nall-nBP-nBNnall
Accuracy=nRP+nNNnRP+nNP+nRN+nNN
Precision=nRPnRP+nRN
Recall=nRPnRP+nNP
F=2PrecisionRecallPrecision+Recall

其中,

nall=nRP+nBP+nNP+nRN+nBN+nNN

结合表5nRPnBPnNPnRNnBNnNN的表达式分别为:

nRP=uUnRPu        nBP=uUnBPu        nNP=uUnNPunRN=uUnRNu        nBN=uUnBNu        nNN=uUnNNu

其中,U表示所有用户的集合.

本文主要考虑错误推荐或错误不推荐产生的误分类成本和延迟推荐产生的学习成本.假设系统正确推荐时不产生推荐成本,即λRP=λNN=0,则式(15)可化简为:

TC=λBPnBP+λNPnNP+λRNnRN+λBNnBN

3.3 实验结果分析

表7列出了λNP=0.8时,P_CF与M_CF在不同的λRNλBPλBN成本条件下的推荐成本;表8列出了对应成本条件下两个算法的推荐覆盖率;表9表10分别列出了λRN=0.8时,两个算法在不同的λNPλBPλBN成本条件下的推荐成本和覆盖率.表中黑体字表示结果更优.综合对比四个表格,分析如下:

表7   固定λNP时推荐成本的比较

Table 7  Recommendation cost with fixed λNP

λRN,λNPλBR=λBN=0.35λBR=λBN=0.25λBR=λBN=0.15
M_CFP_CFM_CFP_CFM_CFP_CF
1.2,0.84582.44223.13526.93454.22234.32345.1
1.0,0.84504.54060.43471.73366.62208.82269.1
0.8,0.84353.93816.03417.13217.92164.22200.1
0.6,0.83306.03019.82111.62120.2
0.4,0.82753.32524.32048.81957.5

注:“—”表示三支决策退化成二支决策的情况

新窗口打开| 下载CSV


表8   固定λNP时推荐覆盖率的比较

Table 8  Recommendation generality with fixed λNP

λRN,λNPλBR=λBN=0.35λBR=λBN=0.25λBR=λBN=0.15
M_CFP_CFM_CFP_CFM_CFP_CF
1.2,0.80.4680.5700.2040.3330.0640.193
1.0,0.80.6140.6580.2900.3810.0890.214
0.8,0.80.8130.8070.4430.4750.1420.247
0.6,0.80.6910.6460.2650.318
0.4,0.80.9690.9490.5710.512

注:“—”表示三支决策退化成二支决策的情况

新窗口打开| 下载CSV


表9   固定λRN时推荐成本的比较

Table 9  Recommendation cost with fixed λRN

λRN,λNPλBR=λBN=0.35λBR=λBN=0.25λBR=λBN=0.15
M_CFP_CFM_CFP_CFM_CFP_CF
0.8,1.24603.74218.83456.03359.42177.22228.7
0.8,1.04541.74077.13446.23316.32171.72214.4
0.8,0.84353.93816.03417.13217.92164.22200.1
0.8,0.63286.93025.62153.12158.9
0.8,0.42644.22491.02095.92040.1

注:“—”表示三支决策退化成二支决策的情况

新窗口打开| 下载CSV


表10   固定λRN时推荐覆盖率的比较

Table 10  Recommendation generality with fixed λRN

λRN,λNPλBR=λBN=0.35λBR=λBN=0.25λBR=λBN=0.15
M_CFP_CFM_CFP_CFM_CFP_CF
0.8,1.20.7290.6670.4210.4190.1360.233
0.8,1.00.7520.7120.4260.4370.1380.238
0.8,0.80.8130.8070.4430.4750.1420.247
0.8,0.60.5020.5720.1500.272
0.8,0.40.8470.9000.1980.362

注:“—”表示三支决策退化成二支决策的情况

新窗口打开| 下载CSV


(1)由表7表9可知,学习成本或误分类成本越低,两个算法的推荐成本均越低;由表8表10可知,学习成本越低或误分类成本越高,两个算法的覆盖率水平越低,即能获得推荐的用户越少.

(2)当学习成本较高或误分类成本较低时,P_CF的推荐成本低于M_CF,即使P_CF的覆盖率更高时也是如此.

(3)当学习成本较低且误分类成本较高时,M_CF的推荐成本总体占优,但优势不明显.结合表7~10可以看出,当M_CF的推荐成本占优时,其对应的覆盖率均明显低于P_CF.以成本为λBR=λBN=0.15λRN=1λNP=0.8时为例,M_CF的推荐成本比P_CF低2.7%,但其覆盖率比P_CF低12.5%.所以,M_CF的优势可能是因为它将大量的项目划分到延迟推荐域,延迟推荐的成本较低时其推荐成本也较低,延迟推荐成本较高时,这个优势就不明显,甚至消失.例如,当成本为λBR=λBN=0.25λRN=1.2λNP=0.8时,P_CF的覆盖率比M_CF高12.9%,而其对应成本也低于M_CF.

因此,本文提出的融入用户风险偏好的算法在学习成本较高或误分类成本较低时,在保证覆盖率的前提下能使系统的推荐成本更低,在学习成本较低且误分类成本较高时,能大幅提高覆盖率,但会小幅牺牲成本.

进一步,选取一组有代表性的成本条件来对比两个算法的推荐质量.设置λNP=0.8λBP=λBN=0.25,图3~8给出了两个算法在不同的错误推荐成本(λRN)下各指标的对比.分析如下:

图3

图3   λNP=0.8λBP=λBN=0.5时推荐成本的比较

Fig.3   Recomendation cost with λNP=0.8 and λBP=λBN=0.5


图4

图4   λNP=0.8λBP=λBN=0.5时推荐准确性的比较

Fig.4   Recommendation accuracy with λNP=0.8 and λBP=λBN=0.5


图5

图5   λNP=0.8λBP=λBN=0.5时推荐覆盖率的比较

Fig.5   Recommendation generality with λNP=0.8 and λBP=λBN=0.5


图6

图6   λNP=0.8λBP=λBN=0.5时推荐精确度的比较

Fig.6   Recommendation precision with λNP=0.8 and λBP=λBN=0.5


图7

图7   λNP=0.8λBP=λBN=0.5时推荐召回率的比较

Fig.7   Recommendation recall with λNP=0.8 and λBP=λBN=0.5


图8

图8   λNP=0.8λBP=λBN=0.5时推荐得分的比较

Fig.8   Recommendation F⁃measure with λNP=0.8 and λBP=λBN=0.5


(1)随着错误推荐成本的增加,两个算法的推荐成本、准确性、精准度和得分均变大,推荐覆盖率和召回率变小,其中,召回率的变化幅度较小,始终保持在较高的水平.

(2)当λRN不大于0.8时,M_CF的推荐覆盖率大于P_CF,但除召回率之外,M_CF的其他指标均逊色于P_CF.当M_CF的覆盖率占优时,一般意味着它的推荐成本、准确性和精准度处于更大的劣势.例如,λRN=0.6时,M_CF的覆盖率比P_CF高4.5%,但其成本、准确性和精准度分别比P_CF低8.7%,6.0%和4.7%.

(3)当λRN不小于0.8时,M_CF的推荐覆盖率小于P_CF,且二者的差距随着λRN的增大而越来越大.与M_CF的覆盖率占优时不同,λRN<1时,P_CF的准确性仍然高于M_CFλRN>1时,P_CF的覆盖率比M_CF高10%左右,其准确性只比M_CF低不到2%,精准度低不到4%.

因此,与仅将用户考虑为风险中立型的算法相比,当错误推荐的成本较低时,融入用户风险偏好的算法能在牺牲小部分覆盖率的同时,较大幅度地提高推荐准确性与精准度;当错误推荐的成本较高时,本文提出的算法能在牺牲小部分甚至不牺牲准确性与精准度的同时,较大幅度地提高推荐覆盖率.

综上,本文提出的融入用户风险偏好的三支协同过滤推荐模型更适用于对推荐成本、推荐覆盖率、推荐准确性和推荐精准度综合考虑的场景.

4 结论

为了优化三支推荐规则的准确性,本文提出融入用户风险偏好的三支协同过滤推荐模型,构建了一个能够预测用户对项目的偏好概率的模型,并基于粒子群算法给出了确定用户偏好概率模型的算法.实验结果表明,本文提出的方法在不同的初始条件下能够保持推荐成本、推荐覆盖率、准确性与精准度的相对优势.未来会将本文提出的用户⁃项目偏好概率模型与更多的三支推荐算法相结合,进一步验证该模型的可拓展性.

参考文献

Aggarwal C C. Recommender systems:The textbook. ChamSpringer International Publishing2016498.

[本文引用: 1]

Patel KPatel H B.

A state⁃of⁃the⁃art survey on recommendation system and prospective extensions

Computers and Electronics in Agriculture,2020(178):105779.

[本文引用: 1]

Zhang H RMin F.

Three⁃way recommender systems based on random forests

Knowledge⁃Based Systems,2016(91):275-286.

[本文引用: 1]

Zhang H RMin FShi B.

Regression⁃based three⁃way recommendation

Information Sciences,2017(378):444-461.

[本文引用: 1]

Liu DLiang D CWang C C.

A novel three⁃way decision model based on incomplete information system

Knowledge⁃Based Systems,2016(91):32-45.

[本文引用: 1]

Yao Y Y.

Three⁃way decisions and cognitive computing

Cognitive Computation,20168(4):543-554.

Liu J BLi H XZhou X Zet al.

An optimization⁃based formulation for three⁃way decisions

Information Sciences,2019(495):185-214.

Xu J FZhang Y JMiao D Q.

Three⁃way confusion matrix for classification:A measure driven view

Information Sciences,2020(507):772-794.

Liu J BHuang BLi H Xet al.

Optimization⁃based three⁃way decisions with interval⁃valued intuitionistic fuzzy information

IEEE Transactions on Cybernetics,202353(6):3829-3843.

Yao Y Y.

Three⁃way decisions with probabilistic rough sets

Information Sciences,2010180(3):341-353.

[本文引用: 4]

Liu J BHu S LLi H Xet al.

Achieving threshold consistency in three⁃way group decision using optimi⁃zation methodology and expert⁃weight⁃updating⁃strategy

International Journal of Approximate Reasoning,2023(158):108922.

[本文引用: 1]

Yao J TAzam N.

Web⁃based medical decision support systems for three⁃way medical decision making with game⁃theoretic rough sets

IEEE Transactions on Fuzzy Systems,201523(1):3-5.

[本文引用: 1]

Liu DLi T RLiang D C.

Three⁃way government decision analysis with decision⁃theoretic rough sets

International Journal of Uncertainty,Fuzziness and Knowledge⁃Based Systems,201220(S1):119-132.

[本文引用: 1]

Li H XZhang L BHuang Bet al.

Sequential three⁃way decision and granulation for cost⁃sensitive face recognition

Knowledge⁃Based Systems,2016(91):241-251.

[本文引用: 1]

Campagner ACiucci DSvensson C Met al.

Ground truthing from multi⁃rater labeling with three⁃way decision and possibility theory

Information Sciences,2021(545):771-790.

[本文引用: 1]

叶晓庆刘盾梁德翠.

基于协同过滤的三支粒推荐算法研究

计算机科学,201845(1):90-96.

[本文引用: 5]

Ye X QLiu DLiang D C.

Three⁃way granular recommendation algorithm based on collaborative filtering

Computer Science,201845(1):90-96.

[本文引用: 5]

Ma Y YZhang H RXu Y Yet al.

Three⁃way recommendation integrating global and local information

The Journal of Engineering,2018(16):1397-1401.

[本文引用: 1]

Liu DYe X Q.

A matrix factorization based dynamic granularity recommendation with three⁃way decisions

Knowledge⁃Based Systems,2020(191):105243.

[本文引用: 5]

秦琴张恒汝.

基于信任传递机制的三支推荐

模式识别与人工智能,202033(7):600-609.

[本文引用: 1]

Qin QZhang H R.

Three⁃way recommendation based on trust transfer mechanism

Pattern Recognition and Artificial Intelligence,202033(7):600-609.

[本文引用: 1]

Ye X QLiu D.

An interpretable sequential three⁃way recommendation based on collaborative topic regression

Expert Systems with Applications,2021(168):114454.

[本文引用: 1]

Zhang C YDuan X MLiu F Cet al.

Three⁃way Naive Bayesian collaborative filtering recommen⁃dation model for smart city

Sustainable Cities and Society,2022(76):103373.

[本文引用: 4]

Ye X QLiu D.

A cost⁃sensitive temporal⁃spatial three⁃way recommendation with multi⁃granularity decision

Information Sciences,2022(589):670-689.

[本文引用: 1]

Ye X QLiu DLi T R.

Multi⁃granularity sequential three⁃way recommendation based on collaborative deep learning

International Journal of Approximate Reasoning,2023(152):434-455.

[本文引用: 2]

Zhang Q HXie QWang G Y.

A novel three⁃way decision model with decision⁃theoretic rough sets using utility theory

Knowledge⁃Based Systems,2018(159):321-335.

[本文引用: 3]

Sarwar BKarypis GKonstan Jet al.

Analysis of recommendation algorithms for E⁃commerce

Proceedings of the 2nd ACM Conference on Electronic Commerce. Minneapolis,MN,USAAssociation for Computing Machinery2000158-167.

[本文引用: 1]

Sarwar BKarypis GKonstan Jet al.

Item⁃based collaborative filtering recommendation algorithms

Proceedings of the 10th International Conference on World Wide Web. Hong Kong,ChinaAssociation for Computing Machinery2001285-295.

[本文引用: 2]

于洪王国胤姚一豫.

决策粗糙集理论研究现状与展望

计算机学报,201538(8):1628-1639.

[本文引用: 1]

Yu HWang G YYao Y Y.

Current research and future perspectives on decision⁃theoretic rough sets

Chinese Journal of Computers,201538(8):1628-1639.

[本文引用: 1]

王国胤姚一豫于洪.

粗糙集理论与应用研究综述

计算机学报,200932(7):1229-1246.

[本文引用: 2]

Wang G YYao Y YYu H.

A survey on rough set theory and applications

Chinese Journal of Computers,200932(7):1229-1246.

[本文引用: 2]

Yao Y Y.

Decision⁃theoretic rough set models

Proceedings of the 2nd International Conference on Rough Sets and Knowledge Technology. Springer Berlin Heidelberg20071-12.

[本文引用: 2]

Li H XZhou X Z.

Risk decision making based on decision⁃theoretic rough set:A three⁃way view decision model

International Journal of Compu⁃tational Intelligence Systems,20114(1):1-11.

刘久兵顾萍萍周献中.

基于优化模型的直觉模糊三支群决策方法

南京大学学报(自然科学),201854(5):944-957.

[本文引用: 1]

Liu J BGu P PZhou X Zet al.

A method for intuitionistic fuzzy three⁃way group decisions based on optimization models

Journal of Nanjing University (Natural Science),201854(5):944-957.

[本文引用: 1]

李华胡奇英. 预测与决策教程. 北京机械工业出版社2012349.

[本文引用: 1]

冯文权傅征. 经济预测与决策技术.第6版. 武汉武汉大学出版社2018405.

[本文引用: 1]

袁捷敏.

决策效用函数两类拟合方法比较

统计与决策,2006(2):49-50.

[本文引用: 1]

Yuan J M.

Comparison of two kinds of fitting methods for decision utility function

Statistics & Decision,2006(2):49-50.

[本文引用: 1]

陈秀琼黄福才.

旅行效用概率模型与旅游业滞区发展策略研究

浙江大学学报(理学版),200734(6):702-708715.

[本文引用: 1]

Chen X QHuang F C.

Research on the probabilistic travel utility model and the strategy of developing tourism in stagnation area

Journal of Zhejiang University (Science Edition),200734(6):702-708715.

[本文引用: 1]

Azam NYao J T.

Game⁃theoretic rough sets for recommender systems

Knowledge⁃Based Systems,2014(72):96-107.

[本文引用: 2]

Shami T MEl⁃Saleh A AAlswaitti Met al.

Particle swarm optimization:A comprehensive survey

IEEE Access,2022(10):10031-10061.

[本文引用: 1]

Shi YEberhart R C.

Empirical study of particle swarm optimization

Proceedings of 1999 Congress on Evolutionary Computation⁃CEC99. Washington D C,USAIEEE19991945-1950.

[本文引用: 1]

Harper F MKonstan J A.

The movielens datasets:History and context

ACM Transactions on Inter⁃active Intelligent Systems,20165(4):19.

[本文引用: 1]

Adomavicius GKwon Y O.

Improving aggregate recommendation diversity using ranking⁃based techniques

IEEE Transactions on Knowledge and Data Engineering,201224(5):896-911.

[本文引用: 2]

Herlocker J LKonstan J ATerveen L Get al.

Evaluating collaborative filtering recommender systems

ACM Transactions on Information Systems,200422(1):5-53.

[本文引用: 2]

Wu C YZhang Q HZhao Fet al.

Three⁃way recommendation model based on shadowed set with uncertainty invariance

International Journal of Approximate Reasoning,2021(135):53-70.

[本文引用: 1]

/