融入用户风险偏好的三支协同过滤推荐模型

doi:10.13232/j.cnki.jnju.2023.05.006

融入用户风险偏好的三支协同过滤推荐模型

黄树添¹, 胡诗琳¹, 卜祥智¹, 李华雄², 刘久兵^,¹

1.汕头大学商学院，汕头，515063

2.南京大学工程管理学院，南京，210023

Three⁃way collaborative filtering recommendation model integrating user risk preferences

Huang Shutian¹, Hu Shilin¹, Bu Xiangzhi¹, Li Huaxiong², Liu Jiubing^,¹

1.School of Business, Shantou University, Shantou, 515063, China

2.School of Management and Engineering, Nanjing University, Nanjing, 210023, China

通讯作者: E⁃mail：jiubingliu@163.com

收稿日期: 2023-06-19

基金资助:

国家自然科学基金.  62106135.  62176116
广东省自然科学基金.  2023A1515011390.  2022A1515011571.  2023A1515011029
广东省基础与应用基础研究青年项目.  2020A1515110434
广东省哲学社会科学“十三五”规划青年项目.  GD20YGL13
广东烟草汕头市有限责任公司项目.  2023440500260003

Received: 2023-06-19

摘要

基于用户的不同风险偏好特征，提出一种融入用户风险偏好的三支协同过滤推荐模型来提高推荐规则的准确性.首先，考虑用户的不同风险偏好对项目评分的影响，基于用户⁃项目评分矩阵定义用户关于项目的偏好概率测度，建立用户⁃项目偏好概率模型，从理论上证明了该模型是现有模型的推广和拓展.其次，利用决策粗糙集，推导出用户在不同风险偏好下的三支推荐模型阈值表达.然后，以上述工作为基础，将推荐准确性和推荐成本作为优化目标，设计基于粒子群优化算法的用户偏好概率模型参数确定方法.最后，在MovieLens数据集上的实验验证了提出模型的有效性.

关键词： 协同过滤 ; 风险偏好 ; 三支推荐 ; 偏好概率模型

Abstract

Based on the characteristics of different risk preferences of users，a three⁃way collaborative filtering recommendation model integrating user risk preferences is proposed to improve the accuracy of recommendation rules. First，considering the impact of different risk preferences of users on item ratings，a user's preference probability measure for items is defined based on the user⁃item rating matrix，and a user⁃item preference probability model is established，which is theoretically proved to be a generalization and extension of the existing model. Second，by using decision⁃theoretic rough set，mathematical expressions for the threshold of three⁃way recommendation under different risk preferences of users are deduced. Moreover，based on the aforementioned work，taken recommendation accuracy and recommendation cost as optimization objectives，a method for determining parameters of the user's preference probability model is designed based on particle swarm optimization algorithm. Finally，experiments on the MovieLens dataset verify the effectiveness of the proposed model.

Keywords： collaborative filtering ; risk preference ; three⁃way recommendation ; preference probability model

PDF (886KB) 元数据多维度评价相关文章导出 EndNote| Ris| Bibtex 收藏本文

本文引用格式

黄树添, 胡诗琳, 卜祥智, 李华雄, 刘久兵. 融入用户风险偏好的三支协同过滤推荐模型. 南京大学学报（自然科学）[J], 2023, 59(5): 777-789 doi:10.13232/j.cnki.jnju.2023.05.006

Huang Shutian, Hu Shilin, Bu Xiangzhi, Li Huaxiong, Liu Jiubing. Three⁃way collaborative filtering recommendation model integrating user risk preferences. Journal of nanjing University[J], 2023, 59(5): 777-789 doi:10.13232/j.cnki.jnju.2023.05.006

互联网时代数据爆炸，信息过载，庞大的信息体量在给用户带来巨大内容冲击的同时也消弭了用户的注意力与判断力，因此，过滤无用信息并筛选出用户感兴趣的内容成为一个重要的研究课题.推荐系统因其有效的过滤机制为该类问题提供了新的解决范式，它通过挖掘用户的行为与偏好来捕捉用户感兴趣但未曾留意的商品信息.在推荐系统研究领域，协同过滤是应用最广泛的算法之一^［1-2］，它利用用户对项目的历史评分数据来预测用户对未评分项目的喜好程度，并根据预测评分对用户进行推荐.

传统的推荐系统通常选择推荐或不推荐，但若信息不充分或获取信息代价较高，直接推荐或不推荐可能会带来较大的推荐成本.因此，Zhang et al^［3-4］首次将三支决策引入推荐系统，在传统的推荐或不推荐的基础上，引入第三种策略——延迟推荐，提出三支推荐的概念.

作为三支推荐的理论基础，三支决策（Three⁃Way Decision）是一种符合人类认知习惯的决策理论，自提出以来便获得学者的广泛关注^［5-11］，已在多个领域得到应用，如医疗诊断^［12］、投资管理^［13］、人脸识别^［14］和机器学习^［15］等.在推荐系统领域，叶晓庆等^［16］在三支推荐的基础上，利用粒计算来弥补传统协同过滤算法评分信息单一的缺陷.Ma et al^［17］提出一种结合全局和局部信息的三支推荐方法，在预测评分时考虑了全局和局部的信息.Liu and Ye^［18］将三支决策与矩阵分解相结合，提出多粒度信息下的动态三支推荐算法，根据不同粒度来动态地调整推荐列表.秦琴和张恒汝^［19］提出一种基于信任传递机制的三支推荐模型，将信任约束引入矩阵分解，可以更好地预测评分.Ye and Liu^［20］提出一种基于协同主题回归的可解释性序贯三支推荐策略，实现可解释的多层次推荐.Zhang et al^［21］提出三支朴素贝叶斯协同过滤推荐模型，结合朴素贝叶斯与协同过滤算法来处理用户评分信息的稀疏性.Ye and Liu^［22］提出一种基于成本敏感、时空特征和多粒度决策的三支推荐方法.Ye et al^［23］基于协同深度学习，提出一种多粒度序贯三支推荐方法.

通常，在三支推荐过程中，需要考虑推荐规则的划分阈值与用户对项目的偏好概率，二者均会对推荐结果产生影响，而现有文献较少对后者进行深入研究.在计算偏好概率时，一般的做法是在本质上将用户的风险态度考虑为风险中立型，然而，不同用户的风险态度可能是多样的^［24］，将所有用户的风险态度都划分为同一种会导致偏好概率测度失真，降低推荐质量.

因此，本文在已有研究的基础上，提出一种融入用户风险偏好的三支协同过滤推荐模型.首先，基于用户已有的评分信息，利用协同过滤算法预测用户对未评分项目的评分.其次，考虑用户的不同风险态度，结合效用理论，定义用户对项目的偏好概率测度，构建用户⁃项目偏好概率模型，并通过理论证明了该模型是现有模型的推广.随后，利用偏好概率模型与决策粗糙集，导出三支推荐模型的阈值表达，进而设计基于粒子群优化算法的用户偏好概率模型参数确定方法.最后，利用MovieLens数据集中用户对电影的评分数据对模型进行验证.本文从用户的风险态度的视角出发，提供了一个新的具有可拓展性的测度用户偏好概率的方法，使三支推荐的决策规则划分更加准确，进一步提高了推荐质量.

1 预备知识

1.1　经典协同过滤算法

协同过滤算法是目前应用最广泛的推荐算法之一，主要包括基于用户的协同过滤^［25］和基于项目的协同过滤^［26］，后者的性能和推荐质量在很多情形下优于前者^［26］.因此，本文主要讨论基于项目的协同过滤.对于目标用户u和候选项目i，首先计算用户u已评分的项目与项目i之间的相似度，选出与项目i最相似的k个近邻项目，利用近邻项目的信息预测用户u对项目i的可能评分.主要步骤如下.

步骤1.计算项目之间的相似性.

表1为用户⁃项目评分矩阵，其中 $U = \{u_{1}, u_{2},$

表1 用户⁃项目评分矩阵

Table 1 User⁃Item rating matrix

用户	项目
用户	$i_{1}$	$i_{2}$	$\dots$	$i_{n}$
$u_{1}$	$R_{11}$	$R_{12}$	$\dots$	$R_{1 n}$
$u_{2}$	$R_{21}$	$R_{22}$	$\dots$	$R_{2 n}$
$⋮$	$⋮$	$⋮$	$\dots$	$⋮$
$u_{m}$	$R_{m 1}$	$R_{m 2}$	$\dots$	$R_{m n}$

新窗口打开| 下载CSV

$\dots, u_{m}\}$ 表示用户集合， $I = \{i_{1}, i_{2}, \dots, i_{n}\}$ 表示项目集合， $R = U \times I$ 表示用户u对项目i的评分 $R_{u i}$ 构成的集合.根据该评分矩阵可以计算项目之间的Pearson相关系数，其取值范围为 $[- 1,1]$ .该系数越接近1说明两个项目越相似，越接近0说明两个项目之间的差异性越大.具体计算如下：

s i m (i, j) = \frac{\sum_{u \in K} (R_{u i} - {\bar{R}}_{i}) (R_{u j} - {\bar{R}}_{j})}{\sqrt[]{\sum_{u \in K} {(R_{u i} - {\bar{R}}_{i})}^{2}} \sqrt[]{\sum_{u \in K} {(R_{u j} - {\bar{R}}_{j})}^{2}}}

(1)

其中， $s i m (i, j)$ 表示项目i与j之间的Pearson系数，用来测度i和j之间的相似程度；K表示同时评价项目i和j的用户集合； $R_{u i}$ 表示用户u对项目i的评分； ${\bar{R}}_{i}$ 表示项目i已有评分的平均数.

步骤2.预测用户对目标项目的评分.

选择用户u已评分项目中与目标项目i最相似的k个项目，根据这k个近邻项目与项目i之间的Pearson系数以及相关评分数据，预测用户u对未知评分项目i的评分 $R_{u i}^{*}$ .具体计算如下：

R_{u i}^{*} = {\bar{R}}_{i} + \frac{\sum_{j = 1}^{k} s i m (i, j) \cdot (R_{u j} - {\bar{R}}_{j})}{\sum_{j = 1}^{k} s i m (i, j)}

(2)

其中， $s i m (i, j)$ 表示目标项目i与近邻项目j之间的相似度， $R_{u j}$ 表示用户u对项目j的真实评分， ${\bar{R}}_{i}$ 和 ${\bar{R}}_{j}$ 分别表示项目i和j已知评分的平均数.

1.2　三支决策

传统协同过滤推荐是一种二支推荐，只有推荐与不推荐两种状态.然而，当信息不充分或获取信息代价较高时，很难即时作出推荐或不推荐的判定，若此时强行将项目推荐给用户，可能会产生较大的误推荐成本.基于此，本文参考三支决策的延迟策略，将传统的二支决策推荐拓展为三支决策推荐，减少在信息不充分的时候因错误决策造成的严重损失.

三支决策来源于决策粗糙集理论^［27-28］，它为决策粗糙集正域、负域、边界域给出了一种合理的语义解释.不同的域对应不同的决策规则，正域对应接受规则，负域对应拒绝规则，边界域对应不承诺或延迟决策规则.若在信息不充分的情况下仍然只考虑接受或拒绝两种选择，类似接受或拒绝一个假设，就可能会作出弃真或择假的错误决策.换言之，此时贸然作出接受或拒绝的判定，将产生错误接受或错误拒绝的成本，这两种决策成本可能高于不作任何判定的成本.在这种情形下，边界域提供的延迟决策选项能更好地体现定量决策的容错性.

根据三支决策理论^{［10，29］}， $Ω = \{T, \neg T\}$ 表示对象属于T和不属于T的状态集合， $Λ = \{a_{P}, a_{B}, a_{N}\}$ 表示对于以上两种状态，分别采取接受决策、延迟决策或拒绝决策三种行动.在不同状态下采取三种行动的损失各不相同，表2给出了其决策代价损失.当对象处于状态 $T$ 时，采取行动 $a_{P}$ ， $a_{B}$ 和 $a_{N}$ 分别产生代价损失 $λ_{P P}$ ， $λ_{B P}$ 和 $λ_{N P}$ ；当对象处于状态 $\neg T$ 时，采取行动 $a_{P}$ ， $a_{B}$ 和 $a_{N}$ 分别产生代价损失 $λ_{P N}$ ， $λ_{B N}$ 和 $λ_{N N}$ ^［10］.

表2 代价损失矩阵

Table 2 Cost loss matrix

行动	状态
行动	$T (P)$	$\neg T (N)$
$a_{P}$	$λ_{P P}$	$λ_{P N}$
$a_{B}$	$λ_{B P}$	$λ_{B N}$
$a_{N}$	$λ_{N P}$	$λ_{N N}$

新窗口打开| 下载CSV

对于对象 $[x]$ ，采取 $a_{P}$ ， $a_{B}$ ， $a_{N}$ 三种行动产生的期望损失分别为：

R (a_{P} |[x]) = λ_{P P} \cdot P r (T |[x]) + λ_{P N} \cdot P r (\neg T |[x])

R (a_{B} |[x]) = λ_{B P} \cdot P r (T |[x]) + λ_{B N} \cdot P r (\neg T |[x])

R (a_{N} |[x]) = λ_{N P} \cdot P r (T |[x]) + λ_{N N} \cdot P r (\neg T |[x])

已知 $P r (T |[x]) + P r (\neg T |[x]) = 1$ ，由贝叶斯最小风险决策理论可知决策规则如下：

（P）若 $R (a_{P} |[x]) \leq R (a_{B} |[x])$ 且 $R (a_{P} |[x]) \leq R (a_{N} |[x])$ ，则 $x \in P O S (T)$ ；

（B）若 $R (a_{B} |[x]) \leq R (a_{P} |[x])$ 且 $R (a_{B} |[x]) \leq R (a_{N} |[x])$ ，则 $x \in B N D (T)$ ；

（N）若 $R (a_{N} |[x]) \leq R (a_{P} |[x])$ 且 $R (a_{N} |[x]) \leq R (a_{B} |[x])$ ，则 $x \in N E G (T)$ .

根据文献［10，29-31］，规则（P）⁃（N）为三支决策，三个规则对应的域分别为正域、边界域和负域.考虑一种合理情形，即满足 $λ_{P P} \leq λ_{B P} < λ_{N P}$ 且 $λ_{N N} \leq λ_{B N} < λ_{P N},$ 假设边界域存在，则需满足 $(λ_{B P} - λ_{P P}) (λ_{B N} - λ_{N N}) < (λ_{P N} - λ_{B N}) (λ_{N P} - λ_{B P})$ .此时，上述（P）⁃（N）规则可简化为（P1）⁃（N1）.

（P1）若 $P r (T |[x]) \geq α$ ，则 $x \in P O S (T);$

（B1）若 $β < P r (T |[x]) < α$ ，则 $x \in B N D (T)$ ；

（N1）若 $P r (T |[x]) \leq β$ ，则 $x \in N E G (T)$ ，

其中，

α = \frac{λ_{P N} - λ_{B N}}{(λ_{P N} - λ_{B N}) + (λ_{B P} - λ_{P P})}

β = \frac{λ_{B N} - λ_{N N}}{(λ_{B N} - λ_{N N}) + (λ_{N P} - λ_{B P})}

从（P1）⁃（N1）可知，比较条件概率与阈值 $α$ ， $β$ 的大小可以确定每个对象 $[x]$ 的决策行动.

2 融入用户风险偏好的三支协同过滤推荐

三支协同过滤推荐在传统协同过滤仅有推荐和不推荐两种策略的基础上，增加了第三种策略——延迟推荐，这有利于降低推荐成本.在三支协同过滤推荐中需要确定用户关于项目的偏好概率，该概率可以利用用户对项目的预测评分来进行测度^［16-23］，但不同用户的评分标准各不相同.例如，有的用户倾向给项目打更高的分数，整体评分偏高；有的则倾向较低的分数，整体评分偏低.如果仅仅考虑预测评分，则用户评分标准的不同带来的评分偏差可能会降低偏好概率的准确度.文献［16，18，21］采用最小最大值归一化方法来测度偏好概率，消除评分偏差，但值得注意的是，该方法假定所有用户的风险偏好均为风险中立型.事实上，用户对风险的态度可分为风险中立型、厌恶型和偏好型^［32］，不同风险偏好的用户评分的偏差不尽相同，仅把用户当作中立型不足以消除评分偏差.因此，在构建三支协同过滤推荐模型时，需要考虑不同用户的风险偏好.为此，本文提出一种新模型，给定用户u与候选推荐项目i，构建用户⁃项目对 $(u, i)$ ，利用协同过滤算法预测用户对项目的评分 $R_{u i}^{*}$ .根据预测评分，基于用户⁃项目偏好概率模型得到用户u对项目i的偏好概率 $P r o b_{u i}$ ；根据决策成本矩阵得出推荐规则的阈值对 $α$ 和 $β$ ；最后，利用用户偏好概率与阈值生成三支推荐规则，如表3所示.首先，构建用户⁃项目偏好概率模型，继而根据决策粗糙集与偏好概率导出三支推荐阈值对 $α$ 和 $β$ 的数学表达，最后提出确定用户偏好概率模型具体参数的方法.

表3 三支推荐规则

Table 3 Rules of three⁃way recommendation

划分条件	决策区域	决策规则
$P r o b_{u i} \geq α$	$P O S (P)$	推荐 $(R)$
$β < P r o b_{u i} < α$	$B N D (P)$	延迟推荐 $(B)$
$P r o b_{u i} \leq β$	$N E G (P)$	不推荐 $(N)$

新窗口打开| 下载CSV

2.1　用户⁃项目偏好概率模型构建

在微观经济学中，效用是指消费者从消费某种物品中得到的满足程度；在决策领域，效用是决策者对于决策后果或决策损益值的一种感受、反应或倾向，是决策者的价值观和偏好在决策活动中的综合反映^［28］.用户在决定是否购买某种商品或服务时，既是消费者，也是决策者.作为决策者，用户的风险偏好会影响其对效用的估计，进而影响消费行为.风险中立型、厌恶型或偏好型^{［24，33］}的用户对应不同的效用函数，同一类型的用户由于具体偏好的差异，效用函数也不尽相同.

根据上述分析，用户对项目评分的高低反映项目对用户的效用大小及用户对项目的喜好程度.一般地，评分越高说明项目对于用户的效用越高，用户喜欢该项目的概率越大，但是，用户对项目的喜好程度不是影响用户对项目评分的唯一因素，用户自身的风险偏好同样会影响其对项目的评分.例如，同一效用水平下，和风险偏好型用户相比，风险厌恶型用户的评分会偏低，而风险中立型用户的评分介于二者之间，如图1所示.因此，考虑用户的不同风险偏好，基于表1，本文采用L⁃A拟合法^{［24，34］}来刻画不同风险偏好下用户关于项目的效用函数.具体地，假设：

U t i l i t y_{u} (R_{u i}) = q {(R_{u i} + d)}^{ρ}

(3)

其中， $R_{u i}$ 表示用户u对项目i的评分， $q$ 为尺度参数， $d$ 为位置参数， $ρ$ 为用户u的风险偏好系数， $U t i l i t y_{u} (R_{u i}) \in [0,1]$ .

图1

新窗口打开| 下载原图ZIP| 生成PPT

图1 L⁃A拟合法下的用户⁃项目效用函数

Fig.1 L⁃A simulation method for User⁃Item utility function

如图1所示，当 $0 < ρ < 1$ 时，用户u为风险厌恶型，其效用曲线是上凸的；当 $ρ = 1$ 时，用户u为风险中立型，其效用曲线是直线；当 $ρ > 1$ 时，用户u为风险偏好型，其效用曲线是上凹的. $R_{u}^{1}$ 和 $R_{u}^{0}$ 为用户u的效用阈值，即当用户u对项目的评分不小于 $R_{u}^{1}$ 时，用户认为该项目对其的效用为1；当用户u对项目的评分不大于 $R_{u}^{0}$ 时，用户认为该项目对其的效用为0；当用户u对项目的评分介于 $R_{u}^{0}$ 和 $R_{u}^{1}$ 之间时，该项目对用户的效用可由式（3）表示.并且，设置推荐系统的评分范围为 $[\underset{̲}{R}, \bar{R}]$ ，例如，淘宝平台的评分范围通常为1~5，则 $\underset{̲}{R} \leq R_{u}^{0} < R_{u}^{1} \leq \bar{R}$ .

预测评分是判断用户对候选推荐项目偏好程度的依据，通常预测评分越高，说明该项目对用户的效用越大，用户偏好该项目的概率越高.受文献［35］的启发，下面给出用户⁃项目效用偏好概率模型的定义.

定义

设在表1所示的评分系统中，用户对项目的评分范围为 $[\underset{̲}{R}, \bar{R}]$ ， $R_{u i}^{*}$ 为用户u关于项目i的预测评分，则用户u关于项目i的偏好概率 $P r o b_{u i}$ 定义为：

P r o b_{u i} = \{\begin{array}{l} 1, & R_{u}^{1} \leq R_{u i}^{*} \leq \bar{R} \\ q {(R_{u i}^{*} + d)}^{ρ}, & R_{u}^{0} < R_{u i}^{*} < R_{u}^{1} \\ 0, & \underset{̲}{R} \leq R_{u i}^{*} \leq R_{u}^{0} \end{array}

(4)

其中， $R_{u}^{1}$ 和 $R_{u}^{0}$ 为用户u的效用阈值， $q$ 为尺度参数， $d$ 为位置参数， $ρ$ 为用户u的风险偏好系数.

图2为式（4）对应的图像.当 $0 < ρ < 1$ 时，用户u为风险厌恶型，对于被推荐到不喜欢的项目的容忍度较低，偏好概率相同时其评分较低；当 $ρ > 1$ 时，用户u为风险偏好型，对于被推荐到不喜欢的项目的容忍度较高，相同的偏好概率下其评分较高；当 $ρ = 1$ 时，用户u为风险中立型，在偏好概率相同时，其评分介于上述两者之间.

图2

新窗口打开| 下载原图ZIP| 生成PPT

图2 用户⁃项目效用偏好概率模型

Fig.1 User⁃Item utility preference probability model

式（4）中的参数 $q$ ， $d$ 和 $ρ$ 可用三个效用点确定，分别为 $(R_{u}^{1}, 1), (R_{u}^{0}, 0)$ 和 $(R_{u}^{m}, m)$ ，其中， $R_{u}^{0} < R_{u}^{m} < R_{u}^{1}$ 且 $0 < m < 1$ .则三个参数的解析式为：

\{\begin{array}{l} ρ = \frac{- l n (m)}{l n (R_{u}^{1} - R_{u}^{0}) - l n (R_{u}^{m} - R_{u}^{0})} \\ d = - R_{u}^{0} \\ q = \frac{1}{{(R_{u}^{1} - R_{u}^{0})}^{ρ}} \end{array}

(5)

下面用具体的例子来说明前面的定义.

例

在某电影网站中，用户对电影的评分系统为五分制，最低分为1，最高分为5，评分步长为0.5.假设用户u₁的三个效用点分别为 $(1.5,0)$ ， $(2,0.5)$ 和 $(5,1)$ ，用户u₂的三个效用点分别为 $(1,0)$ ， $(3,0.5)$ 和 $(5,1)$ ，用户u₃的三个效用点分别为 $(1,0),$ $(3.5,0.5)$ 和 $(4.5,1)$ .基于式（4）和式（5），可以分别得到用户u₁，u₂和u₃的偏好概率 $P r o b_{u_{1} i}$ ， $P r o b_{u_{2} i}$ 和 $P r o b_{u_{3} i}$ .具体如下：

P r o b_{u_{1} i} = \{\begin{array}{l} 1, & R_{u_{1} i}^{*} = 5 \\ 0.64 {(R_{u_{1} i}^{*} - 1.5)}^{0.356}, & 1.5 < R_{u_{1} i}^{*} < 5 \\ 0, & 1 \leq R_{u_{1} i}^{*} \leq 1.5 \end{array}

P r o b_{u_{2} i} = \{\begin{array}{l} 1, & R_{u_{2} i}^{*} = 5 \\ 0.25 (R_{u_{2} i}^{*} - 1), & 1 < R_{u_{2} i}^{*} < 5 \\ 0, & R_{u_{2} i}^{*} = 1 \end{array}

P r o b_{u_{3} i} = \{\begin{array}{l} 1, & R_{u_{3} i}^{*} = 5 \\ 0.076 {(R_{u_{3} i}^{*} - 1)}^{2.06}, & 1.5 < R_{u_{3} i}^{*} < 5 \\ 0, & 1 \leq R_{u_{3} i}^{*} \leq 1.5 \end{array}

用户u₁的风险系数 $ρ_{1} = 0.356 < 1$ ，风险厌恶型；用户u₂的风险系数 $ρ_{2} = 1$ ，风险中立型；用户u₃的风险系数 $ρ_{3} = 2.06 > 1$ ，风险偏好型.

根据定义，可得如下命题.

命题

设 $R_{u}^{m a x}$ 和 $R_{u}^{m i n}$ 分别为用户u已知评分的最大和最小值，且令 $R_{u}^{1} = R_{u}^{m a x}$ ， $R_{u}^{0} = R_{u}^{m i n}$ .当用户u为风险中立型（即 $ρ = 1$ ）时，下式恒成立：

P r o b_{u i} = \{\begin{array}{l} 1, & R_{u}^{m a x} \leq R_{u i}^{*} \leq \bar{R} \\ \frac{R_{u i}^{*} - R_{u}^{m i n}}{R_{u}^{m a x} - R_{u}^{m i n}}, & R_{u}^{m i n} < R_{u i}^{*} < R_{u}^{m a x} \\ 0, & \underset{̲}{R} \leq R_{u i}^{*} \leq R_{u}^{m i n} \end{array}

(6)

证明

当 $ρ = 1$ ，则 $R_{u}^{1} = R_{u}^{m a x}$ 和 $R_{u}^{0} = R_{u}^{m i n}$ 时，根据式（5），可以解得：

\{\begin{array}{l} ρ = 1 \\ d = - R_{u}^{m i n} \\ q = \frac{1}{R_{u}^{m a x} - R_{u}^{m i n}} \end{array}

将 $ρ$ ， $d$ 和 $q$ 代入式（4），即可得式（6）.因此，命题成立.

从命题可知，式（6）是最小最大值归一化模型，换句话说，该模型是本文提出的用户⁃项目偏好概率模型的一种特例.因此，本文提出的模型是文献［16，18，21］中最小最大值归一化模型的拓展，更具有一般性.

2.2　融入用户风险偏好的三支推荐阈值推导

如表3所示，三支推荐中给定用户u和项目i，最优推荐结果取决于用户对项目的偏好概率以及阈值对 $α$ 和 $β$ .利用构建的用户⁃项目偏好概率模型，可计算出用户关于项目的偏好概率.下面根据决策粗糙集推导出阈值对，获得三支推荐规则.

表4给出喜欢和不喜欢两种状态下采取三种推荐策略的成本，其中 $λ_{R P}$ ， $λ_{B P}$ 和 $λ_{N P}$ 分别表示当用户喜欢（P）某项目时，将该项目推荐（R）、延迟推荐（B）及不推荐（N）给用户时产生的成本； $λ_{R N}$ ， $λ_{B N}$ 和 $λ_{N N}$ 分别表示用户不喜欢（N）时，将该项目推荐（R）、延迟推荐（B）及不推荐（N）给用户时产生的成本.其中， $λ_{R P}$ 和 $λ_{N N}$ 表示正确推荐的成本； $λ_{B P}$ 和 $λ_{B N}$ 表示延迟推荐产生的学习成本，即推荐系统暂时无法确定用户偏好，需要进一步学习相关信息时产生的成本； $λ_{N P}$ 和 $λ_{R N}$ 表示错误推荐的成本，其中， $λ_{N P}$ 表示系统拒绝给用户推荐其喜欢的项目时产生的成本， $λ_{R N}$ 表示系统将用户不喜欢的项目推荐给该用户时产生的成本.通常，延迟推荐的成本远小于错误推荐的成本，正确推荐的成本小于延迟推荐的成本，即表4的成本满足：

表4 三支推荐成本的矩阵

Table 4 The matrix of three⁃way recommendation cost

决策规则	用户对项目的偏好
决策规则	喜欢(P)	不喜欢(N)
推荐(R)	$λ_{R P}$	$λ_{R N}$
延迟推荐(B)	$λ_{B P}$	$λ_{B N}$
不推荐(N)	$λ_{N P}$	$λ_{N N}$

新窗口打开| 下载CSV

λ_{R P} \leq λ_{B P} < λ_{N P}, λ_{N N} \leq λ_{B N} < λ_{R N}

(7)

基于用户对项目的偏好概率 $P r o b_{u i}$ ，决策规则（详见表3）和成本矩阵（详见表4），三种推荐策略的成本为：

C_{R} = λ_{R P} P r o b_{u i} + λ_{R N} (1 - P r o b_{u i})

C_{B} = λ_{B P} P r o b_{u i} + λ_{B N} (1 - P r o b_{u i})

C_{N} = λ_{N P} P r o b_{u i} + λ_{N N} (1 - P r o b_{u i})

其中， $C_{R}$ ， $C_{B}$ 和 $C_{N}$ 分别表示采取推荐、延迟推荐和不推荐策略时产生的决策成本.

根据贝叶斯决策理论^［10］，可得如下规则：

（R）当 $C_{R} \leq C_{N}$ 且 $C_{R} \leq C_{B}$ 时，则 $(u, i) \in P O S (P);$

（B）当 $C_{B} \leq C_{R}$ 且 $C_{B} \leq C_{N}$ 时，则 $(u, i) \in B N D (P);$

（N）当 $C_{N} \leq C_{R}$ 且 $C_{N} \leq C_{B}$ 时，则 $(u, i) \in N E G (P)$ .

基于式（7），三支推荐规则（R）⁃（N）可进一步简化为规则（R1）⁃（N1）：

（R1）当 $P r o b_{u i} \geq α$ 且 $P r o b_{u i} \geq γ$ 时， $(u, i) \in P O S (P);$

（B1）当 $P r o b_{u i} \leq α$ 且 $P r o b_{u i} \geq β$ 时， $(u, i) \in B N D (P);$

（N1）当 $P r o b_{u i} \leq β$ 且 $P r o b_{u i} < γ$ 时， $(u, i) \in N E G (P)$ .

其中，

\begin{array}{l} α = \frac{λ_{R N} - λ_{B N}}{(λ_{R N} - λ_{B N}) + (λ_{B P} - λ_{R P})} \\ β = \frac{λ_{B N} - λ_{N N}}{(λ_{B N} - λ_{N N}) + (λ_{N P} - λ_{B P})} \\ γ = \frac{λ_{R N} - λ_{N N}}{(λ_{R N} - λ_{N N}) + (λ_{N P} - λ_{R P})} \end{array}

假设：

(λ_{R N} - λ_{B N}) (λ_{N P} - λ_{B P}) > (λ_{B P} - λ_{R P}) (λ_{B N} - λ_{N N})

则三支推荐规则（R1）⁃（N1）可简化为规则：

（R2）当 $P r o b_{u i} \geq α$ 时， $(u, i) \in P O S (P)$ ；

（B2）当 $β < P r o b_{u i} < α$ ， $(u, i) \in B N D (P)$ ；

（N2）当 $P r o b_{u i} \leq β$ 时， $(u, i) \in N E G (P) .$

特别地，当

(λ_{R N} - λ_{B N}) (λ_{N P} - λ_{B P}) \leq (λ_{B P} - λ_{R P}) (λ_{B N} - λ_{N N})

时，三支协同过滤推荐算法退化为二支协同过滤推荐算法，此时三支推荐规则（R1）⁃（N1）简化为：

（R3）当 $P r o b_{u i} \geq γ$ 时， $(u, i) \in P O S (P)$ ；

（N3）当 $P r o b_{u i} \leq γ$ 时， $(u, i) \in N E G (P) .$

下面，以2.1和2.2的工作为基础，提出确定用户⁃项目偏好概率模型参数的方法.

2.3　基于粒子群优化的偏好概率模型参数确定

基于表1，可利用式（4）构建用户的偏好概率模型，但特定评分下用户的偏好概率是未知的，难以使用拟合方法确定用户的偏好概率模型参数.对于用户⁃项目偏好概率模型，其测度越精确，三支推荐的准确性会越高，推荐成本也越低；反之，当推荐准确性越高、推荐成本越低时，偏好概率模型的测度越精确.因此，可以将这两个指标作为目标，从优化的角度出发，使用粒子群优化算法来确定用户偏好概率模型的参数，以最大化推荐准确性和最小化推荐成本，使用户⁃项目偏好概率模型的测度尽可能准确.

由定义可知，用户的偏好概率模型由三个参数 $q$ ， $d$ 和 $ρ$ 决定.由式（5），令 $R_{u}^{m} = R_{u}^{0.5}$ ， $m = 0.5$ ，则三个参数的表达式为：

\{\begin{array}{l} ρ = \frac{l n (2)}{l n (R_{u}^{1} - R_{u}^{0}) - l n (R_{u}^{0.5} - R_{u}^{0})} \\ d = - R_{u}^{0} \\ q = \frac{1}{{(R_{u}^{1} - R_{u}^{0})}^{ρ}} \end{array}

(8)

如式（8）所示，参数 $d$ ， $ρ$ 和 $q$ 可由 $(R_{u}^{1}, 1),$

$(R_{u}^{0}, 0)$ 和 $(R_{u}^{0.5}, 0.5)$ 这三个效用点对应的用户评分来确定.因此，确定用户的偏好概率的问题可以转化为确定用户对应的最优评分组合 $R_{u}^{1}$ ， $R_{u}^{0}$ 和 $R_{u}^{0.5}$ ，使模型能够更好地预测用户对项目的偏好概率，优化三支推荐的准确性，降低推荐成本.

表5中， $n_{R P}^{u}$ ， $n_{B P}^{u}$ 和 $n_{N P}^{u}$ 分别表示将用户u喜欢的项目推荐、延迟推荐和不推荐给该用户的项目数量； $n_{R N}^{u}$ ， $n_{B N}^{u}$ 和 $n_{N N}^{u}$ 分别表示将用户u不喜欢的项目推荐、延迟推荐和不推荐给该用户的项目数量.则用户u的三支推荐准确性（ $A c c u r a c y_{u}$ ）定义为^［36］：

A c c u r a c y_{u} = \frac{n_{R P}^{u} + n_{N N}^{u}}{n_{R P}^{u} + n_{N P}^{u} + n_{R N}^{u} + n_{N N}^{u}}

(9)

表5 三支推荐数量矩阵

Table 5 The matrix of three⁃way recommendation number

决策规则	用户对项目的偏好
决策规则	喜欢(P)	不喜欢(N)
推荐(R)	$n_{R P}^{u}$	$n_{R N}^{u}$
延迟推荐(B)	$n_{B P}^{u}$	$n_{B N}^{u}$
不推荐(N)	$n_{N P}^{u}$	$n_{N N}^{u}$

新窗口打开| 下载CSV

基于表4和表5，用户u的推荐成本（ $T C_{u}$ ）可表达为：

\begin{array}{l} T C_{u} = λ_{R P} n_{R P}^{u} + λ_{B P} n_{B P}^{u} + λ_{N P} n_{N P}^{u} + \\ λ_{R N} n_{R N}^{u} + λ_{B N} n_{B N}^{u} + λ_{N N} n_{N N}^{u} \end{array}

(10)

在三支推荐中，推荐准确性越高，推荐成本通常越低.然而，在计算推荐准确性时（见式（9））没有考虑划分到延迟推荐域的项目，可能导致大量项目被划分到延迟推荐域，使延迟推荐的成本显著增加，产生准确性很高但推荐成本很大的问题，这是不符合优化目标的.因此，在进行粒子群优化时，需要综合考虑准确性和推荐成本两个目标，即准确性越大越好，推荐成本越小越好.本文使用线性加权法将二者合成一个单一的目标函数 $G o a l_{u}$ ，优化目标为 $G o a l_{u}$ 最小，具体如下：

G o a l_{u} = ω_{1} T C_{u} / T C_{u}^{m a x} - ω_{2} A c c u r a c y_{u}

(11)

其中， $T C_{u}^{m a x}$ 表示对用户u进行推荐时可能产生的最大推荐成本， $T C_{u} / T C_{u}^{m a x}$ 表示对 $T C_{u}$ 进行标准化， $T C_{u} / T C_{u}^{m a x}$ 和 $A c c u r a c y_{u}$ 均在0~1； $ω_{1}$ 和 $ω_{2}$ 分别表示推荐成本与推荐准确性的权重系数，满足 $ω_{1} + ω_{2} = 1$ .

当用户u对应的 $R_{u}^{1}$ ， $R_{u}^{0}$ 和 $R_{u}^{0.5}$ 给定时，可以计算用户u的偏好概率模型参数 $d$ ， $ρ$ 和 $q$ ，得到用户对应的偏好概率模型.利用该模型对训练集的项目进行预测，可得到目标函数值 $G o a l_{u}$ .当 $R_{u}^{1}$ ， $R_{u}^{0}$ 和 $R_{u}^{0.5}$ 变化时， $G o a l_{u}$ 也随着变化.下面采用粒子群算法来确定使目标函数 $G o a l_{u}$ 最小的评分组合 $R_{u}^{1}$ ， $R_{u}^{0}$ 和 $R_{u}^{0.5}$ ，进而得到用户u的偏好概率模型.

粒子群优化算法^［37］（Particle Swarm Optimization，PSO）是一种基于群体智能的优化算法，它模拟了鸟群、鱼群等生物集体行为的过程，通过迭代搜索找到最优解，具有较强的全局搜索能力和较好的收敛性.在粒子群算法中，假设有N个粒子和D维空间，每个粒子 $i (i = 1,2, \dots, N)$ 拥有一个位置向量 $X_{i} = (x_{i 1}, x_{i 2}, \dots, x_{i D})$ 和速度向量 $V_{i} = (v_{i 1}, v_{i 2}, \dots, v_{i D})$ .在每次迭代中，粒子 $i$ 的个体最优位置为 $P b_{i} = (P b_{i 1}, P b_{i 2}, \dots, P b_{i D})$ ，整个粒子群的全局最优位置为 $G b = (G b_{1}, G b_{2}, \dots, G b_{D})$ .利用个体最优位置和全局最优位置，可以分别采用式（12）和式（13）更新粒子 $i$ 的速度和位置：

\begin{array}{l} v_{i d} (t + 1) = η (t) v_{i d} (t) + c_{1} r_{1} (P b_{i d} (t) - x_{i d} (t)) + \\ c_{2} r_{2} (G b_{d} (t) - x_{i d} (t)) \end{array}

(12)

x_{i d} (t + 1) = x_{i d} (t) + v_{i d} (t + 1)

(13)

其中，t表示第t次迭代； $c_{1}$ 和 $c_{2}$ 表示学习因子，通常设置为2； $r_{1}$ 和 $r_{2}$ 表示两个在 $[0,1]$ 中随机产生的数； $η (t)$ 为线性递减惯性权重，满足^［38］：

η (t) = 0.9 - (0.9 - 0.4) \frac{t}{T_{m a x}}

(14)

其中， $T_{m a x}$ 表示最大迭代次数.

本文中 $D = 3$ ，将 $R_{u}^{0}$ ， $R_{u}^{0.5}$ 和 $R_{u}^{1}$ 分别作为每个粒子 $i$ 的位置向量，即令 $x_{i 1} = R_{u}^{0}$ ， $x_{i 2} = R_{u}^{0.5}$ ， $x_{i 3} = R_{u}^{1}$ ，以式（11）作为适应函数，通过粒子群算法搜寻最优评分组合 $R_{u}^{0}$ ， $R_{u}^{0.5}$ 和 $R_{u}^{1}$ ，具体步骤如下.

算法基于PSO的用户偏好概率模型最优评分组合确定算法

输入：

1.用户⁃项目评分信息，推荐系统的评分最小值 $\underset{̲}{R}$ 和最大值 $\bar{R}$ ；

2.给定三支推荐成本矩阵；

3.初始化粒子群算法的参数，包括适应函数式（11）、学习因子 $c_{1}$ 和 $c_{2}$ 、最大迭代次数 $T_{m a x}$ 、粒子维度D、粒子群总数N.

输出：用户的偏好概率模型最优评分组合 $R_{u}^{0}$ ， $R_{u}^{0.5}$ 和 $R_{u}^{1}$ .

1.begin

2.for $i = 1$ to $N$ do % 初始化粒子位置与速度

3. $x_{i 1} = \underset{̲}{R}$ ；

4. $x_{i 2} = (\underset{̲}{R} + \bar{R}) / 2$

5. $x_{i 3} = \bar{R}$ ；

6. for $d = 1$ to $D$ do

7. $v_{i d} = 2 \times r a n d - 1$

8. end

9.end

10.基于粒子初始位置、式（8）与成本矩阵求得目标函数值 $G o a l_{u}$

11.for $i = 1$ to $N$ do

12. $P_{b e s t_{i}} = G o a l_{u}$ % 初始化每个粒子的最优目标函数值

13. $P b_{i d} = X_{i}$ % 初始化每个粒子的最优位置

14.end

15. $G_{b e s t} = G o a l_{u}$ % 初始化所有粒子的最优目标函数值

16.for $d = 1$ to $D$ do

17. $G b_{d} = x_{i 1}$ % 初始化所有粒子的最优位置

18.end

19. $t = 1$ % 记录迭代次数

20.while $t \leq T_{m a x}$ do

21. $η (t) = 0.9 - (0.9 - 0.4) \times t / T_{m a x}$

22. for $i = 1$ to $N$ do

23. for $d = 1$ to $D$ do

24. 用式（12）更新速度 $v_{i d} (t + 1)$

25. 当 $v_{i d} (t + 1) > 1$ 或 $v_{i d} (t + 1) < - 1$ 时调整速度

26. 用式（13）更新位置 $x_{i d} (t + 1)$

27. 当 $x_{i d} (t + 1) > \bar{R}$ 或 $x_{i d} (t + 1) < \underset{̲}{R}$ 时调整位置

28. end

29. 基于标准化后的粒子位置和式（8）确定用户此时的偏好概率模型参数，进而求出目标函数值 $G o a l_{u}$ ；

30. if $P_{b e s t_{i}} > G o a l_{u}$ then

31. $P_{b e s t_{i}} = G o a l_{u}$ ；

32. $P b_{i} = X_{i} (t + 1)$ % 更新粒子最优位置

33. end

34. if $G_{b e s t} > P_{b e s t_{i}}$ then

35. $G_{b e s t} = P_{b e s t_{i}}$ ；

36. $G b = P b_{i}$ % 更新所有粒子最优位置

37. end

38. end

39.end

40.输出 $G b$ 中的用户偏好概率模型最优评分组合 $R_{u}^{0}$ ， $R_{u}^{0.5}$ 和 $R_{u}^{1}$

41.end

基于上述算法得到用户最优评分组合，利用式（8）可得到参数 $q$ ， $d$ 和 $ρ$ ，进而得到用户的偏好概率模型.

3 实验分析

3.1　数据集

使用MovieLens⁃100k电影评分数据集（https：∥grouplens.org/datasets/movielens/latest）^［39］进行实验，该数据集的评分在0.5~5，评分步长为0.5.将60%的数据随机划分为预测评分训练集，将20%的数据划分为用户偏好概率模型训练集，剩下20%的数据为测试集.同时，参考文献［40］，清洗评分量过少且不具有意义的数据，所得数据集的基本信息如表6所示.

表6 MovieLens⁃100k数据集的描述

Table 6 The description of MovieLens⁃100k dataset

数据集	用户数	项目数	评分数量	稀疏度
MovieLens⁃100k	599	1650	73713	92.54%

新窗口打开| 下载CSV

3.2　实验设置

对于提出的融入用户风险偏好的三支协同过滤推荐（P_CF），首先，基于协同过滤算法，利用预测评分训练集预测剩余40%的用户⁃项目集的评分.然后，基于前文算法与式（8），利用用户偏好概率模型训练集得出每个用户的偏好概率模型，其中，经调参后目标函数式（11）中的权重取 $ω_{1} = 0.1$ ， $ω_{2} = 0.9$ ，三支推荐成本矩阵取 $λ_{R P} = λ_{N N} = 0$ ， $λ_{B P} = λ_{B N} = 0.25$ 和 $λ_{R N} = λ_{N P} = 0.8$ .最后，对测试集进行三支推荐，将P_CF的推荐结果与基于最大最小值归一化模型^{［16，18，21］}的三支协同过滤推荐算法，即仅将用户视为风险中立型的算法（M_CF）的结果进行对比.

为了衡量推荐结果，需要判断用户对项目的真实偏好.对于五分制评分系统，遵循推荐系统研究的通常做法^［40-41］，将用户的喜好阈值设置为3.5分.

选取推荐成本（TC）、准确性（Accuracy）、覆盖率（Generality）、精准度（Precision）、召回率（Recall）和得分（F）作为衡量指标^{［18，41-42］}.精准度、召回率和得分是传统二支推荐的常用指标，也适用于三支推荐；准确性和覆盖率更适合用来衡量三支推荐的质量，准确性指三支推荐将项目划分到推荐和不推荐域时正确划分的比例，覆盖率指划分到推荐和不推荐域的项目占所有待推荐项目的比例，覆盖率越高表示越多用户得到系统的推荐.通常，准确性和覆盖率之间存在权衡，即为了给更多的用户推荐项目，需要牺牲一部分准确性；反之，为了更准确地向用户推荐项目，需要牺牲一部分覆盖率^［36］.上述指标的定义如下：

\begin{array}{l} T C = λ_{R P} n_{R P} + λ_{B P} n_{B P} + λ_{N P} n_{N P} + λ_{R N} n_{R N} \\ + λ_{B N} n_{B N} + λ_{N N} n_{N N} \end{array}

(15)

G e n e r a l i t y = \frac{n_{a l l} - n_{B P} - n_{B N}}{n_{a l l}}

(16)

A c c u r a c y = \frac{n_{R P} + n_{N N}}{n_{R P} + n_{N P} + n_{R N} + n_{N N}}

(17)

P r e c i s i o n = \frac{n_{R P}}{n_{R P} + n_{R N}}

(18)

R e c a l l = \frac{n_{R P}}{n_{R P} + n_{N P}}

(19)

F = \frac{2 \cdot P r e c i s i o n \cdot R e c a l l}{P r e c i s i o n + R e c a l l}

(20)

其中，

n_{a l l} = n_{R P} + n_{B P} + n_{N P} + n_{R N} + n_{B N} + n_{N N}

结合表5， $n_{R P}$ ， $n_{B P}$ ， $n_{N P}$ ， $n_{R N}$ ， $n_{B N}$ 和 $n_{N N}$ 的表达式分别为：

\begin{array}{l} n_{R P} = \sum_{u \in U} n_{R P}^{u} n_{B P} = \sum_{u \in U} n_{B P}^{u} n_{N P} = \sum_{u \in U} n_{N P}^{u} \\ n_{R N} = \sum_{u \in U} n_{R N}^{u} n_{B N} = \sum_{u \in U} n_{B N}^{u} n_{N N} = \sum_{u \in U} n_{N N}^{u} \end{array}

其中，U表示所有用户的集合.

本文主要考虑错误推荐或错误不推荐产生的误分类成本和延迟推荐产生的学习成本.假设系统正确推荐时不产生推荐成本，即 $λ_{R P} = λ_{N N} = 0$ ，则式（15）可化简为：

T C = λ_{B P} n_{B P} + λ_{N P} n_{N P} + λ_{R N} n_{R N} + λ_{B N} n_{B N}

(21)

3.3　实验结果分析

表7列出了 $λ_{N P} = 0.8$ 时，P_CF与M_CF在不同的 $λ_{R N}$ ， $λ_{B P}$ 和 $λ_{B N}$ 成本条件下的推荐成本；表8列出了对应成本条件下两个算法的推荐覆盖率；表9和表10分别列出了 $λ_{R N} = 0.8$ 时，两个算法在不同的 $λ_{N P}$ ， $λ_{B P}$ 和 $λ_{B N}$ 成本条件下的推荐成本和覆盖率.表中黑体字表示结果更优.综合对比四个表格，分析如下：

表7 固定 $λ_{N P}$ 时推荐成本的比较

Table 7 Recommendation cost with fixed $λ_{N P}$

$(λ_{R N}, λ_{N P})$	$λ_{B R} = λ_{B N} = 0.35$		$λ_{B R} = λ_{B N} = 0.25$		$λ_{B R} = λ_{B N} = 0.15$
$(λ_{R N}, λ_{N P})$	M_CF	P_CF	M_CF	P_CF	M_CF	P_CF
$(1.2,0.8)$	4582.4	4223.1	3526.9	3454.2	2234.3	2345.1
$(1.0,0.8)$	4504.5	4060.4	3471.7	3366.6	2208.8	2269.1
$(0.8,0.8)$	4353.9	3816.0	3417.1	3217.9	2164.2	2200.1
$(0.6,0.8)$	—	—	3306.0	3019.8	2111.6	2120.2
$(0.4,0.8)$	—	—	2753.3	2524.3	2048.8	1957.5

注：“—”表示三支决策退化成二支决策的情况

新窗口打开| 下载CSV

表8 固定 $λ_{N P}$ 时推荐覆盖率的比较

Table 8 Recommendation generality with fixed $λ_{N P}$

$(λ_{R N}, λ_{N P})$	$λ_{B R} = λ_{B N} = 0.35$		$λ_{B R} = λ_{B N} = 0.25$		$λ_{B R} = λ_{B N} = 0.15$
$(λ_{R N}, λ_{N P})$	M_CF	P_CF	M_CF	P_CF	M_CF	P_CF
$(1.2,0.8)$	0.468	0.570	0.204	0.333	0.064	0.193
$(1.0,0.8)$	0.614	0.658	0.290	0.381	0.089	0.214
$(0.8,0.8)$	0.813	0.807	0.443	0.475	0.142	0.247
$(0.6,0.8)$	—	—	0.691	0.646	0.265	0.318
$(0.4,0.8)$	—	—	0.969	0.949	0.571	0.512

注：“—”表示三支决策退化成二支决策的情况

新窗口打开| 下载CSV

表9 固定 $λ_{R N}$ 时推荐成本的比较

Table 9 Recommendation cost with fixed $λ_{R N}$

$(λ_{R N}, λ_{N P})$	$λ_{B R} = λ_{B N} = 0.35$		$λ_{B R} = λ_{B N} = 0.25$		$λ_{B R} = λ_{B N} = 0.15$
$(λ_{R N}, λ_{N P})$	M_CF	P_CF	M_CF	P_CF	M_CF	P_CF
$(0.8,1.2)$	4603.7	4218.8	3456.0	3359.4	2177.2	2228.7
$(0.8,1.0)$	4541.7	4077.1	3446.2	3316.3	2171.7	2214.4
$(0.8,0.8)$	4353.9	3816.0	3417.1	3217.9	2164.2	2200.1
$(0.8,0.6)$	—	—	3286.9	3025.6	2153.1	2158.9
$(0.8,0.4)$	—	—	2644.2	2491.0	2095.9	2040.1

注：“—”表示三支决策退化成二支决策的情况

新窗口打开| 下载CSV

表10 固定 $λ_{R N}$ 时推荐覆盖率的比较

Table 10 Recommendation generality with fixed $λ_{R N}$

$(λ_{R N}, λ_{N P})$	$λ_{B R} = λ_{B N} = 0.35$		$λ_{B R} = λ_{B N} = 0.25$		$λ_{B R} = λ_{B N} = 0.15$
$(λ_{R N}, λ_{N P})$	M_CF	P_CF	M_CF	P_CF	M_CF	P_CF
$(0.8,1.2)$	0.729	0.667	0.421	0.419	0.136	0.233
$(0.8,1.0)$	0.752	0.712	0.426	0.437	0.138	0.238
$(0.8,0.8)$	0.813	0.807	0.443	0.475	0.142	0.247
$(0.8,0.6)$	—	—	0.502	0.572	0.150	0.272
$(0.8,0.4)$	—	—	0.847	0.900	0.198	0.362

注：“—”表示三支决策退化成二支决策的情况

新窗口打开| 下载CSV

（1）由表7和表9可知，学习成本或误分类成本越低，两个算法的推荐成本均越低；由表8和表10可知，学习成本越低或误分类成本越高，两个算法的覆盖率水平越低，即能获得推荐的用户越少.

（2）当学习成本较高或误分类成本较低时，P_CF的推荐成本低于M_CF，即使P_CF的覆盖率更高时也是如此.

（3）当学习成本较低且误分类成本较高时，M_CF的推荐成本总体占优，但优势不明显.结合表7~10可以看出，当M_CF的推荐成本占优时，其对应的覆盖率均明显低于P_CF.以成本为 $λ_{B R} = λ_{B N} = 0.15$ ， $λ_{R N} = 1$ 且 $λ_{N P} = 0.8$ 时为例，M_CF的推荐成本比P_CF低2.7%，但其覆盖率比P_CF低12.5%.所以，M_CF的优势可能是因为它将大量的项目划分到延迟推荐域，延迟推荐的成本较低时其推荐成本也较低，延迟推荐成本较高时，这个优势就不明显，甚至消失.例如，当成本为 $λ_{B R} = λ_{B N} = 0.25$ ， $λ_{R N} = 1.2$ 且 $λ_{N P} = 0.8$ 时，P_CF的覆盖率比 $M_C F$ 高12.9%，而其对应成本也低于M_CF.

因此，本文提出的融入用户风险偏好的算法在学习成本较高或误分类成本较低时，在保证覆盖率的前提下能使系统的推荐成本更低，在学习成本较低且误分类成本较高时，能大幅提高覆盖率，但会小幅牺牲成本.

进一步，选取一组有代表性的成本条件来对比两个算法的推荐质量.设置 $λ_{N P} = 0.8$ 和 $λ_{B P} = λ_{B N} = 0.25$ ，图3~8给出了两个算法在不同的错误推荐成本（ $λ_{R N}$ ）下各指标的对比.分析如下：

图3

新窗口打开| 下载原图ZIP| 生成PPT

图3 $λ_{N P} = 0.8$ 和 $λ_{B P} = λ_{B N} = 0.5$ 时推荐成本的比较

Fig.3 Recomendation cost with $λ_{N P} = 0.8$ and $λ_{B P} = λ_{B N} = 0.5$

图4

新窗口打开| 下载原图ZIP| 生成PPT

图4 $λ_{N P} = 0.8$ 和 $λ_{B P} = λ_{B N} = 0.5$ 时推荐准确性的比较

Fig.4 Recommendation accuracy with $λ_{N P} = 0.8$ and $λ_{B P} = λ_{B N} = 0.5$

图5

新窗口打开| 下载原图ZIP| 生成PPT

图5 $λ_{N P} = 0.8$ 和 $λ_{B P} = λ_{B N} = 0.5$ 时推荐覆盖率的比较

Fig.5 Recommendation generality with $λ_{N P} = 0.8$ and $λ_{B P} = λ_{B N} = 0.5$

图6

新窗口打开| 下载原图ZIP| 生成PPT

图6 $λ_{N P} = 0.8$ 和 $λ_{B P} = λ_{B N} = 0.5$ 时推荐精确度的比较

Fig.6 Recommendation precision with $λ_{N P} = 0.8$ and $λ_{B P} = λ_{B N} = 0.5$

图7

新窗口打开| 下载原图ZIP| 生成PPT

图7 $λ_{N P} = 0.8$ 和 $λ_{B P} = λ_{B N} = 0.5$ 时推荐召回率的比较

Fig.7 Recommendation recall with $λ_{N P} = 0.8$ and $λ_{B P} = λ_{B N} = 0.5$

图8

新窗口打开| 下载原图ZIP| 生成PPT

图8 $λ_{N P} = 0.8$ 和 $λ_{B P} = λ_{B N} = 0.5$ 时推荐得分的比较

Fig.8 Recommendation F⁃measure with $λ_{N P} = 0.8$ and $λ_{B P} = λ_{B N} = 0.5$

（1）随着错误推荐成本的增加，两个算法的推荐成本、准确性、精准度和得分均变大，推荐覆盖率和召回率变小，其中，召回率的变化幅度较小，始终保持在较高的水平.

（2）当 $λ_{R N}$ 不大于0.8时，M_CF的推荐覆盖率大于P_CF，但除召回率之外，M_CF的其他指标均逊色于P_CF.当M_CF的覆盖率占优时，一般意味着它的推荐成本、准确性和精准度处于更大的劣势.例如， $λ_{R N} = 0.6$ 时，M_CF的覆盖率比P_CF高4.5%，但其成本、准确性和精准度分别比P_CF低8.7%，6.0%和4.7%.

（3）当 $λ_{R N}$ 不小于0.8时，M_CF的推荐覆盖率小于P_CF，且二者的差距随着 $λ_{R N}$ 的增大而越来越大.与M_CF的覆盖率占优时不同， $λ_{R N} < 1$ 时， $P_C F$ 的准确性仍然高于 $M_C F$ ； $λ_{R N} > 1$ 时，P_CF的覆盖率比M_CF高10%左右，其准确性只比M_CF低不到2%，精准度低不到4%.

因此，与仅将用户考虑为风险中立型的算法相比，当错误推荐的成本较低时，融入用户风险偏好的算法能在牺牲小部分覆盖率的同时，较大幅度地提高推荐准确性与精准度；当错误推荐的成本较高时，本文提出的算法能在牺牲小部分甚至不牺牲准确性与精准度的同时，较大幅度地提高推荐覆盖率.

综上，本文提出的融入用户风险偏好的三支协同过滤推荐模型更适用于对推荐成本、推荐覆盖率、推荐准确性和推荐精准度综合考虑的场景.

4 结论

为了优化三支推荐规则的准确性，本文提出融入用户风险偏好的三支协同过滤推荐模型，构建了一个能够预测用户对项目的偏好概率的模型，并基于粒子群算法给出了确定用户偏好概率模型的算法.实验结果表明，本文提出的方法在不同的初始条件下能够保持推荐成本、推荐覆盖率、准确性与精准度的相对优势.未来会将本文提出的用户⁃项目偏好概率模型与更多的三支推荐算法相结合，进一步验证该模型的可拓展性.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

Aggarwal

C C

. Recommender systems：The textbook. Cham：Springer International Publishing，2016，498.

[本文引用: 1]

[2]

Patel

， Patel

H B

A state⁃of⁃the⁃art survey on recommendation system and prospective extensions

Computers and Electronics in Agriculture，2020(178)：105779.

[本文引用: 1]

[3]

Zhang

H R

， Min

Three⁃way recommender systems based on random forests

Knowledge⁃Based Systems，2016(91)：275-286.

[本文引用: 1]

[4]

Zhang

H R

， Min

， Shi

Regression⁃based three⁃way recommendation

Information Sciences，2017(378)：444-461.

[本文引用: 1]

[5]

Liu

， Liang

D C

， Wang

C C

A novel three⁃way decision model based on incomplete information system

Knowledge⁃Based Systems，2016(91)：32-45.

[本文引用: 1]

[6]

Yao

Y Y

Three⁃way decisions and cognitive computing

Cognitive Computation，2016，8(4)：543-554.

[7]

Liu

J B

， Li

H X

， Zhou

X Z

，et al.

An optimization⁃based formulation for three⁃way decisions

Information Sciences，2019(495)：185-214.

[8]

J F

， Zhang

Y J

， Miao

D Q

Three⁃way confusion matrix for classification：A measure driven view

Information Sciences，2020(507)：772-794.

[9]

Liu

J B

， Huang

， Li

H X

，et al.

Optimization⁃based three⁃way decisions with interval⁃valued intuitionistic fuzzy information

IEEE Transactions on Cybernetics，2023，53(6)：3829-3843.

[10]

Yao

Y Y

Three⁃way decisions with probabilistic rough sets

Information Sciences，2010，180(3)：341-353.

[本文引用: 4]

[11]

Liu

J B

， Hu

S L

， Li

H X

，et al.

Achieving threshold consistency in three⁃way group decision using optimi⁃zation methodology and expert⁃weight⁃updating⁃strategy

International Journal of Approximate Reasoning，2023(158)：108922.

[本文引用: 1]

[12]

Yao

J T

， Azam

Web⁃based medical decision support systems for three⁃way medical decision making with game⁃theoretic rough sets

IEEE Transactions on Fuzzy Systems，2015，23(1)：3-5.

[本文引用: 1]

[13]

Liu

， Li

T R

， Liang

D C

Three⁃way government decision analysis with decision⁃theoretic rough sets

International Journal of Uncertainty，Fuzziness and Knowledge⁃Based Systems，2012，20(S1)：119-132.

[本文引用: 1]

[14]

H X

， Zhang

L B

， Huang

，et al.

Sequential three⁃way decision and granulation for cost⁃sensitive face recognition

Knowledge⁃Based Systems，2016(91)：241-251.

[本文引用: 1]

[15]

Campagner

， Ciucci

， Svensson

C M

，et al.

Ground truthing from multi⁃rater labeling with three⁃way decision and possibility theory

Information Sciences，2021(545)：771-790.

[本文引用: 1]

[16]

叶晓庆，刘盾，梁德翠.

基于协同过滤的三支粒推荐算法研究

计算机科学，2018，45(1)：90-96.

[本文引用: 5]

X Q

， Liu

， Liang

D C

Three⁃way granular recommendation algorithm based on collaborative filtering

Computer Science，2018，45(1)：90-96.

[本文引用: 5]

[17]

Y Y

， Zhang

H R

， Xu

Y Y

，et al.

Three⁃way recommendation integrating global and local information

The Journal of Engineering，2018(16)：1397-1401.

[本文引用: 1]

[18]

Liu

， Ye

X Q

A matrix factorization based dynamic granularity recommendation with three⁃way decisions

Knowledge⁃Based Systems，2020(191)：105243.

[本文引用: 5]

[19]

秦琴，张恒汝.

基于信任传递机制的三支推荐

模式识别与人工智能，2020，33(7)：600-609.

[本文引用: 1]

Qin

， Zhang

H R

Three⁃way recommendation based on trust transfer mechanism

Pattern Recognition and Artificial Intelligence，2020，33(7)：600-609.

[本文引用: 1]

[20]

X Q

， Liu

An interpretable sequential three⁃way recommendation based on collaborative topic regression

Expert Systems with Applications，2021(168)：114454.

[本文引用: 1]

[21]

Zhang

C Y

， Duan

X M

， Liu

F C

，et al.

Three⁃way Naive Bayesian collaborative filtering recommen⁃dation model for smart city

Sustainable Cities and Society，2022(76)：103373.

[本文引用: 4]

[22]

X Q

， Liu

A cost⁃sensitive temporal⁃spatial three⁃way recommendation with multi⁃granularity decision

Information Sciences，2022(589)：670-689.

[本文引用: 1]

[23]

X Q

， Liu

， Li

T R

Multi⁃granularity sequential three⁃way recommendation based on collaborative deep learning

International Journal of Approximate Reasoning，2023(152)：434-455.

[本文引用: 2]

[24]

Zhang

Q H

， Xie

， Wang

G Y

A novel three⁃way decision model with decision⁃theoretic rough sets using utility theory

Knowledge⁃Based Systems，2018(159)：321-335.

[本文引用: 3]

[25]

Sarwar

， Karypis

， Konstan

，et al.

Analysis of recommendation algorithms for E⁃commerce

∥Proceedings of the 2nd ACM Conference on Electronic Commerce. Minneapolis，MN，USA：Association for Computing Machinery，2000：158-167.

[本文引用: 1]

[26]

Sarwar

， Karypis

， Konstan

，et al.

Item⁃based collaborative filtering recommendation algorithms

∥Proceedings of the 10th International Conference on World Wide Web. Hong Kong，China：Association for Computing Machinery，2001：285-295.

[本文引用: 2]

[27]

于洪，王国胤，姚一豫.

决策粗糙集理论研究现状与展望

计算机学报，2015，38(8)：1628-1639.

[本文引用: 1]

， Wang

G Y

， Yao

Y Y

Current research and future perspectives on decision⁃theoretic rough sets

Chinese Journal of Computers，2015，38(8)：1628-1639.

[本文引用: 1]

[28]

王国胤，姚一豫，于洪.

粗糙集理论与应用研究综述

计算机学报，2009，32(7)：1229-1246.

[本文引用: 2]

Wang

G Y

， Yao

Y Y

， Yu

A survey on rough set theory and applications

Chinese Journal of Computers，2009，32(7)：1229-1246.

[本文引用: 2]

[29]

Yao

Y Y

Decision⁃theoretic rough set models

∥Proceedings of the 2nd International Conference on Rough Sets and Knowledge Technology. Springer Berlin Heidelberg，2007：1-12.

[本文引用: 2]

[30]

H X

， Zhou

X Z

Risk decision making based on decision⁃theoretic rough set：A three⁃way view decision model

International Journal of Compu⁃tational Intelligence Systems，2011，4(1)：1-11.

[31]

刘久兵，顾萍萍，周献中，等.

基于优化模型的直觉模糊三支群决策方法

南京大学学报(自然科学)，2018，54(5)：944-957.

[本文引用: 1]

Liu

J B

， Gu

P P

， Zhou

X Z

，et al.

A method for intuitionistic fuzzy three⁃way group decisions based on optimization models

Journal of Nanjing University (Natural Science)，2018，54(5)：944-957.

[本文引用: 1]

[32]

李华，胡奇英. 预测与决策教程. 北京：机械工业出版社，2012，349.

[本文引用: 1]

[33]

冯文权，傅征. 经济预测与决策技术.第6版. 武汉：武汉大学出版社，2018，405.

[本文引用: 1]

[34]

袁捷敏

决策效用函数两类拟合方法比较

统计与决策，2006(2)：49-50.

[本文引用: 1]

Yuan

J M

Comparison of two kinds of fitting methods for decision utility function

Statistics & Decision，2006(2)：49-50.

[本文引用: 1]

[35]

陈秀琼，黄福才.

旅行效用概率模型与旅游业滞区发展策略研究

浙江大学学报(理学版)，2007，34(6)：702-708，715.

[本文引用: 1]

Chen

X Q

， Huang

F C

Research on the probabilistic travel utility model and the strategy of developing tourism in stagnation area

Journal of Zhejiang University (Science Edition)，2007，34(6)：702-708，715.

[本文引用: 1]

[36]

Azam

， Yao

J T

Game⁃theoretic rough sets for recommender systems

Knowledge⁃Based Systems，2014(72)：96-107.

[本文引用: 2]

[37]

Shami

T M

， El⁃Saleh

A A

， Alswaitti

，et al.

Particle swarm optimization：A comprehensive survey

IEEE Access，2022(10)：10031-10061.

[本文引用: 1]

[38]

Shi

， Eberhart

R C

Empirical study of particle swarm optimization

∥Proceedings of 1999 Congress on Evolutionary Computation⁃CEC99. Washington D C，USA：IEEE，1999：1945-1950.

[本文引用: 1]

[39]

Harper

F M

， Konstan

J A

The movielens datasets：History and context

ACM Transactions on Inter⁃active Intelligent Systems，2016，5(4)：19.

[本文引用: 1]

[40]

Adomavicius

， Kwon

Y O

Improving aggregate recommendation diversity using ranking⁃based techniques

IEEE Transactions on Knowledge and Data Engineering，2012，24(5)：896-911.

[本文引用: 2]

[41]

Herlocker

J L

， Konstan

J A

， Terveen

L G

，et al.

Evaluating collaborative filtering recommender systems

ACM Transactions on Information Systems，2004，22(1)：5-53.

[本文引用: 2]

[42]

C Y

， Zhang

Q H

， Zhao

，et al.

Three⁃way recommendation model based on shadowed set with uncertainty invariance

International Journal of Approximate Reasoning，2021(135)：53-70.

[本文引用: 1]

2016

... 互联网时代数据爆炸，信息过载，庞大的信息体量在给用户带来巨大内容冲击的同时也消弭了用户的注意力与判断力，因此，过滤无用信息并筛选出用户感兴趣的内容成为一个重要的研究课题.推荐系统因其有效的过滤机制为该类问题提供了新的解决范式，它通过挖掘用户的行为与偏好来捕捉用户感兴趣但未曾留意的商品信息.在推荐系统研究领域，协同过滤是应用最广泛的算法之一^［1-2］，它利用用户对项目的历史评分数据来预测用户对未评分项目的喜好程度，并根据预测评分对用户进行推荐. ...

A state?of?the?art survey on recommendation system and prospective extensions

2020

Three?way recommender systems based on random forests

2016

... 传统的推荐系统通常选择推荐或不推荐，但若信息不充分或获取信息代价较高，直接推荐或不推荐可能会带来较大的推荐成本.因此，Zhang et al^［3-4］首次将三支决策引入推荐系统，在传统的推荐或不推荐的基础上，引入第三种策略——延迟推荐，提出三支推荐的概念. ...

Regression?based three?way recommendation

2017

A novel three?way decision model based on incomplete information system

2016

... 作为三支推荐的理论基础，三支决策（Three⁃Way Decision）是一种符合人类认知习惯的决策理论，自提出以来便获得学者的广泛关注^［5-11］，已在多个领域得到应用，如医疗诊断^［12］、投资管理^［13］、人脸识别^［14］和机器学习^［15］等.在推荐系统领域，叶晓庆等^［16］在三支推荐的基础上，利用粒计算来弥补传统协同过滤算法评分信息单一的缺陷.Ma et al^［17］提出一种结合全局和局部信息的三支推荐方法，在预测评分时考虑了全局和局部的信息.Liu and Ye^［18］将三支决策与矩阵分解相结合，提出多粒度信息下的动态三支推荐算法，根据不同粒度来动态地调整推荐列表.秦琴和张恒汝^［19］提出一种基于信任传递机制的三支推荐模型，将信任约束引入矩阵分解，可以更好地预测评分.Ye and Liu^［20］提出一种基于协同主题回归的可解释性序贯三支推荐策略，实现可解释的多层次推荐.Zhang et al^［21］提出三支朴素贝叶斯协同过滤推荐模型，结合朴素贝叶斯与协同过滤算法来处理用户评分信息的稀疏性.Ye and Liu^［22］提出一种基于成本敏感、时空特征和多粒度决策的三支推荐方法.Ye et al^［23］基于协同深度学习，提出一种多粒度序贯三支推荐方法. ...

Three?way decisions and cognitive computing

2016

An optimization?based formulation for three?way decisions

2019

Three?way confusion matrix for classification：A measure driven view

2020

Optimization?based three?way decisions with interval?valued intuitionistic fuzzy information

2023

Three?way decisions with probabilistic rough sets

2010

... 根据三支决策理论^{［10，29］}，

Ω = \{T, \neg T\}

表示对象属于T和不属于T的状态集合，

Λ = \{a_{P}, a_{B}, a_{N}\}

表示对于以上两种状态，分别采取接受决策、延迟决策或拒绝决策三种行动.在不同状态下采取三种行动的损失各不相同，表2给出了其决策代价损失.当对象处于状态

T

时，采取行动

a_{P}

，

a_{B}

和

a_{N}

分别产生代价损失

λ_{P P}

，

λ_{B P}

和

λ_{N P}

；当对象处于状态

\neg T

时，采取行动

a_{P}

，

a_{B}

和

a_{N}

分别产生代价损失

λ_{P N}

，

λ_{B N}

和

λ_{N N}

^［10］. ...

... ［10］. ...

... 根据文献［10，29-31］，规则（P）⁃（N）为三支决策，三个规则对应的域分别为正域、边界域和负域.考虑一种合理情形，即满足

λ_{P P} \leq λ_{B P} < λ_{N P}

且

λ_{N N} \leq λ_{B N} < λ_{P N},

假设边界域存在，则需满足

(λ_{B P} - λ_{P P}) (λ_{B N} - λ_{N N}) < (λ_{P N} - λ_{B N}) (λ_{N P} - λ_{B P})

.此时，上述（P）⁃（N）规则可简化为（P1）⁃（N1）. ...

... 根据贝叶斯决策理论^［10］，可得如下规则： ...

Achieving threshold consistency in three?way group decision using optimi?zation methodology and expert?weight?updating?strategy

2023

Web?based medical decision support systems for three?way medical decision making with game?theoretic rough sets

2015

Three?way government decision analysis with decision?theoretic rough sets

2012

Sequential three?way decision and granulation for cost?sensitive face recognition

2016

Ground truthing from multi?rater labeling with three?way decision and possibility theory

2021

基于协同过滤的三支粒推荐算法研究

2018

... 三支协同过滤推荐在传统协同过滤仅有推荐和不推荐两种策略的基础上，增加了第三种策略——延迟推荐，这有利于降低推荐成本.在三支协同过滤推荐中需要确定用户关于项目的偏好概率，该概率可以利用用户对项目的预测评分来进行测度^［16-23］，但不同用户的评分标准各不相同.例如，有的用户倾向给项目打更高的分数，整体评分偏高；有的则倾向较低的分数，整体评分偏低.如果仅仅考虑预测评分，则用户评分标准的不同带来的评分偏差可能会降低偏好概率的准确度.文献［16，18，21］采用最小最大值归一化方法来测度偏好概率，消除评分偏差，但值得注意的是，该方法假定所有用户的风险偏好均为风险中立型.事实上，用户对风险的态度可分为风险中立型、厌恶型和偏好型^［32］，不同风险偏好的用户评分的偏差不尽相同，仅把用户当作中立型不足以消除评分偏差.因此，在构建三支协同过滤推荐模型时，需要考虑不同用户的风险偏好.为此，本文提出一种新模型，给定用户u与候选推荐项目i，构建用户⁃项目对

(u, i)

，利用协同过滤算法预测用户对项目的评分

R_{u i}^{*}

.根据预测评分，基于用户⁃项目偏好概率模型得到用户u对项目i的偏好概率

P r o b_{u i}

；根据决策成本矩阵得出推荐规则的阈值对

α

和

β

；最后，利用用户偏好概率与阈值生成三支推荐规则，如表3所示.首先，构建用户⁃项目偏好概率模型，继而根据决策粗糙集与偏好概率导出三支推荐阈值对

α

和

β

的数学表达，最后提出确定用户偏好概率模型具体参数的方法. ...

... ，但不同用户的评分标准各不相同.例如，有的用户倾向给项目打更高的分数，整体评分偏高；有的则倾向较低的分数，整体评分偏低.如果仅仅考虑预测评分，则用户评分标准的不同带来的评分偏差可能会降低偏好概率的准确度.文献［16，18，21］采用最小最大值归一化方法来测度偏好概率，消除评分偏差，但值得注意的是，该方法假定所有用户的风险偏好均为风险中立型.事实上，用户对风险的态度可分为风险中立型、厌恶型和偏好型^［32］，不同风险偏好的用户评分的偏差不尽相同，仅把用户当作中立型不足以消除评分偏差.因此，在构建三支协同过滤推荐模型时，需要考虑不同用户的风险偏好.为此，本文提出一种新模型，给定用户u与候选推荐项目i，构建用户⁃项目对

(u, i)

，利用协同过滤算法预测用户对项目的评分

R_{u i}^{*}

.根据预测评分，基于用户⁃项目偏好概率模型得到用户u对项目i的偏好概率

P r o b_{u i}

；根据决策成本矩阵得出推荐规则的阈值对

α

和

β

α

和

β

的数学表达，最后提出确定用户偏好概率模型具体参数的方法. ...

... 从命题可知，式（6）是最小最大值归一化模型，换句话说，该模型是本文提出的用户⁃项目偏好概率模型的一种特例.因此，本文提出的模型是文献［16，18，21］中最小最大值归一化模型的拓展，更具有一般性. ...

... 对于提出的融入用户风险偏好的三支协同过滤推荐（P_CF），首先，基于协同过滤算法，利用预测评分训练集预测剩余40%的用户⁃项目集的评分.然后，基于前文算法与式（8），利用用户偏好概率模型训练集得出每个用户的偏好概率模型，其中，经调参后目标函数式（11）中的权重取

ω_{1} = 0.1

，

ω_{2} = 0.9

，三支推荐成本矩阵取

λ_{R P} = λ_{N N} = 0

，

λ_{B P} = λ_{B N} = 0.25

和

λ_{R N} = λ_{N P} = 0.8

.最后，对测试集进行三支推荐，将P_CF的推荐结果与基于最大最小值归一化模型^{［16，18，21］}的三支协同过滤推荐算法，即仅将用户视为风险中立型的算法（M_CF）的结果进行对比. ...

Three?way granular recommendation algorithm based on collaborative filtering

2018

(u, i)

，利用协同过滤算法预测用户对项目的评分

R_{u i}^{*}

.根据预测评分，基于用户⁃项目偏好概率模型得到用户u对项目i的偏好概率

P r o b_{u i}

；根据决策成本矩阵得出推荐规则的阈值对

α

和

β

α

和

β

的数学表达，最后提出确定用户偏好概率模型具体参数的方法. ...

(u, i)

，利用协同过滤算法预测用户对项目的评分

R_{u i}^{*}

.根据预测评分，基于用户⁃项目偏好概率模型得到用户u对项目i的偏好概率

P r o b_{u i}

；根据决策成本矩阵得出推荐规则的阈值对

α

和

β

α

和

β

的数学表达，最后提出确定用户偏好概率模型具体参数的方法. ...

ω_{1} = 0.1

，

ω_{2} = 0.9

，三支推荐成本矩阵取

λ_{R P} = λ_{N N} = 0

，

λ_{B P} = λ_{B N} = 0.25

和

λ_{R N} = λ_{N P} = 0.8

Three?way recommendation integrating global and local information

2018

A matrix factorization based dynamic granularity recommendation with three?way decisions

2020

(u, i)

，利用协同过滤算法预测用户对项目的评分

R_{u i}^{*}

.根据预测评分，基于用户⁃项目偏好概率模型得到用户u对项目i的偏好概率

P r o b_{u i}

；根据决策成本矩阵得出推荐规则的阈值对

α

和

β

α

和

β

的数学表达，最后提出确定用户偏好概率模型具体参数的方法. ...

ω_{1} = 0.1

，

ω_{2} = 0.9

，三支推荐成本矩阵取

λ_{R P} = λ_{N N} = 0

，

λ_{B P} = λ_{B N} = 0.25

和

λ_{R N} = λ_{N P} = 0.8

... 选取推荐成本（TC）、准确性（Accuracy）、覆盖率（Generality）、精准度（Precision）、召回率（Recall）和得分（F）作为衡量指标^{［18，41-42］}.精准度、召回率和得分是传统二支推荐的常用指标，也适用于三支推荐；准确性和覆盖率更适合用来衡量三支推荐的质量，准确性指三支推荐将项目划分到推荐和不推荐域时正确划分的比例，覆盖率指划分到推荐和不推荐域的项目占所有待推荐项目的比例，覆盖率越高表示越多用户得到系统的推荐.通常，准确性和覆盖率之间存在权衡，即为了给更多的用户推荐项目，需要牺牲一部分准确性；反之，为了更准确地向用户推荐项目，需要牺牲一部分覆盖率^［36］.上述指标的定义如下： ...

基于信任传递机制的三支推荐

2020

Three?way recommendation based on trust transfer mechanism

2020

An interpretable sequential three?way recommendation based on collaborative topic regression

2021

Three?way Naive Bayesian collaborative filtering recommen?dation model for smart city

2022

(u, i)

，利用协同过滤算法预测用户对项目的评分

R_{u i}^{*}

.根据预测评分，基于用户⁃项目偏好概率模型得到用户u对项目i的偏好概率

P r o b_{u i}

；根据决策成本矩阵得出推荐规则的阈值对

α

和

β

α

和

β

的数学表达，最后提出确定用户偏好概率模型具体参数的方法. ...

ω_{1} = 0.1

，

ω_{2} = 0.9

，三支推荐成本矩阵取

λ_{R P} = λ_{N N} = 0

，

λ_{B P} = λ_{B N} = 0.25

和

λ_{R N} = λ_{N P} = 0.8

A cost?sensitive temporal?spatial three?way recommendation with multi?granularity decision

2022

Multi?granularity sequential three?way recommendation based on collaborative deep learning

2023

(u, i)

，利用协同过滤算法预测用户对项目的评分

R_{u i}^{*}

.根据预测评分，基于用户⁃项目偏好概率模型得到用户u对项目i的偏好概率

P r o b_{u i}

；根据决策成本矩阵得出推荐规则的阈值对

α

和

β

α

和

β

的数学表达，最后提出确定用户偏好概率模型具体参数的方法. ...

A novel three?way decision model with decision?theoretic rough sets using utility theory

2018

... 通常，在三支推荐过程中，需要考虑推荐规则的划分阈值与用户对项目的偏好概率，二者均会对推荐结果产生影响，而现有文献较少对后者进行深入研究.在计算偏好概率时，一般的做法是在本质上将用户的风险态度考虑为风险中立型，然而，不同用户的风险态度可能是多样的^［24］，将所有用户的风险态度都划分为同一种会导致偏好概率测度失真，降低推荐质量. ...

... 在微观经济学中，效用是指消费者从消费某种物品中得到的满足程度；在决策领域，效用是决策者对于决策后果或决策损益值的一种感受、反应或倾向，是决策者的价值观和偏好在决策活动中的综合反映^［28］.用户在决定是否购买某种商品或服务时，既是消费者，也是决策者.作为决策者，用户的风险偏好会影响其对效用的估计，进而影响消费行为.风险中立型、厌恶型或偏好型^{［24，33］}的用户对应不同的效用函数，同一类型的用户由于具体偏好的差异，效用函数也不尽相同. ...

... 根据上述分析，用户对项目评分的高低反映项目对用户的效用大小及用户对项目的喜好程度.一般地，评分越高说明项目对于用户的效用越高，用户喜欢该项目的概率越大，但是，用户对项目的喜好程度不是影响用户对项目评分的唯一因素，用户自身的风险偏好同样会影响其对项目的评分.例如，同一效用水平下，和风险偏好型用户相比，风险厌恶型用户的评分会偏低，而风险中立型用户的评分介于二者之间，如图1所示.因此，考虑用户的不同风险偏好，基于表1，本文采用L⁃A拟合法^{［24，34］}来刻画不同风险偏好下用户关于项目的效用函数.具体地，假设： ...

Analysis of recommendation algorithms for E?commerce

2000

... 协同过滤算法是目前应用最广泛的推荐算法之一，主要包括基于用户的协同过滤^［25］和基于项目的协同过滤^［26］，后者的性能和推荐质量在很多情形下优于前者^［26］.因此，本文主要讨论基于项目的协同过滤.对于目标用户u和候选项目i，首先计算用户u已评分的项目与项目i之间的相似度，选出与项目i最相似的k个近邻项目，利用近邻项目的信息预测用户u对项目i的可能评分.主要步骤如下. ...

Item?based collaborative filtering recommendation algorithms

2001

... ［26］.因此，本文主要讨论基于项目的协同过滤.对于目标用户u和候选项目i，首先计算用户u已评分的项目与项目i之间的相似度，选出与项目i最相似的k个近邻项目，利用近邻项目的信息预测用户u对项目i的可能评分.主要步骤如下. ...

决策粗糙集理论研究现状与展望

2015

... 三支决策来源于决策粗糙集理论^［27-28］，它为决策粗糙集正域、负域、边界域给出了一种合理的语义解释.不同的域对应不同的决策规则，正域对应接受规则，负域对应拒绝规则，边界域对应不承诺或延迟决策规则.若在信息不充分的情况下仍然只考虑接受或拒绝两种选择，类似接受或拒绝一个假设，就可能会作出弃真或择假的错误决策.换言之，此时贸然作出接受或拒绝的判定，将产生错误接受或错误拒绝的成本，这两种决策成本可能高于不作任何判定的成本.在这种情形下，边界域提供的延迟决策选项能更好地体现定量决策的容错性. ...

Current research and future perspectives on decision?theoretic rough sets

2015

粗糙集理论与应用研究综述

2009

A survey on rough set theory and applications

2009

Decision?theoretic rough set models

2007

... 根据三支决策理论^{［10，29］}，

Ω = \{T, \neg T\}

表示对象属于T和不属于T的状态集合，

Λ = \{a_{P}, a_{B}, a_{N}\}

T

时，采取行动

a_{P}

，

a_{B}

和

a_{N}

分别产生代价损失

λ_{P P}

，

λ_{B P}

和

λ_{N P}

；当对象处于状态

\neg T

时，采取行动

a_{P}

，

a_{B}

和

a_{N}

分别产生代价损失

λ_{P N}

，

λ_{B N}

和

λ_{N N}

^［10］. ...

... 根据文献［10，29-31］，规则（P）⁃（N）为三支决策，三个规则对应的域分别为正域、边界域和负域.考虑一种合理情形，即满足

λ_{P P} \leq λ_{B P} < λ_{N P}

且

λ_{N N} \leq λ_{B N} < λ_{P N},

假设边界域存在，则需满足

(λ_{B P} - λ_{P P}) (λ_{B N} - λ_{N N}) < (λ_{P N} - λ_{B N}) (λ_{N P} - λ_{B P})

.此时，上述（P）⁃（N）规则可简化为（P1）⁃（N1）. ...

Risk decision making based on decision?theoretic rough set：A three?way view decision model

2011

基于优化模型的直觉模糊三支群决策方法

2018

... 根据文献［10，29-31］，规则（P）⁃（N）为三支决策，三个规则对应的域分别为正域、边界域和负域.考虑一种合理情形，即满足

λ_{P P} \leq λ_{B P} < λ_{N P}

且

λ_{N N} \leq λ_{B N} < λ_{P N},

假设边界域存在，则需满足

(λ_{B P} - λ_{P P}) (λ_{B N} - λ_{N N}) < (λ_{P N} - λ_{B N}) (λ_{N P} - λ_{B P})

.此时，上述（P）⁃（N）规则可简化为（P1）⁃（N1）. ...

A method for intuitionistic fuzzy three?way group decisions based on optimization models

2018

... 根据文献［10，29-31］，规则（P）⁃（N）为三支决策，三个规则对应的域分别为正域、边界域和负域.考虑一种合理情形，即满足

λ_{P P} \leq λ_{B P} < λ_{N P}

且

λ_{N N} \leq λ_{B N} < λ_{P N},

假设边界域存在，则需满足

(λ_{B P} - λ_{P P}) (λ_{B N} - λ_{N N}) < (λ_{P N} - λ_{B N}) (λ_{N P} - λ_{B P})

.此时，上述（P）⁃（N）规则可简化为（P1）⁃（N1）. ...

2012

(u, i)

，利用协同过滤算法预测用户对项目的评分

R_{u i}^{*}

.根据预测评分，基于用户⁃项目偏好概率模型得到用户u对项目i的偏好概率

P r o b_{u i}

；根据决策成本矩阵得出推荐规则的阈值对

α

和

β

α

和

β

的数学表达，最后提出确定用户偏好概率模型具体参数的方法. ...

2018

决策效用函数两类拟合方法比较

2006

Comparison of two kinds of fitting methods for decision utility function

2006

旅行效用概率模型与旅游业滞区发展策略研究

2007

... 预测评分是判断用户对候选推荐项目偏好程度的依据，通常预测评分越高，说明该项目对用户的效用越大，用户偏好该项目的概率越高.受文献［35］的启发，下面给出用户⁃项目效用偏好概率模型的定义. ...

Research on the probabilistic travel utility model and the strategy of developing tourism in stagnation area

2007

Game?theoretic rough sets for recommender systems

2014

... 表5中，

n_{R P}^{u}

，

n_{B P}^{u}

和

n_{N P}^{u}

分别表示将用户u喜欢的项目推荐、延迟推荐和不推荐给该用户的项目数量；

n_{R N}^{u}

，

n_{B N}^{u}

和

n_{N N}^{u}

分别表示将用户u不喜欢的项目推荐、延迟推荐和不推荐给该用户的项目数量.则用户u的三支推荐准确性（

A c c u r a c y_{u}

）定义为^［36］： ...

Particle swarm optimization：A comprehensive survey

2022

... 粒子群优化算法^［37］（Particle Swarm Optimization，PSO）是一种基于群体智能的优化算法，它模拟了鸟群、鱼群等生物集体行为的过程，通过迭代搜索找到最优解，具有较强的全局搜索能力和较好的收敛性.在粒子群算法中，假设有N个粒子和D维空间，每个粒子

i (i = 1,2, \dots, N)

拥有一个位置向量

X_{i} = (x_{i 1}, x_{i 2}, \dots, x_{i D})

和速度向量

V_{i} = (v_{i 1}, v_{i 2}, \dots, v_{i D})

.在每次迭代中，粒子

i

的个体最优位置为

P b_{i} = (P b_{i 1}, P b_{i 2}, \dots, P b_{i D})

，整个粒子群的全局最优位置为

G b = (G b_{1}, G b_{2}, \dots, G b_{D})

.利用个体最优位置和全局最优位置，可以分别采用式（12）和式（13）更新粒子

i

的速度和位置： ...

Empirical study of particle swarm optimization

... 其中，t表示第t次迭代；

c_{1}

和

c_{2}

表示学习因子，通常设置为2；

r_{1}

和

r_{2}

表示两个在

[0,1]

中随机产生的数；

η (t)

为线性递减惯性权重，满足^［38］： ...

The movielens datasets：History and context

2016

... 使用MovieLens⁃100k电影评分数据集（https：∥grouplens.org/datasets/movielens/latest）^［39］进行实验，该数据集的评分在0.5~5，评分步长为0.5.将60%的数据随机划分为预测评分训练集，将20%的数据划分为用户偏好概率模型训练集，剩下20%的数据为测试集.同时，参考文献［40］，清洗评分量过少且不具有意义的数据，所得数据集的基本信息如表6所示. ...

Improving aggregate recommendation diversity using ranking?based techniques

2012

... 为了衡量推荐结果，需要判断用户对项目的真实偏好.对于五分制评分系统，遵循推荐系统研究的通常做法^［40-41］，将用户的喜好阈值设置为3.5分. ...

Evaluating collaborative filtering recommender systems

2004

Three?way recommendation model based on shadowed set with uncertainty invariance

2021

〈

〉