Recommender systems play an important role in internet applications,with the core task of recommending the most relevant items to users. However,the large⁃scale,sparse,or high⁃dimensional datasets often lead to serious bias problems. In recent years,multi⁃task learning has become an effective method for addressing bias in recommender systems,allowing multiple related tasks to be learned simultaneously,thus fully utilizing the intrinsic structure and correlation of the datasets. Researchers recently proposed entire space counterfactual conversion rate prediction,which uses inverse propensity score and doubly robust methods to estimate the performance of recommendation algorithms. However,theoretical analysis has revealed that inaccurate propensity score estimation and interpolation errors often lead to estimation bias,which frequently occurs in practice,thereby affecting the accuracy and reliability of recommendations. We therefore introduce uncertainty estimation,combining multi⁃task learning to measure the reliability of feedback data by computing the probability distribution for each user,to mitigate model overfitting in sparse or noisy data and effectively improve system generalization to reduce bias. Experimental results show that multi⁃task learning with uncertainty estimation can better adapt to uncertain environments and has broad prospects in recommender systems.
Wu Tongzhou, Liu Qiang, Wang Liang. De⁃biasing method for multi⁃task learning in recommender systems based on uncertainty estimation. Journal of nanjing University[J], 2023, 59(4): 543-549 doi:10.13232/j.cnki.jnju.2023.04.001
推荐算法根据用户的历史行为数据和偏好来为用户针对性地推荐商品,然而目前的推荐任务存在一些问题.例如,由于曝光空间的局限性,缺失的点击数据并不意味着一定是用户的负面反馈,还有可能是用户根本没有看到这些商品[1],造成一些隐式反馈数据的丢失,比如用户对未浏览和未收藏的物品的兴趣程度[2]的缺失会使推荐算法偏向于推荐那些有反馈的物品[3],因而出现选择偏差(Selection Bias,SB)[4],而且这种选择是非随机性的(Missing Not At Random,MNAR)[5],这会使预测难以准确.此外,推荐系统的数据存在数据稀疏和冷启动的问题等等,在很大程度上影响了预测的准确性和可靠性.所以,本文采取了新的方法来同时解决数据和多任务指标的问题.
ESMM (Entire Space Multi⁃Task Model)[4]模型旨在解决样本选择偏差和数据稀疏问题,也是本文工作的基础.它采用双塔模型分别对CTR和CVR建模,在全样本空间学习主任务CTR和辅助任务CTCVR来隐式地学习CVR任务.此外,CVR与CTR模型共享嵌入层(Embedding,将离散变量转为连续向量表示的一种方式)来缓解CVR样本稀疏的问题.训练过程中,损失函数由CTR与CTCVR任务的损失函数组成.ESMM模型巧妙地利用了任务间的相关性,较好地解决了偏差问题,但依旧存在预测值偏小等缺点.
ESCM²⁃IPS(逆倾向评分,Inverse Propensity Scoring)[7]模型是ESMM的一次重要升级.ESMM的CTR预估一般在曝光空间进行优化,但当这种曝光不是随机的时候,CTR的预估值很可能就不是基于真实值的无偏估计[13].引入曝光的倾向性评分作为损失函数的样本权重可以解决这种偏差,相当于低曝光倾向的商品反而被点击,其权重更高,基于逆概率加权(Inverse Probability Weighting,IPW)学习到的CTR预估值可视为基于全样本空间真实CTR的无偏估计.训练中通过最小化IPS得分的损失函数来训练模型可以减少非随机性丢失带来的误差,提高模型的准确性和泛化性能.但是,IPS方法存在一个主要问题,它的结果对偏差非常敏感,如果历史数据中存在较大的偏差数值,IPS方法就可能发生过度修正,影响推荐效果.
Unbiased recommender learning from missing?not?at?random implicit feedback
1
2020
... 推荐算法根据用户的历史行为数据和偏好来为用户针对性地推荐商品,然而目前的推荐任务存在一些问题.例如,由于曝光空间的局限性,缺失的点击数据并不意味着一定是用户的负面反馈,还有可能是用户根本没有看到这些商品[1],造成一些隐式反馈数据的丢失,比如用户对未浏览和未收藏的物品的兴趣程度[2]的缺失会使推荐算法偏向于推荐那些有反馈的物品[3],因而出现选择偏差(Selection Bias,SB)[4],而且这种选择是非随机性的(Missing Not At Random,MNAR)[5],这会使预测难以准确.此外,推荐系统的数据存在数据稀疏和冷启动的问题等等,在很大程度上影响了预测的准确性和可靠性.所以,本文采取了新的方法来同时解决数据和多任务指标的问题. ...
Modeling delayed feedback in display advertising
1
2014
... 推荐算法根据用户的历史行为数据和偏好来为用户针对性地推荐商品,然而目前的推荐任务存在一些问题.例如,由于曝光空间的局限性,缺失的点击数据并不意味着一定是用户的负面反馈,还有可能是用户根本没有看到这些商品[1],造成一些隐式反馈数据的丢失,比如用户对未浏览和未收藏的物品的兴趣程度[2]的缺失会使推荐算法偏向于推荐那些有反馈的物品[3],因而出现选择偏差(Selection Bias,SB)[4],而且这种选择是非随机性的(Missing Not At Random,MNAR)[5],这会使预测难以准确.此外,推荐系统的数据存在数据稀疏和冷启动的问题等等,在很大程度上影响了预测的准确性和可靠性.所以,本文采取了新的方法来同时解决数据和多任务指标的问题. ...
Deep content?based music recommendation
1
2013
... 推荐算法根据用户的历史行为数据和偏好来为用户针对性地推荐商品,然而目前的推荐任务存在一些问题.例如,由于曝光空间的局限性,缺失的点击数据并不意味着一定是用户的负面反馈,还有可能是用户根本没有看到这些商品[1],造成一些隐式反馈数据的丢失,比如用户对未浏览和未收藏的物品的兴趣程度[2]的缺失会使推荐算法偏向于推荐那些有反馈的物品[3],因而出现选择偏差(Selection Bias,SB)[4],而且这种选择是非随机性的(Missing Not At Random,MNAR)[5],这会使预测难以准确.此外,推荐系统的数据存在数据稀疏和冷启动的问题等等,在很大程度上影响了预测的准确性和可靠性.所以,本文采取了新的方法来同时解决数据和多任务指标的问题. ...
Entire space multi?task model:An effective approach for estimating post?click conversion rate
4
2018
... 推荐算法根据用户的历史行为数据和偏好来为用户针对性地推荐商品,然而目前的推荐任务存在一些问题.例如,由于曝光空间的局限性,缺失的点击数据并不意味着一定是用户的负面反馈,还有可能是用户根本没有看到这些商品[1],造成一些隐式反馈数据的丢失,比如用户对未浏览和未收藏的物品的兴趣程度[2]的缺失会使推荐算法偏向于推荐那些有反馈的物品[3],因而出现选择偏差(Selection Bias,SB)[4],而且这种选择是非随机性的(Missing Not At Random,MNAR)[5],这会使预测难以准确.此外,推荐系统的数据存在数据稀疏和冷启动的问题等等,在很大程度上影响了预测的准确性和可靠性.所以,本文采取了新的方法来同时解决数据和多任务指标的问题. ...
... ESMM (Entire Space Multi⁃Task Model)[4]模型旨在解决样本选择偏差和数据稀疏问题,也是本文工作的基础.它采用双塔模型分别对CTR和CVR建模,在全样本空间学习主任务CTR和辅助任务CTCVR来隐式地学习CVR任务.此外,CVR与CTR模型共享嵌入层(Embedding,将离散变量转为连续向量表示的一种方式)来缓解CVR样本稀疏的问题.训练过程中,损失函数由CTR与CTCVR任务的损失函数组成.ESMM模型巧妙地利用了任务间的相关性,较好地解决了偏差问题,但依旧存在预测值偏小等缺点. ...
... 在点击率和转化率的建模方面采用几种比较有竞争力的方法进行实验.基准模型选取ESMM[4],ESCM²⁃IPS[10]和ESCM²⁃DR[10],用AUC (Area Under Curve)来衡量CTR和CVR的预测能力. ...
Doubly robust joint learning for recommendation on data missing not at random
2
2019
... 推荐算法根据用户的历史行为数据和偏好来为用户针对性地推荐商品,然而目前的推荐任务存在一些问题.例如,由于曝光空间的局限性,缺失的点击数据并不意味着一定是用户的负面反馈,还有可能是用户根本没有看到这些商品[1],造成一些隐式反馈数据的丢失,比如用户对未浏览和未收藏的物品的兴趣程度[2]的缺失会使推荐算法偏向于推荐那些有反馈的物品[3],因而出现选择偏差(Selection Bias,SB)[4],而且这种选择是非随机性的(Missing Not At Random,MNAR)[5],这会使预测难以准确.此外,推荐系统的数据存在数据稀疏和冷启动的问题等等,在很大程度上影响了预测的准确性和可靠性.所以,本文采取了新的方法来同时解决数据和多任务指标的问题. ...