With the advent of the Internet era,the recommendation system has become a powerful assistant for people to screen Internet resources. Traditional recommendation systems use users' rating information to calculate user similarity and recommend resources for users,but there are still various problems such as cold start and data sparseness,which greatly affect the quality of recommendation. The traditional matrix decomposition mainly calculates the similarity between users and resources through a scoring matrix,searches for the neighbors of users and resources,and predicts users' rating of resources through the neighbor set. However,due to the huge amount of resources on the network,users can only rate and evaluate a small part of them,so there is very little scoring data that can be used,and the data sparseness is very serious. In recent years,the appearance of tags has brought new opportunities for recommendation systems. Tags specifically and accurately describe users' interests and preferences. The recommendation system can more accurately understand users' preferences through tag attributes,so as to make personalized recommendations for users,greatly improving the accuracy of recommendation and user satisfaction. Social tags are of great value for the recommendation and sharing of resources,and provide a strong basis for personalized recommendations. Finding the connection between users and resources through social tags is bound to improve recommendation efficiency,greatly increase user satisfaction,and bring new opportunities for resource sharing and recommendation. According to tags,items or resources can be classified. Because the label covers the characteristics of the resource,it provides a reliable basis for the classification of the resource. Searching through tags can better fit users' ideas and opinions,and make the search more accurate. Use the tags that the user usually annotates to recommend resources or users with tags with high similarity of tags that the user is interested in,so that the potential interests of the user can be mined,and personalized recommendation to the user can be realized. At present,many websites have already used social tags to varying degrees,thereby enhancing user satisfaction and loyalty,and creating huge revenue for the website. The gradual rise of labels on the Internet has made more and more users accustomed to labeling their favorite resources. This label can not only represent users' preferences,but also describe the attributes of the product. Making full use of these label information can effectively improve the accuracy of recommendation and alleviate data sparseness. In this paper,the relationship between tag attributes and ratings is used to calculate user tag similarity. Users' and resource information are used to calculate user similarity. Both are integrated into the matrix decomposition model to strengthen the recommendation basis and improve the accuracy of recommendation. Experimental results show that the RMSE of the proposed algorithm UTagJMF reduces about 2% on the ml⁃latest⁃small dataset,and reduces about 2.2% on the Hetrec2011⁃movielens⁃2k dataset. Therefore,the proposed algorithm model effectively alleviate the adverse effects of data sparsity,and has a significantly better prediction effect than other algorithms.
Keywords:recommend system
;
tag
;
interests and preferences
;
user tag similarity matrix
;
Jaccard similarity matrix
Wu Cong, Ma Wenming, Wang Bing, Zhu Jianhao. Matrix factorization algorithm combined with user tag similarity. Journal of nanjing University[J], 2022, 58(1): 143-152 doi:10.13232/j.cnki.jnju.2022.01.014
随着时代的进步和科技的迅猛发展,很多研究者将各种相关因素引入矩阵分解推荐算法,比如上下文信息、社交因素.Ma et al[15]通过融合用户项目矩阵和社交信任网络来为用户进行推荐.Koren[16]在矩阵分解算法中引入时间因素,能有效提高预测精度.Gantner et al[17]认为对用户或项目的属性进行分解,建立属性矩阵分解模型,可以有效提高推荐准确度.Zhao and Xiao[18]认为用户经常选择的都是特定种类的资源,但会参考与他兴趣偏好类似的用户,因此提出融入项目分类和用户兴趣的矩阵分解模型.杨强等[19]将信任传递融合到矩阵分解模型中,提出基于信任传递的矩阵分解算法.Zhang et al[20]和Yu et al[21]在传统的矩阵分解模型上融合用户的近邻关系,不仅可以丰富单个用户的信息,还能更好地对各用户进行建模.
很多研究者将评分外的标签信息引入推荐系统来提升推荐质量.Zhen et al[24]提出,如果两个用户打过的标签相似度很高,则这两个用户很可能含有相似的隐含特征向量,可以使用标签信息来对概率矩阵分解正则化.Diederich and Iofciu[25]通过基于标签的最近邻算法得到相似的用户集合.Heung⁃Nam et al[26]通过标签为资源聚类,计算不同聚类间的相似度,提出基于网页内容的推荐系统.Eck et al[27]通过提取mp3音频的特征构建标签信息来为用户进行音乐的推荐.Zhao et al[28]用简单向量法代表用户偏好,通过标签的TF⁃IDF权重向量来计算用户之间的相似度.Firan et al[29]提出基于标签的音乐推荐系统,标签既可以表示资源的属性和种类,也可以表明用户偏好,通过使用标签的频率就可以判断用户更欣赏哪种音乐.
SoRec:Social recommendation using probabilistic matrix factorization
1
2008
... 随着时代的进步和科技的迅猛发展,很多研究者将各种相关因素引入矩阵分解推荐算法,比如上下文信息、社交因素.Ma et al[15]通过融合用户项目矩阵和社交信任网络来为用户进行推荐.Koren[16]在矩阵分解算法中引入时间因素,能有效提高预测精度.Gantner et al[17]认为对用户或项目的属性进行分解,建立属性矩阵分解模型,可以有效提高推荐准确度.Zhao and Xiao[18]认为用户经常选择的都是特定种类的资源,但会参考与他兴趣偏好类似的用户,因此提出融入项目分类和用户兴趣的矩阵分解模型.杨强等[19]将信任传递融合到矩阵分解模型中,提出基于信任传递的矩阵分解算法.Zhang et al[20]和Yu et al[21]在传统的矩阵分解模型上融合用户的近邻关系,不仅可以丰富单个用户的信息,还能更好地对各用户进行建模. ...
Collaborative filtering with temporal dynamics
1
2010
... 随着时代的进步和科技的迅猛发展,很多研究者将各种相关因素引入矩阵分解推荐算法,比如上下文信息、社交因素.Ma et al[15]通过融合用户项目矩阵和社交信任网络来为用户进行推荐.Koren[16]在矩阵分解算法中引入时间因素,能有效提高预测精度.Gantner et al[17]认为对用户或项目的属性进行分解,建立属性矩阵分解模型,可以有效提高推荐准确度.Zhao and Xiao[18]认为用户经常选择的都是特定种类的资源,但会参考与他兴趣偏好类似的用户,因此提出融入项目分类和用户兴趣的矩阵分解模型.杨强等[19]将信任传递融合到矩阵分解模型中,提出基于信任传递的矩阵分解算法.Zhang et al[20]和Yu et al[21]在传统的矩阵分解模型上融合用户的近邻关系,不仅可以丰富单个用户的信息,还能更好地对各用户进行建模. ...
Learning attribute?to?feature mappings for cold?start recommendations
1
2010
... 随着时代的进步和科技的迅猛发展,很多研究者将各种相关因素引入矩阵分解推荐算法,比如上下文信息、社交因素.Ma et al[15]通过融合用户项目矩阵和社交信任网络来为用户进行推荐.Koren[16]在矩阵分解算法中引入时间因素,能有效提高预测精度.Gantner et al[17]认为对用户或项目的属性进行分解,建立属性矩阵分解模型,可以有效提高推荐准确度.Zhao and Xiao[18]认为用户经常选择的都是特定种类的资源,但会参考与他兴趣偏好类似的用户,因此提出融入项目分类和用户兴趣的矩阵分解模型.杨强等[19]将信任传递融合到矩阵分解模型中,提出基于信任传递的矩阵分解算法.Zhang et al[20]和Yu et al[21]在传统的矩阵分解模型上融合用户的近邻关系,不仅可以丰富单个用户的信息,还能更好地对各用户进行建模. ...
Matrix factorization based models considering item categories and user neighbors
1
2015
... 随着时代的进步和科技的迅猛发展,很多研究者将各种相关因素引入矩阵分解推荐算法,比如上下文信息、社交因素.Ma et al[15]通过融合用户项目矩阵和社交信任网络来为用户进行推荐.Koren[16]在矩阵分解算法中引入时间因素,能有效提高预测精度.Gantner et al[17]认为对用户或项目的属性进行分解,建立属性矩阵分解模型,可以有效提高推荐准确度.Zhao and Xiao[18]认为用户经常选择的都是特定种类的资源,但会参考与他兴趣偏好类似的用户,因此提出融入项目分类和用户兴趣的矩阵分解模型.杨强等[19]将信任传递融合到矩阵分解模型中,提出基于信任传递的矩阵分解算法.Zhang et al[20]和Yu et al[21]在传统的矩阵分解模型上融合用户的近邻关系,不仅可以丰富单个用户的信息,还能更好地对各用户进行建模. ...
信任传递的矩阵分解推荐算法
1
2015
... 随着时代的进步和科技的迅猛发展,很多研究者将各种相关因素引入矩阵分解推荐算法,比如上下文信息、社交因素.Ma et al[15]通过融合用户项目矩阵和社交信任网络来为用户进行推荐.Koren[16]在矩阵分解算法中引入时间因素,能有效提高预测精度.Gantner et al[17]认为对用户或项目的属性进行分解,建立属性矩阵分解模型,可以有效提高推荐准确度.Zhao and Xiao[18]认为用户经常选择的都是特定种类的资源,但会参考与他兴趣偏好类似的用户,因此提出融入项目分类和用户兴趣的矩阵分解模型.杨强等[19]将信任传递融合到矩阵分解模型中,提出基于信任传递的矩阵分解算法.Zhang et al[20]和Yu et al[21]在传统的矩阵分解模型上融合用户的近邻关系,不仅可以丰富单个用户的信息,还能更好地对各用户进行建模. ...
信任传递的矩阵分解推荐算法
1
2015
... 随着时代的进步和科技的迅猛发展,很多研究者将各种相关因素引入矩阵分解推荐算法,比如上下文信息、社交因素.Ma et al[15]通过融合用户项目矩阵和社交信任网络来为用户进行推荐.Koren[16]在矩阵分解算法中引入时间因素,能有效提高预测精度.Gantner et al[17]认为对用户或项目的属性进行分解,建立属性矩阵分解模型,可以有效提高推荐准确度.Zhao and Xiao[18]认为用户经常选择的都是特定种类的资源,但会参考与他兴趣偏好类似的用户,因此提出融入项目分类和用户兴趣的矩阵分解模型.杨强等[19]将信任传递融合到矩阵分解模型中,提出基于信任传递的矩阵分解算法.Zhang et al[20]和Yu et al[21]在传统的矩阵分解模型上融合用户的近邻关系,不仅可以丰富单个用户的信息,还能更好地对各用户进行建模. ...
A collaborative filtering recommendation algorithm based on information of community experts
1
2018
... 随着时代的进步和科技的迅猛发展,很多研究者将各种相关因素引入矩阵分解推荐算法,比如上下文信息、社交因素.Ma et al[15]通过融合用户项目矩阵和社交信任网络来为用户进行推荐.Koren[16]在矩阵分解算法中引入时间因素,能有效提高预测精度.Gantner et al[17]认为对用户或项目的属性进行分解,建立属性矩阵分解模型,可以有效提高推荐准确度.Zhao and Xiao[18]认为用户经常选择的都是特定种类的资源,但会参考与他兴趣偏好类似的用户,因此提出融入项目分类和用户兴趣的矩阵分解模型.杨强等[19]将信任传递融合到矩阵分解模型中,提出基于信任传递的矩阵分解算法.Zhang et al[20]和Yu et al[21]在传统的矩阵分解模型上融合用户的近邻关系,不仅可以丰富单个用户的信息,还能更好地对各用户进行建模. ...
Integrating user social status and matrix factorization for item recommendation
1
2018
... 随着时代的进步和科技的迅猛发展,很多研究者将各种相关因素引入矩阵分解推荐算法,比如上下文信息、社交因素.Ma et al[15]通过融合用户项目矩阵和社交信任网络来为用户进行推荐.Koren[16]在矩阵分解算法中引入时间因素,能有效提高预测精度.Gantner et al[17]认为对用户或项目的属性进行分解,建立属性矩阵分解模型,可以有效提高推荐准确度.Zhao and Xiao[18]认为用户经常选择的都是特定种类的资源,但会参考与他兴趣偏好类似的用户,因此提出融入项目分类和用户兴趣的矩阵分解模型.杨强等[19]将信任传递融合到矩阵分解模型中,提出基于信任传递的矩阵分解算法.Zhang et al[20]和Yu et al[21]在传统的矩阵分解模型上融合用户的近邻关系,不仅可以丰富单个用户的信息,还能更好地对各用户进行建模. ...
... 很多研究者将评分外的标签信息引入推荐系统来提升推荐质量.Zhen et al[24]提出,如果两个用户打过的标签相似度很高,则这两个用户很可能含有相似的隐含特征向量,可以使用标签信息来对概率矩阵分解正则化.Diederich and Iofciu[25]通过基于标签的最近邻算法得到相似的用户集合.Heung⁃Nam et al[26]通过标签为资源聚类,计算不同聚类间的相似度,提出基于网页内容的推荐系统.Eck et al[27]通过提取mp3音频的特征构建标签信息来为用户进行音乐的推荐.Zhao et al[28]用简单向量法代表用户偏好,通过标签的TF⁃IDF权重向量来计算用户之间的相似度.Firan et al[29]提出基于标签的音乐推荐系统,标签既可以表示资源的属性和种类,也可以表明用户偏好,通过使用标签的频率就可以判断用户更欣赏哪种音乐. ...
Finding communities of practice from user profiles based on folksonomies
1
2006
... 很多研究者将评分外的标签信息引入推荐系统来提升推荐质量.Zhen et al[24]提出,如果两个用户打过的标签相似度很高,则这两个用户很可能含有相似的隐含特征向量,可以使用标签信息来对概率矩阵分解正则化.Diederich and Iofciu[25]通过基于标签的最近邻算法得到相似的用户集合.Heung⁃Nam et al[26]通过标签为资源聚类,计算不同聚类间的相似度,提出基于网页内容的推荐系统.Eck et al[27]通过提取mp3音频的特征构建标签信息来为用户进行音乐的推荐.Zhao et al[28]用简单向量法代表用户偏好,通过标签的TF⁃IDF权重向量来计算用户之间的相似度.Firan et al[29]提出基于标签的音乐推荐系统,标签既可以表示资源的属性和种类,也可以表明用户偏好,通过使用标签的频率就可以判断用户更欣赏哪种音乐. ...
Leveraging collaborative filtering to tag?based personalized search
1
2011
... 很多研究者将评分外的标签信息引入推荐系统来提升推荐质量.Zhen et al[24]提出,如果两个用户打过的标签相似度很高,则这两个用户很可能含有相似的隐含特征向量,可以使用标签信息来对概率矩阵分解正则化.Diederich and Iofciu[25]通过基于标签的最近邻算法得到相似的用户集合.Heung⁃Nam et al[26]通过标签为资源聚类,计算不同聚类间的相似度,提出基于网页内容的推荐系统.Eck et al[27]通过提取mp3音频的特征构建标签信息来为用户进行音乐的推荐.Zhao et al[28]用简单向量法代表用户偏好,通过标签的TF⁃IDF权重向量来计算用户之间的相似度.Firan et al[29]提出基于标签的音乐推荐系统,标签既可以表示资源的属性和种类,也可以表明用户偏好,通过使用标签的频率就可以判断用户更欣赏哪种音乐. ...
Automatic generation of social tags for music recommendation
1
2007
... 很多研究者将评分外的标签信息引入推荐系统来提升推荐质量.Zhen et al[24]提出,如果两个用户打过的标签相似度很高,则这两个用户很可能含有相似的隐含特征向量,可以使用标签信息来对概率矩阵分解正则化.Diederich and Iofciu[25]通过基于标签的最近邻算法得到相似的用户集合.Heung⁃Nam et al[26]通过标签为资源聚类,计算不同聚类间的相似度,提出基于网页内容的推荐系统.Eck et al[27]通过提取mp3音频的特征构建标签信息来为用户进行音乐的推荐.Zhao et al[28]用简单向量法代表用户偏好,通过标签的TF⁃IDF权重向量来计算用户之间的相似度.Firan et al[29]提出基于标签的音乐推荐系统,标签既可以表示资源的属性和种类,也可以表明用户偏好,通过使用标签的频率就可以判断用户更欣赏哪种音乐. ...
Improved recommendation based on collaborative tagging behaviors
1
2008
... 很多研究者将评分外的标签信息引入推荐系统来提升推荐质量.Zhen et al[24]提出,如果两个用户打过的标签相似度很高,则这两个用户很可能含有相似的隐含特征向量,可以使用标签信息来对概率矩阵分解正则化.Diederich and Iofciu[25]通过基于标签的最近邻算法得到相似的用户集合.Heung⁃Nam et al[26]通过标签为资源聚类,计算不同聚类间的相似度,提出基于网页内容的推荐系统.Eck et al[27]通过提取mp3音频的特征构建标签信息来为用户进行音乐的推荐.Zhao et al[28]用简单向量法代表用户偏好,通过标签的TF⁃IDF权重向量来计算用户之间的相似度.Firan et al[29]提出基于标签的音乐推荐系统,标签既可以表示资源的属性和种类,也可以表明用户偏好,通过使用标签的频率就可以判断用户更欣赏哪种音乐. ...
The benefit of using tag?based profiles
1
2007
... 很多研究者将评分外的标签信息引入推荐系统来提升推荐质量.Zhen et al[24]提出,如果两个用户打过的标签相似度很高,则这两个用户很可能含有相似的隐含特征向量,可以使用标签信息来对概率矩阵分解正则化.Diederich and Iofciu[25]通过基于标签的最近邻算法得到相似的用户集合.Heung⁃Nam et al[26]通过标签为资源聚类,计算不同聚类间的相似度,提出基于网页内容的推荐系统.Eck et al[27]通过提取mp3音频的特征构建标签信息来为用户进行音乐的推荐.Zhao et al[28]用简单向量法代表用户偏好,通过标签的TF⁃IDF权重向量来计算用户之间的相似度.Firan et al[29]提出基于标签的音乐推荐系统,标签既可以表示资源的属性和种类,也可以表明用户偏好,通过使用标签的频率就可以判断用户更欣赏哪种音乐. ...