南京大学学报(自然科学), 2024, 60(3): 429-441 doi: 10.13232/j.cnki.jnju.2024.03.007

结合兴趣点类别周期属性和用户短期偏好特征的推荐模型

桑春艳,1, 易星宇1, 廖世根1, 文俊浩2

1.重庆邮电大学软件学院,重庆,400065

2.重庆大学大数据与软件学院,重庆,401331

A recommendation model combining point of interest category periodic attributes and user short⁃term preference features

Sang Chunyan,1, Yi Xingyu1, Liao Shigen1, Wen Junhao2

1.School of Software Engineering, Chongqing University of Posts and Telecommunications, Chongqing, 400065, China

2.School of Big Data & Software Engineering, Chongqing University, Chongqing, 401331, China

通讯作者: E⁃mail:sangcy@cqupt.edu.cn

收稿日期: 2023-12-14  

基金资助: 国家自然科学基金.  62002037.  620720060
重庆市自然科学基金.  cstc2019jcyj⁃msxmX0588

Received: 2023-12-14  

摘要

随着基于位置的社交网络在日常生活中的广泛应用,有效提取用户的隐藏兴趣和行为序列模式并向用户提供满足其个性化需求的下一个兴趣点推荐服务成为推荐领域的热点问题之一.针对下一个兴趣点推荐中的用户偏好挖掘问题,提出基于用户兴趣点类别周期性偏好和短期兴趣相结合的兴趣点推荐模型(Combining Periodic and Spatio⁃Temporal Intervals' Network,CPSTIN).该模型将用户的签到记录按小时时段模式嵌入时间窗口并使用多头自注意力机制提取用户结合用户兴趣点类别的周期性偏好;同时,将非连续时空间隔信息送入可学习矩阵,使用线性插值法提取用户基于高阶关联性的短期兴趣.最后,在两个真实数据集上验证了该模型的有效性,证明其能有效地利用用户高阶关联性短期兴趣和结合兴趣点类别的周期偏好,更准确地预测用户最有可能访问的下一个兴趣点.

关键词: 兴趣点推荐 ; 自注意力机制 ; 线性插值嵌入 ; 类别周期兴趣

Abstract

With the widespread application of location⁃based social networks in daily life,how to effectively extract users' hidden interests and behavior sequence patterns,and provide users with the next Point of Interest (POI) recommendation service to meet their personalized needs has become one of the hot issues in the recommendation field. Aiming at the problem of user preference mining in the next POI recommendation,this paper proposes a POI recommendation model CPSTIN (Combining Periodic and Spatio⁃Temporal Intervals' Network) based on the combination of periodic preference of user POI category and short⁃term interest. The model embeds the user record of signing in into the time window by hour period pattern,and uses the multi⁃head self⁃attention mechanism to extract the the user's periodic preference combined with the category of POI. At the same time,the model sends the discontinuous spatio⁃temporal interval information into the learnable matrix,and uses the linear interpolation method to extract the user's short⁃term interest based on high⁃order correlation. Finally,the validity of the model is verified on two real datasets. The model effectively uses the user's high⁃order relevance short⁃term interest and the periodic preference based on the POI category to more accurately predict the next POI that the user is most likely to visit.

Keywords: POI recommendation ; self⁃attention ; linear interpolation embedding ; category periodic interest

PDF (1916KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

桑春艳, 易星宇, 廖世根, 文俊浩. 结合兴趣点类别周期属性和用户短期偏好特征的推荐模型. 南京大学学报(自然科学)[J], 2024, 60(3): 429-441 doi:10.13232/j.cnki.jnju.2024.03.007

Sang Chunyan, Yi Xingyu, Liao Shigen, Wen Junhao. A recommendation model combining point of interest category periodic attributes and user short⁃term preference features. Journal of nanjing University[J], 2024, 60(3): 429-441 doi:10.13232/j.cnki.jnju.2024.03.007

随着基于位置的社交网络(Location⁃Based Social Networking Service,LBSNs)在日常生活中的广泛应用,人们常在如Foursquare,Yelp,Facebook等LBSNs1上分享生活经历并发布签到记录,对海量的LBSN数据的分析挖掘可以帮助零售商向用户推荐精准的POI(Point of Interest)服务2-3.下一个兴趣点推荐能预测用户在指定时间点最有可能访问的兴趣点,其应用场景时效强,使其成为推荐领域中的热点问题4-5.

用户习惯与时空因素密切相关.针对时间效应在很大程度上影响用户偏好这一问题,Liu et al6和Kong and Wu7为了挖掘用户的长短期兴趣,提出基于时空间隔的兴趣点推荐.Kong and Wu7和Sun et al8提出了挖掘用户时间相关的长期和短期兴趣模型.Zhao et al9使用近期历史签到记录(最近时空间隔)有效地挖掘用户的短期兴趣.针对空间特性对用户行为的影响,研究人员假设用户的行动轨迹与区域相关10,提出基于网格方法的下一个兴趣点推荐模型11-12.为了挖掘用户在访问兴趣点时的周期特征,Cui et al13和Feng et al14将离散时间划分为小时、天等单位,纳入基于长短期兴趣的时间序列来挖掘用户的周期性偏好.为了挖掘非连续访问兴趣点之间的关联,Luo et al15使用时空间隔来对非连续访问兴趣点的签到建模来挖掘用户偏好.研究6-715认为,时空间隔既反映了兴趣点之间的空间信息,也反映了用户的运动规律,可以用来研究基于时空间隔的下一个兴趣点推荐.

为了挖掘用户的历史签到序列规则及其偏好16,基于循环神经网络(Recurrent Neural Network,RNN)及其改进模型相继被提出917-18.研究者819-20将基于注意力机制的技术应用于兴趣点推荐领域以挖掘历史签到的不同贡献权重,或基于深度学习和时空上下文来挖掘用户访问兴趣点的兴趣偏好71921.为了解决连续时空值的合理嵌入问题,Liu et al6提出一种线性插值方法,Luo et al15使用非连续时空间隔的线性插值嵌入法结合注意力机制来进行下一个兴趣点推荐.Vaswani et al22在挖掘具有时空效应的下一个兴趣点推荐时考虑了兴趣点类型的推荐方法.

上述研究主要通过对用户的短期兴趣及其周期性偏好进行建模以挖掘用户兴趣,但实际生活中,当用户的目标不够明确时,可能只考虑特定类型的POI而不是特定的某个POI.如图1所示,用户每周日上午的活动是固定的,但下午锻炼时除了打乒乓球,还有其他的运动类型,即不针对某一个特别的POI活动,因此,在推测该用户周日下午六点的活动时,除了早期活动的短期兴趣外,还应考虑用户结合类别的周期性偏好.

图1

图1   用户的行动轨迹

Fig.1   Diagram of a user's action trajectory


受上述工作的启发,本文提出结合类别的周期性和短期兴趣相结合的下一个兴趣点推荐模型(Combining Periodic and Spatio⁃Temporal Intervals' Network,CPSTIN),旨在联合学习高阶关联的短期兴趣和结合兴趣点类别的周期兴趣以提高推荐的准确性.首先,在周期兴趣提取模块中将用户的历史签到轨迹按每周划分为为片段后再按小时段嵌入,通过激活函数实现非线性激活来放大并突出用户按小时模式签到的语义.其次,将签到表示向量通过前馈层和多头自注意力层,每个自注意力头从自己的角度挖掘语义信息,在计算过程中使用残差模块来避免梯度消失问题.然后在短期兴趣挖掘模块中构造一个时空间隔矩阵,使用线性插值法嵌入非连续的时空间隔信息,四个可学习的转移矩阵在计算过程中将时空间隔映射到语义空间,得到用户的短期兴趣表示.最后设计了注意力查询公式,在注意力查询模块中基于用户短期兴趣和用户结合类别的周期性偏好来推荐下一个兴趣点.本文的主要贡献如下.

(1)提出一个结合兴趣点类别的周期兴趣提取模块,该模块可以将用户的签到记录按小时段模式嵌入时间窗口,并使用多头自注意力机制提取用户结合类别的周期性偏好.

(2)提出一个短期兴趣提取模块,可以在一个时间窗口内结合时空间隔信息来挖掘用户的高阶关联性短期兴趣.

(3)为了推荐下一个兴趣点,使用一种基于结合类别的周期性和短期兴趣的注意力查询兴趣点方式,并在两个真实数据集上进行实验来验证模型的有效性.

1 问题描述

随着用户访问POI的历史轨迹越来越多,有必要将其分成连续的访问片段,由此,本文引入了签到轨迹等概念.简单地说,本文的任务是给定用户历史访问记录,预测用户在下一个时间点会访问的兴趣点.以下是相关定义.

定义1

用户、兴趣点和兴趣点类别 设长度为M的用户集U=u1,u2,,uM,长度为N的兴趣点集V=v1,v2,,vN,长度为K的兴趣点类别集C=c1,c2,,cK.

定义2

用户的签到活动 一个用户的签到是一个四元组chtku=u,vtku,ck,tk,表示用户u在时间tk签到了类别为ck的兴趣点vtku.

定义3

签到序列 设用户u签到序列为su=cht1u,cht2u,,chtuu,表示用户u的所有签到活动都按时间升序排列,进而可以得到所有用户的签到序列集为SU=su1,su2,,suM.

定义4

签到轨迹 设用户u的第k条用户签到轨迹为trajku=chtku,chtk+1u,,chtk+w-1u,是签到序列中长度为w的连续子序列,用户u的签到轨迹集为traju=traj1u,traj2u,,trajtu-w+1u,所有用户的签到顺序集为trajU=traju1,traju2,,trajuM.

定义5

签到时空间隔 设用户u的第k个签到时空间隔矩阵分别为ΔkT,uΔkL,u,具体的计算方式如式(1)和式(2)所示:

ΔkT,u=tk+1-tktk+2-tktw+k-tk0tk+2-tk+1tw+k-tk+100tw+k-tw+k-1
ΔkL,u=disvk+1,vkdisvk+2,vk)disvw+k,vk0disvk+2,vk+1disvw+k,vk+100disvw+k,vw+k-1

其中,dis(vi,vj)表示兴趣点vi和兴趣点vj之间的空间距离,ΔkT,u,ΔkL,u对应定义4中的签到轨迹trajku.,此外,可以得到用户u的时间间隔矩阵集合ΔT,u=Δ1T,u,Δ2T,u,,Δtu-w+1T,u以及空间间隔矩阵集合为ΔL,u=Δ1L,u,Δ2L,u,,Δtu-w+1L,u.进而得到所有用户的时间间隔矩阵集合为ΔT,U=ΔT,u1,ΔT,u2,,ΔT,uM以及所有用户的空间间隔矩阵集合ΔL,U=ΔL,u1,ΔL,u2,,ΔL,uM.

定义6

下一个兴趣点预测任务 给定第k个用户轨迹trajku、时空间隔矩阵Δku以及所有候选兴趣点集V,将其输入模型后,输出一个长度为N的概率分布.最大概率对应的兴趣点就是模型输出的用户最有可能去的下一个兴趣点.

2 模型结构

CPSTIN模型分三个部分:结合兴趣点类别的周期兴趣提取模块、短期兴趣提取模块和注意力查询模块,模型结构如图2所示.

图2

图2   CPSTIN的结构图

Fig.2   The structure diagram of CPSTIN model


2.1 结合兴趣点类别的周期兴趣提取模块

模型利用每周小时模式处理后的时间戳信息来提取用户的周期兴趣,再使用多头自注意力机制来挖掘用户多视角结合类别的周期性偏好.

模型的周期划分采取两层时间分隔,即以每周划分为时间片段1315后,再将一周中每小时作为划分粒度进行周期提取.现实中大量用户都是以一周为长度实行每周的工作任务,即周一到周五工作学习,周六周日放松休息;同样,以每日作为长度实行工作计划也是符合用户工作特点的;而以每月作为时间长度,更符合用户长期的生活习惯和规律.此外,第二个划分中对于更细粒度划分的任务规划,以每小时划分是合适的,但以每12小时划分则更符合实际情况.

CPSTIN模型需要将用户签到轨迹,即trajku送入多模态嵌入层来学习密集向量表示.为了获取用户的小时模式,首先要将连续的时间戳划分成7×24小时的时隙表示,即0~167表示每周的某个小时,例如,0表示星期一的凌晨0点到1点.由此可得用户、兴趣点和签到时间的向量表达式为eiuembeicembeitemb.然后,模型采取向量相加得到每个用户签到的表达向量,如式(3)所示,在某些情况下还可以考虑向量拼接.

jointi=eiu+eiv+eic+eit,jointiemb

接着,将签到表达向量放入激活函数中,如式(4)所示,用来挖掘用户的周期小时模式.

C=Softsignjoint=joint1+joint

Softsign函数是tanh函数的替代品,但为梯度下降问题提供了比tanh函数更好的解决方案.

CPSTIN模型希望从用户的历史签到表示向量中得到用户多角度结合类别的周期性偏好,例如,用户可以在特定时间访问特定的POI,或在特定时间访问特定类型的POI.众所周知,多头自注意力机制来源于机器翻译模型Transformer22,自注意力机制的不足之处在于它在对当前情况编码时会过于关注自己所在的位置,而多头自注意力机制允许每个自注意力头从自己角度分别学习语义.与一般Transformer中的编码器不同,CPSTIN模型不采用位置编码,因为在这个模块中不强调位置序列顺序,而是从每个嵌入中提取周期性.基于这种考虑,CPSTIN模型采用不加位置编码的多头自注意力,从多个角度提取用户签到的语义信息,以便从不同角度收集用户的周期性兴趣偏好.语义模型可以从原文本中以不同的程度和角度提取语义信息,多头自注意力机制模块通过对多个头计算结果进行拼接操作得到多语义表示向量.这里希望模型的每个自注意力头都能从自己的角度获取用户的周期性偏好信息,在计算过程中,一个注意力头需要三个可训练矩阵,再对用户签到表示向量进行线性变换得到查询Q、键值对KV.具体的相关公式如下:

P=Concathead1,head2,,headhWO
headi=AttentionCWiQ,CWiK,CWiV
AttentionQ,K,V=SoftmaxQKTdk

其中,C是用户签到表示向量,WQWVWKC进行线性变换的可训练矩阵,dkWQWVWK的嵌入维度.计算时,将输入C和可学习矩阵WQWVWK进行线性运算得到KQV,然后KQ进行点积运算得到注意力分数矩阵.向量的重要程度越高,注意力分数值越大.为了防止梯度消失,需要在得到注意力分数矩阵后除以dk.

FFNP=LeakyReLUPW1+b1W2+b2
PeriodU=Fx+x

其中,W1W2b1b2是可学习参数;LeakyReLU是非线性激活函数,即上文介绍的多头自注意力机制的计算和前馈神经网络计算,所以这里计算了两次残差操作.

尽管多头自注意力方法从各个角度获取了用户结合类别的周期性偏好,但本质上仍然是在进行线性计算,多角度的偏好信息没有融合,输入和输出的维度不一致.在多头自注意力机制之后,将Encoder模块的前馈神经网络(Feed Forward Networks,FFN)放置在模型中,可以更好地处理上述问题,如式(8)所示.使用LeakyReLU来代替ReLU,其优点是在不丢失关键信息的情况下为负输入值提供计算.此外,基于深度学习的模型在训练过程中可能会出现梯度消失和权重矩阵退化的问题,为了解决这个问题,需要在多头注意力计算和前馈神经网络计算过程中加入残差机制.

2.2 短期兴趣提取模块

短期时间内的时空间隔信息反映了用户访问兴趣点的短期兴趣和日常习惯.另一方面,时空间隔是一组连续的数值,如果将连续的时空间隔直接用于模型训练,训练可能有困难.常用的连续数值嵌入方法,如分桶法,其阈值范围必须手动选择,阈值的合理性直接影响模型的表达能力.因此,模型需要利用一种能够非线性地捕获特征信息并适用于时空嵌入场景的策略.受文献[615]的启发,本文使用一种简单的线性插值方法在时间和空间维度中嵌入时空间隔数值,时空转移矩阵也被添加到模型架构中,以便非线性地提取特征信息,从而提高时空预测性能.首先,根据用户u的访问轨迹可以获取其第k个签到时空间隔矩阵ΔkT,u,ΔkL,u.其次,对所有用户的时空间隔集合取最大和最小值,其中时间间隔的最大最小值分别为UpperΔT,ULowerΔT,U,空间间隔分别为UpperΔL,ULowerΔL,U.最后通过线性插值法计算后进行向量相加,得到用户的短期偏好表示,如式(10)~(12)所示:

eiΔT=LITΔkT,u=TΔTUUpperΔT,U-ΔkT,u+TΔTLΔkT,u-LowerΔT,UUpperΔT,U-LowerΔT,U
eiΔL=LITΔkL,u=TΔLUUpperΔL,U-ΔkL,u+TΔLLΔkL,u-LowerΔL,UUpperΔL,U-LowerΔL,U
eiΔ=eiΔT+eiΔL

其中,UpperΔTLowerΔT以及UpperΔLLowerΔL分别为时间和空间间隔的最大和最小值,TΔTTΔL分别是时间和空间间隔的可学习矩阵.

2.3 注意力查询模块

在模型中嵌入所有兴趣点,得到兴趣点嵌入向量表示candidatePOI=

e1v,e2v,,e1N,其中,候选兴趣点的嵌入与多模态嵌入层兴趣点的嵌入共享相同的向量空间.注意力查询的计算如式(13)和式(14)所示:

prob=QuerycandidatePOI,PeriodU,eiΔ
QueryQ,K,V=SoftmaxQKTV

此外,在训练过程中,模型会遇到严重的样本偏斜问题.此时,对于每个正样本,需要计算L-1个阴性样本,因此损失对推动正确预测的动量的权重很小.这里模型使用随机负采样算法生成负样本来进行模型训练,即可以随机地将交叉熵损失函数中使用的负样本数量设置为超参数neg,此举有效地增强了正样本对于参数训练的正向影响,具体计算损失值的损失函数如式(15)所示:

L=-i=1neg+1yilgprobyi+1-yilg1-probyi

3 实验

在NYC和TKY数据集上,从三方面对CPSTIN模型的有效性进行验证.

RQ1:CPSTIN是否优于其他基于注意力机制的模型?

RQ2:CPSTIN是否优于其他基于地理位置的模型?

RQ3:CPSTIN能否捕获用户结合类别的周期性兴趣以及他们的短期兴趣?

3.1 实验设置

3.1.1 数据集

使用2012年4月至2013年2月在Foursquare上收集的两个真实数据集NYC(纽约)和TKY(东京),表1给出了两个数据集的统计情况,其中,NYC数据集有1083个用户和5135个兴趣点,用户的总签到次数为147938次,产生轨迹115509条,数据的稀疏度为97.3398%.原始数据集中的每条数据包含用户ID、类别、经纬度、用户签到时间等,因此兴趣点类别数据由原始数据集提供.采用词袋模型按照兴趣点的类别,将数据类别划分为0~k,如表1所示,NYC和TKY数据集的类别数分别为209和190.

表1   实验使用的数据集的统计数据

Table 1  Statistical description of datastes used in experiments

数据集用户POI类别签到轨迹稀疏度
NYC1083513520914793811550997.33%
TKY2293787319044757037882599.31%

新窗口打开| 下载CSV


NYC和TKY数据集中的兴趣点分布如图3所示,删除兴趣点访问次数少于10次和用户访问次数少于10次的用户签到.如图4所示,数据集显示用户对于兴趣点的签到频率约为每天一次,但显然用户一天内不会只访问一个兴趣点,这意味着数据集没有记录用户的每一次兴趣点访问.此外,表1所示的兴趣点个数远大于类别数量,意味着由于数据的缺失将大量兴趣点ID转换为固定维度的向量空间会导致信息丢失,而融入类别特征能够很好地缓解这个问题.

图3

图3   两个数据集中兴趣点的分布情况

Fig.3   The distribution of POI in two datasets


图4

图4   签到次数对应的时间长度的折线图(a)和箱线图(b)

Fig.4   Line (a) and box (b) charts of check⁃in times


3.1.2 评估方法

使用Recall@KMRR@K作为模型的评估指标.Recall@K为推荐的相关结果占真实结果的比例,因为本文的任务为下一个兴趣点推荐,即Recall@KHit@K相同.另一方面,MRR@K重视“顺序性”,即模型推荐的兴趣点以更突出的位置呈现给用户.Recall@KMRR@K的提高代表模型性能的提高,计算如下:

Recall@K=1UuUVuTVuPVuT
MRR@K=1UuU1pu

3.1.3 基准模型

将CPSTIN与以下基准模型进行比较实验,实验结果如表2所示.

表2   CPSTIN与几种基准模型在NYC和TKY数据集上的对比实验结果

Table 2  Experimental results of CPSTIN and benchmark models on the NYC and TKY datasets

NYCTKY
Recall@5Recall@10MRR@5MRR@10Recall@5Recall@10MRR@5MRR@10
OURS0.69960.74910.56430.57100.64350.70650.50530.5138
NSSR0.24460.25660.21620.21790.19360.21230.16770.1702
FPMC0.37270.53920.21920.23770.15280.21550.09670.1049
ATSTLSTM0.29230.39510.18590.19960.31650.43300.18940.2050
PLSPL0.32210.39620.21170.22180.34380.42070.22710.2374
STAN0.36340.51460.19880.21890.25000.33000.16450.1756
CORE0.52260.59910.37380.38330.42080.47710.29750.3053
LSTM0.50240.59860.33110.34370.42190.51080.28240.2944
LightSANs0.51250.57710.35110.36000.45660.55560.30200.3155
HST⁃LSTM0.53040.62300.36790.38070.41050.48730.29060.3009
GeoSAN0.42970.58410.25920.27940.56290.69420.36260.3798
DeepMove0.57820.68570.38470.39940.50320.60040.33580.3489
LSTPM0.59930.70840.41840.43350.50310.58770.35640.3679

新窗口打开| 下载CSV


LSTM23:长短期记忆网络,是比较著名的循环神经网络之一.

FPMC24:是基于马尔可夫链和矩阵分解的序列推荐模型.

PLSPL25:将长短期模块分别用于捕捉用户个性化的长期兴趣和短期兴趣,在技术层面加入了LSTM模块和注意力机制.

STAN15:是利用非连续时空间隔信息和注意力机制的先进的下一个兴趣点推荐模型.

NSSR26:是一种使用自注意力机制的先进的序列推荐模型.

LSTPM8:是考虑经纬度地理坐标以获得用户长短期兴趣的基于LSTM的模型.

DeepMove14:是采用递归神经网络和注意力机制的先进的兴趣点预测模型.

ATSTLSTM19:是融合了时空间隔和注意力机制的基于LSTM的兴趣点推荐模型.

GeoSAN11:是一种使用GPS网格嵌入而没有使用空间间隔的自注意力机制的先进的模型.

HST⁃LSTM7:是一种将时空效应纳入LSTM模型来缓解兴趣点预测问题中的数据稀疏性问题的模型.

CORE27:是一个简单有效的session推荐模型,可以统一编码和解码过程的表示空间.

LightSANs28:是一个先进的基于图神经网络的序列推荐模型,通过低秩分解的自注意机制对上下文感知表示进行了更有效和精确的建模.

在NYC数据集上,CPSTIN的Recall@K优于FPMC大约20%;在TKY数据集上,由于签到数据更复杂,所以CPSTIN的效果更好.FPMC等基于马尔可夫链的模型在挖掘连续序列相关性上有优异的表现,但不擅长捕捉非连续签到的规律,而STAN善于挖掘这种非连续访问的规律,所以其Recall@KMRR@K优于FPMC.高阶时空相关性反映了用户历史签到活动的时空特征对下一步行动的影响,一定程度上反映了用户的短期兴趣,因此基于时空特性的模型(如ATST⁃LSTM,LSTPM和HST⁃LSTM),其评价指标都优于FPMC.历史轨迹中的时空相关性反映了时空特征对下一步行动的影响,以LSTPM为例,利用LSTM来挖掘用户的长短期兴趣,同时也考虑非连续序列位置,因此其效果优于经典模型.与LSTPM相比,CPSTIN还考虑了时空间隔的影响,所以其Recall@KMRR@K表现更好.

因为注意力机制能挖掘用户历史轨迹对当前状态的影响,因此,基于注意力机制的模型(如PLSPL,GeoSAN和DeepMove),其评价指标通常优于仅基于RNN的模型.此外,DeepMove利用GRU结合注意力模块挖掘用户的周期性偏好和短期序列规律性.GeoSAN使用一种对地理位置网格建模的方式与自注意力机制相结合,在两个数据集上的Recall@10都达到了60%~70%.所以,将包含时间因素的DeepMove与GeoSAN进行比较,能处理时间信息的模型DeepMove的性能略胜一筹.

CPSTIN挖掘用户结合类别的周期性偏好和高阶关联性短期兴趣,其Recall@K比LSTPM和DeepMove领先10%~15%;与先进的图神经网络模型LightSANs相比,Recall@K领先约18%;与先进的session推荐模型CORE相比,Recall@K领先约25%.

3.1.4 基参数设置

训练开始前需要在CPSTIN模型中设置多头自注意力机制的“头数”,本文取值为8;时间窗口设置为30;时间戳的嵌入设置为168对应每周的小时跨度.使用Adam优化器优化模型,学习率为0.003.模型的收敛情况如图5所示.

图5

图5   训练收敛情况

Fig.5   Training convergence situation


3.2 时间周期长度研究

为了研究两层时间分隔给提取周期偏好带来的影响,设计了如下模型进行对比实验.

TD1:以每天为时间片段划分后,计算当前时间为这天的第几小时.

TW1:以每周为时间片段划分后,计算当前时间为这周的第几小时,是实验的默认设置.

TWD:以每周为时间片段划分后,计算当前时间为这周的第几天.

TMD:以每月为时间片段划分后,计算当前时间为这个月的第几天.

TMW:以每月为时间片段划分后,计算当前时间为这个月的第几周.

以月为第一层划分后,如果再以小时划分,粒度会过小,因此本文采用更符合现实意义的每月每天的划分来设计TMD,实验结果如表3所示.由表可见,TW1的结果最优.TW1表示以每周为时间片段,以每小时为周期,生活中完成一个兴趣点的访问大多在小时阶段结束,因此,时间划分粒度过大会使TMW的效果略差.

表3   周期划分对实验结果的影响

Table 3  Periodic division experiment

NYCTKY
Recall@5MRR@10Recall@5MRR@5
TD10.69370.55670.61500.4699
TW10.69960.56430.64350.5053
TWD0.68380.55240.40990.2718
TMD0.69260.55820.63230.4859
TMW0.20850.11040.19520.1093

新窗口打开| 下载CSV


3.3 稳定性研究

探索超参数设置对CPSTIN模型性能的影响:batch尺寸、轨迹时间窗口尺寸、注意力头和嵌入维度,实验中默认设置为64,64,8和30.在进行稳定性实验之前需要注意控制变量,即每次实验中,只有一个超参数的数值发生变化,其余参数保持不变.

batch尺寸的影响:实验中分别设置为16,32,64,128和256,实验结果如图6a所示.batch尺寸位于16,64时,模型在NYC数据集上的Recall@5可达68%以上;batch尺寸位于64,128时,模型在TKY数据集上的Recall@5可达64%以上.从数据集大小看,NYC比TKY数据集的规模小,因此收敛速度更快.此外,如果batch尺寸设置得太大,可能会降低梯度下降的随机性,对网络训练产生负面影响.

图6

图6   超参数设置对CPSTIN模型性能的影响

Fig.6   The impact of hyperparameter settings on the performance of CPSTIN models


轨迹时间窗口大小的影响:实验中设置为30,60,90和120,实验结果如图6b所示.模型在TKY数据集上的Recall@5稳定在64%以上,可见在TKY数据集上,模型对窗口大小不敏感.窗口大小位于30,60时,模型在NYC数据集上的Recall@5虽然在68%以上,但已经开始下降,窗口大于90后,模型性能急速下降.因为CPSTIN模型的优势在于提取用户短期兴趣,当窗口大小为30时,涵盖的持续时间大约为1.5个月,所以时间窗口大于30后,用户的历史序列的变长使模型在NYC数据集上的表现力下降.

注意力头数的影响:实验中分别设置为1,2,4,8和16,实验结果如图6c所示.表面上注意力头数越多,挖掘用户结合类别的周期性偏好的能力就越好,但在本文中并非如此,因为这里注意力模块的目标是从不同角度来挖掘用户在一周内的小时模式并结合类别的周期性偏好,所以适量的注意力头数就足以在短期内从多个角度挖掘周期偏好模式.由图可见,当头数为1,2,4时,模型比较稳定且效果较好.

嵌入维度的影响:实验中分别设置为16,32,64,128和256,实验结果如图6d所示.在NYC数据集上,嵌入维度位于32,128时,Recall@5达68%以上;在TKY数据集上,嵌入维度位于32,64时,Recall@5可达63%以上.合适的嵌入维度能提高模型的表现力,但不合理地提高嵌入维度会使模型的复杂度显著增加,给模型训练带来挑战.为了简化模型,将用户、兴趣点和处理后的时间戳嵌入同一维度,根据经验公式kn4k16,n为词汇表大小,当嵌入维度位于32,64时满足公式且效果最好.

3.4 消融实验

通过消融实验来评估模型中每个模块的效果.实验的基准模型是CPSTIN,包括结合类别的周期性兴趣提取模块、高阶相关性短期兴趣提取模块和注意力查询模块.其中,结合类别的周期性兴趣提取模块利用用户签到时间戳和用户签到兴趣点的类型来挖掘用户访问兴趣点、兴趣点类型的周期性偏好,并利用多头自注意力机制来从多个角度提取信息.高阶相关的短期兴趣提取模块使用时空间隔来挖掘用户偏好.为了生成变体,删除模型的一些关键部分以产生变体模型.

CPSTIN⁃S:该模型忽略时间间隔的影响,只考虑用户在空间层面的短期偏好和结合类别的周期偏好.

CPSTIN⁃T:该模型忽略空间间隔,只考虑时间层面的短期偏好和结合类别的周期偏好.

CPSTIN⁃seq:该模型在挖掘用户周期性偏好时忽略时间和类型影响,只考虑用户轨迹的序列相关性.

CPSTIN⁃NA:该模型在挖掘用户的短期周期性偏好时没有使用自注意力机制,即从单一角度挖掘用户的周期性偏好.

实验结果如图7所示,由图可见,在NYC和TKY数据集上,CPSTIN⁃T和CPSTIN⁃S的Recall@KMRR@K比CPSTIN低20%~30%.由于CPSTIN⁃S缺少时间间隔输入,即无法挖掘用户基于时间层面的短期偏好,使模型性能下降.由于CPSTIN⁃T缺乏空间间隔数据,无法挖掘用户空间层面的短期偏好,使模型性能下降.CPSTIN⁃seq忽略了签到时间戳及兴趣点类别数据,无法挖掘用户访问兴趣点的周期及其结合类别的偏好,即只能挖掘用户访问兴趣点的序列规律,Recall@KMRR@K下降了20%左右.

图7

图7   CPSTIN模型中各模块的消融实验

Fig.7   Ablation experiments of each module in the CPSTIN model


3.5 用户轨迹研究

从数据集中随机选择一个用户实例进行讨论,图8描绘了一名用户的真实轨迹.该用户在该时间段内的活动范围是六个POI,可见每个POI的签到时间是相同的,每周第9小时访问第3713个POI,每周第13小时访问第3714个POI.若模型需要在本周的第13小时向用户推荐POI,根据周期规律应推荐第3714个POI;若用户已经访问第3713个POI,模型会根据时空间隔的规律推荐第3714个POI.因此,该模型能在时空区域内挖掘用户访问POI的规则.

图8

图8   用户真实轨迹实例

Fig.8   Example diagram of user's real trajectory


从数据集中提取ID为1088的用户移动轨迹来探索高阶关联性的周期和短期兴趣.如图9所示,用户会在每周末下午3:00-4:00参拜神社,可见此用户有定期参拜神社的周期偏好规律;另外,该用户在河边打卡前会先在火车站、音像店、书店打卡,但是单独在书店打卡后不会接着前往河边打卡,说明该用户也符合高阶时空关联性的规律.在此类数据集上CPSTIN的性能良好,意味着CPSTIN具有挖掘周期性偏好和高阶关联性的短期偏好的能力.

图9

图9   用户签到的周期性和时空间隔规律性示例

Fig.9   Example of periodicity and spatiotemporal interval regularity of user check⁃in


3.6 周期注意力权重的可视化

图10展示了多头自注意力分数对模型挖掘用户结合类别的周期性偏好的影响,具体是对该用户前11次签到的兴趣点注意力分数进行Softmax函数操作,各个签到中的兴趣点之间的关联度越高,颜色越深.根据坐标方位进行叙述解释,例如,坐标2,3是从上到下第三行,从左到右第四列.图10a中坐标3,55,56,57,5以及8,5颜色较深,而签到中的第5~8个兴趣点都是每周一凌晨五点签到的,可见第一个注意力头捕获了这个周期偏好规律.图10b中坐标0,11,12,14,1以及9,1颜色较深,因为第0~4个兴趣点的打卡时间是这周周一凌晨4点,第三个兴趣点是学院类型兴趣点,而第0,1,2,4,9个兴趣点都是美食类的兴趣点,即此次注意力头的关注点既有时间周期又有兴趣点类型.

图10

图10   注意力头可视化

Fig.10   Example diagram of user's real trajectory


综上,每个自注意力头都可根据自己的角度来提取相关语义信息,使其能够有效地挖掘用户结合兴趣点类别的周期兴趣.

4 结论

本文提出可以挖掘用户结合类别的周期性偏好以及访问兴趣点的高阶关联性短期兴趣的模型CPSTIN,该模型应用每周中的小时模式签到时间记录和兴趣点类型来提取用户的周期性偏好,并使用多头自注意力机制从多个角度来挖掘用户结合类别的周期性偏好.此外,模型应用线性插值法嵌入时空间隔数据以挖掘具有高阶关联性的短期兴趣,不仅提高了网络的非线性拟合能力,也使模型在训练过程中更容易收敛.最后,模型改进了一种兴趣点查询方式,将用户结合类别的周期性偏好与高阶关联性的短期兴趣相结合以找到用户最有可能访问的下一个兴趣点.实验证明,模型在考虑用户短期偏好和结合兴趣点类别的周期偏好的情况下,性能有所提升,其Recall@KMRR@K在NYC数据集上领先约0.24和0.28,在TKY数据集上领先约0.26和0.25.

今后将研究更合理的时空信息计算方法,同时使用更加丰富的上下文信息,如社会关系等,以提高模型的性能,缓解数据稀疏性问题,还将关注较长的用户序列轨迹建模来提取用户长期兴趣等.

参考文献

Sánchez PBellogín A.

Point⁃of⁃interest recom⁃mender systems based on location⁃based social networks:A survey from an experimental perspective

ACM Computing Surveys,202254(11s):223.

[本文引用: 1]

Lian D FZheng KGe Yet al.

GeoMF++:Scalable location recommendation via joint geographical modeling and matrix factorization

ACM Transactions on Information Systems,201836(3):33.

[本文引用: 1]

Wang D JWang X LXiang Z Zet al.

Attentive sequential model based on graph neural network for next poi recommendation

World Wide Web,202124(6):2161-2184.

[本文引用: 1]

Li R ZShen Y YZhu Y M.

Next point⁃of⁃interest recommendation with temporal and multi⁃level context attention

Proceedings of 2018 IEEE International Conference on Data Mining. Singapore,SingaporeIEEE20181110-1115.

[本文引用: 1]

Zhao S LKing ILyu M R.

A survey of point⁃of⁃interest recommendation in location⁃based social networks

2016,arXiv:.

[本文引用: 1]

Liu QWu SWang Let al.

Predicting the next location:A recurrent model with spatial and temporal contexts

Proceedings of the 30th AAAI Conference on Artificial Intelligence. Phoenix,AZ,USAAAAI Press2016194-200.

[本文引用: 4]

Kong D JWu F.

HST⁃LSTM:A hierarchical spatial⁃temporal long⁃short term memory network for location prediction

Proceedings of the 27th International Joint Conference on Artificial Intelligence. Stockholm,SwedenAAAI Press20182341-2347.

[本文引用: 5]

Sun KQian T YChen Tet al.

Where to go next:Modeling long⁃and short⁃term user preferences for point⁃of⁃interest recommendation

Proceedings of the 34th AAAI Conference on Artificial Intelligence. New York,NY USAAAAI Press202034214-221.

[本文引用: 3]

Zhao P PLuo A JLiu Y Cet al.

Where to go next:A spatio⁃temporal gated network for next POI recommendation

IEEE Transactions on Knowledge and Data Engineering,202234(5):2512-2524.

[本文引用: 2]

袁华钱宇杨锐.

基于GPS轨迹的用户兴趣点及频繁路径挖掘研究

系统工程理论与实践,201535(5):1276-1282.

[本文引用: 1]

Yuan HQian YYang J.

Research on GPS⁃trajectory⁃based personalization POI and path mining

Systems Engineering⁃Theory & Practice,201535(5):1276-1282.

[本文引用: 1]

Lian D FWu Y JGe Yet al.

Geography⁃aware sequential location recommendation

Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. San Diego,CA,USAACM20202009-2019.

[本文引用: 2]

Zhao KZZhang YYin HZet al.

Discovering subsequence patterns for next POI recommendation

Proceedings of the 29th International Joint Conference on Artificial Intelligence. Yokohama,Japanijcai.org2021,Article No.445.

[本文引用: 1]

Cui QZhang CRZhang YFet al.

ST⁃PIL:Spatial⁃temporal periodic interest learning for next point⁃of⁃interest recommendation

Proceedings of the 30th ACM International Conference on Information & Knowledge Management. Queensland,AustraliaACM20212960-2964.

[本文引用: 2]

Feng JLi YZhang Cet al.

DeepMove:Predicting human mobility with attentional recurrent networks

Proceedings of 2018 World Wide Web Conference. Lyon,FranceACM20181459-1468.

[本文引用: 2]

Luo Y TLiu QLiu Z C.

STAN:Spatio⁃temporal attention network for next location recommen⁃dation

Proceedings of the Web Conference 2021. Ljubljana,SloveniaACM20212177-2185.

[本文引用: 6]

雒晓辉吴云王晨星.

基于用户长短期偏好的序列推荐模型

计算机科学,202350(4):47-55.

[本文引用: 1]

Luo X HWu YWang C Xet al.

Sequential recommendation model based on user's long and short term preference

Computer Science,202350(4):47-55.

[本文引用: 1]

Zhan G HXu JHuang Z Fet al.

A semantic sequential correlation based LSTM model for next POI recommendation

Proceedings of the 20th IEEE International Conference on Mobile Data Management. Hong Kong,ChinaIEEE2019128-137.

[本文引用: 1]

Manotumruksa JMacdonald COunis I.

A contextual attention recurrent architecture for context⁃aware venue recommendation

Proceedings of the 41st International ACM SIGIR Conference on Research & Development in Information Retrieval. Ann Arbor,MI,USAACM2018555-564.

[本文引用: 1]

Huang L WMa Y TWang S Bet al.

An attention⁃based spatiotemporal LSTM network for next POI recommendation

IEEE Transactions on Services Computing,202114(6):1585-1597.

[本文引用: 3]

Xia Q XHara TMaekawa Tet al.

An effective and efficient self⁃attention based model for next POI recommendation

Proceedings of 2023 IEEE Inter⁃national Conference on Pervasive Computing and Communications Workshops and other Affiliated Events. Atlanta,GA,USAIEEE2023478-483.

[本文引用: 1]

Zhang H XBai W CDing J Yet al.

Time⁃aware POI recommendation based on multi⁃grained location grouping

Proceedings of the 26th International Conference on Computer Supported Cooperative Work in Design. Rio de Janeiro,BrazilIEEE20231796-1801.

[本文引用: 1]

Vaswani AShazeer NParmar Net al.

Attention is all you need

Proceedings of the 31st International Conference on Neural Information Processing Systems. Long Beach,CA,USACurran Associates Inc.20176000-6010.

[本文引用: 2]

Hochreiter SSchmidhuber J.

Long short⁃term memory

Neural Computation,19979(8):1735-1780.

[本文引用: 1]

Rendle SFreudenthaler CSchmidt⁃Thieme L.

Factorizing personalized Markov chains for next⁃basket recommendation

Proceedings of the 19th International Conference on World Wide Web. Raleigh,NC,USAACM2010811-820.

[本文引用: 1]

Wu Y XLi KZhao G Set al.

Personalized long⁃and short⁃term preference learning for next POI recommendation

IEEE Transactions on Knowledge and Data Engineering,202234(4):1944-1957.

[本文引用: 1]

Chen G JZhao G SZhu Let al.

Combining non⁃sampling and self⁃attention for sequential recommen⁃dation

Information Processing & Management,202259(2):102814.

[本文引用: 1]

Hou Y PHu B BZhang Z Qet al.

CORE:Simple and effective session⁃based recommendation within consistent representation space

Proceedings of the 45th International ACM SIGIR Conference on Research and Development in Information Retrieval. Madrid,SpainACM20221796-1801.

[本文引用: 1]

Fan X YLiu ZLian J Xet al.

Lighter and better:Low⁃rank decomposed self⁃attention networks for next⁃item recommendation

Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval. Montréal,CanadaACM20211733-1737.

[本文引用: 1]

/