基于行为感知图神经网络的推荐处理方法、服务器及介质

1.本发明涉及数据挖掘技术领域，尤其涉及的是基于行为感知图神经网络的推荐处理方法、服务器及介质。

背景技术：

2.随着大数据的持续发展，网络中每天都会产生海量的数据，而为了应对信息爆炸时代信息过载的问题，人们提出了智能推荐的概念。而在推荐系统的不同研究分支中，基于会话的推荐旨在根据用户在会话中的行为序列向用户推荐下一个可能的交互物品。
3.传统的基于会话的推荐只使用单一类型的用户行为序列，往往会面临数据稀疏的问题。例如在电子商务场景中，电商公司的最终目标是引导用户购买商品以获取利润，而购买行为的数据是非常稀疏的。由于用户的兴趣是多样的，而购买数据确是稀疏的，仅使用传统的基于会话的推荐算法对购买序列进行建模会导致性能不佳，无法准确的向用户推荐用户希望购买的物品。幸运的是，现实世界电子商务平台中会话的行为序列通常是异构的，即由不止一种类型的行为组成，例如购买和浏览。基于此出现的，利用会话的异构行为序列中更丰富的信息来提高预测目标行为的推荐性能的方法，我们将其称为基于会话的异构推荐(heterogeneous session-based recommendation，简称hsbr)。
4.然而，现有技术中对hsbr的研究均侧重于如何在序列建模中区分不同类型的行为或利用在每种行为序列内的同构行为转换(homogeneous behavior transitions)，都没有显式地利用不同类型行为序列之间的异构行为转换(heterogeneous behavior transitions)。例如用户通常会在做出购买决定之前浏览一些物品来比较，这表示浏览行为之间的转换表征着相似性，而从浏览到购买的转换可能表示一种递进的关系。所以现有的hsbr可能会因无法捕捉不同类型行为之间转换的语义关系也导致推荐精确度不高的问题出现。
5.由上可见，现有技术中基于会话的异构推荐依旧无法提供精确度较高的物品推荐，即目标行为预测。
6.因此，现有技术还有待改进和发展。

技术实现要素：

7.针对现有技术中，基于会话的异构推荐均侧重于研究如何在序列建模中区分不同类型的行为或利用在每种行为序列内的同构行为转换，而都没有显式地利用不同类型行为序列之间的异构行为转换，因此导致无法捕捉不同类型行为之间转换的语义关系并导致推荐性能不理想的问题。
8.本发明提供一种基于行为感知图神经网络的推荐处理方法，具体包括：获取每个异构行为会话，将各异构行为会话分别分为目标行为序列以及辅助行为序列，其中，所述异构行为会话为包含两种或两种以上用户对物品的不同行为的数据。基于所述目标行为序列，通过预先构建的同构行为转换图学习得到目标行为序列物品表征，并通过所述目标行
为序列物品表征计算得到目标行为序列表征；基于所述辅助行为序列，通过预先构建的同构行为转换图以及异构行为转换图学习得到辅助行为序列物品表征，并通过所述辅助行为序列物品表征计算得到辅助行为序列表征；基于所述目标行为序列表征以及辅助行为序列表征，融合得到会话表征；基于所述会话表征计算得到物品的预测分数，并根据所述预测分数向用户推荐物品。可见本发明方案提出一种基于双通道学习策略的行为感知图神经网络，其中，所述双通道包括目标通道以及辅助通道。通过预先以图的形式对异构行为转换进行建模，并将其应用于辅助通道，使辅助行为序列对目标行为序列的贡献更加清晰，实现提高推荐性能，即推荐准确度的效果。
9.为了实现上述技术效果，本发明第一方面提供一种基于行为感知图神经网络的推荐处理方法，其中，上述方法包括：
10.获取每个异构行为会话，将各异构行为会话分别分为目标行为序列以及辅助行为序列，其中，所述异构行为会话为包含两种或两种以上用户对物品的不同行为的数据。
11.基于所述目标行为序列，通过预先构建的同构行为转换图学习得到目标行为序列物品表征，并通过所述目标行为序列物品表征计算得到目标行为序列表征；
12.基于所述辅助行为序列，通过预先构建的同构行为转换图以及异构行为转换图学习得到辅助行为序列物品表征，并通过所述辅助行为序列物品表征计算得到辅助行为序列表征；
13.基于所述目标行为序列表征以及辅助行为序列表征，融合得到会话表征；
14.基于所述会话表征计算得到物品的预测分数，并根据所述预测分数向用户推荐物品。
15.可选的，上述获取每个异构行为会话，将各异构行为会话分别分为目标行为序列以及辅助行为序列，其中，所述异构行为会话为包含两种或两种以上用户对物品的不同行为的数据的步骤之前包括：
16.预先获取所有异构行为会话，并将所有异构行为会话分为全局目标行为序列以及全局辅助行为序列；
17.通过捕获所述全局目标行为序列以及全局辅助行为序列中的同构行为转换信息，构建同构行为转换图；
18.通过捕获所述全局目标行为序列以及全局辅助行为序列之间的异构行为转换信息，构建异构行为转换图。
19.可选的，上述通过捕获所述全局目标行为序列以及全局辅助行为序列中的同构行为转换信息，构建同构行为转换图的步骤包括：
20.基于所述全局辅助行为序列以及全局目标行为序列，将异构行为会话中的物品作为节点，并在具有同构行为转换关系的两个连续物品之间构建同构行为转换边；
21.所述同构行为转换关系包括从辅助行为到辅助行为，以及从目标行为到目标行为的转换关系。
22.可选的，上述通过捕获所述全局目标行为序列以及全局辅助行为序列之间的异构行为转换信息，构建异构行为转换图的步骤包括：
23.基于所述全局辅助行为序列以及全局目标行为序列，将异构行为会话中的物品作为节点，并在具有定向异构行为转换关系的两个连续物品之间构建异构行为转换边；
24.所述定向异构行为转换关系包括从辅助行为到目标行为的转换关系。
25.可选的，上述基于所述目标行为序列，通过预先构建的同构行为转换图学习得到目标行为序列物品表征，并通过所述目标行为序列物品表征计算得到目标行为序列表征的步骤包括：
26.通过将所述目标行为序列的每一物品在所述同构行为转换图中进行传递，学习得到目标行为序列物品表征；
27.基于所述目标行为序列物品表征，计算得到目标行为序列表征。
28.可选的，上述基于所述辅助行为序列，通过预先构建的同构行为转换图以及异构行为转换图学习得到辅助行为序列物品表征，并通过所述辅助行为序列物品表征计算得到辅助行为序列表征的步骤包括：
29.通过将所述辅助行为序列的每一物品在所述同构行为转换图中进行传递，学习得到关于所述辅助行为序列物品表征的第一视图物品表征；
30.基于所述目标行为序列表征，通过将所述辅助行为序列的每一物品在所述异构行为转换图中进行个性化传递，学习得到关于所述辅助行为序列物品表征的第二视图物品表征；
31.通过将所述第一视图物品表征以及第二视图物品表征进行权衡与融合，得到辅助行为序列物品表征；
32.基于所述辅助行为序列物品表征，计算得到辅助行为序列表征。
33.可选的，上述基于所述目标行为序列表征，通过将所述辅助行为序列的每一物品在所述异构行为转换图中进行个性化传递，学习得到关于所述辅助行为序列物品表征的第二视图物品表征的步骤包括：
34.基于所述异构行为转换图，为每个物品节点定义两组具有定向异构行为转换的相邻节点，其中，所述定向异构行为转换包括从辅助行为到目标行为的行为转换；
35.基于所述目标行为序列表征，自适应调整各相邻节点的重要程度；
36.基于所述重要程度，将所述辅助行为序列的每一物品在所述异构行为转换图中进行个性化传递，学习得到关于所述辅助行为序列表征的第二视图物品表征。
37.可选的，上述基于所述会话表征计算得到物品的预测分数，并根据所述预测分数向用户推荐物品的步骤还包括：
38.基于所述会话表征计算得到物品的预测分数，并利用所述预测分数判断模型是否收敛。
39.本发明第二方面提供一种服务器，上述服务器包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的基于行为感知图神经网络的推荐处理方法程序，所述基于行为感知图神经网络的推荐处理方法程序被所述处理器执行时实现如上述任意一项所述基于行为感知图神经网络的推荐处理方法的步骤。
40.本发明第三方面提供一种非临时性计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上述任意一项所述一种基于行为感知图神经网络的推荐处理方法的步骤。
41.由上可见，本发明方案获取每个异构行为会话，将各异构行为会话分别分为目标行为序列以及辅助行为序列，其中，所述异构行为会话为包含两种或两种以上用户对物品
的不同行为的数据。基于所述目标行为序列，通过预先构建的同构行为转换图学习得到目标行为序列物品表征，并通过所述目标行为序列物品表征计算得到目标行为序列表征；基于所述辅助行为序列，通过预先构建的同构行为转换图以及异构行为转换图学习得到辅助行为序列物品表征，并通过所述辅助行为序列物品表征计算得到辅助行为序列表征；基于所述目标行为序列表征以及辅助行为序列表征，融合得到会话表征；基于所述会话表征计算得到物品的预测分数，并根据所述预测分数向用户推荐物品。由于本发明方案采用双通道的学习策略区分不同类型的行为序列建模，并更多地关注辅助行为序列的建模。利用预先建立的异构行为转换图对辅助行为进行更加细粒度的建模，旨在明确利用所述异构行为转换图中目标行为导向的语义关系信息，实现高准确度的推荐效果。
附图说明
42.为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。
43.图1是本发明实施例提供的一种基于行为感知图神经网络的推荐处理方法的流程示意图；
44.图2是本发明实施例提供的构建同构行为转换图和构建异构行为转换图的示意图；
45.图3是本发明实施例提供的基于行为感知图神经网络的推荐处理方法bgnn的示意图；
46.图4是本发明实施例图1中步骤s200的具体流程示意图；
47.图5是本发明实施例图1中步骤s300的具体流程示意图；
48.图6是本发明实施例提供的bgnn算法和其他十二个基线的推荐性能对比的示意图；
49.图7是本发明实施例提供的bgnn算法和mgnn-spred-w算法浏览和购买的表征以及目标物品的表征可视化示意图；
50.图8是本发明实施例提供的一种服务器的内部结构原理框图。
具体实施方式
51.以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本发明实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况下，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本发明的描述。
52.应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
53.还应当理解，在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下
文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。
54.下面结合本发明实施例的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。
55.在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是本发明还可以采用其它不同于在此描述的方式来实施，本领域技术人员可以在不违背本发明内涵的情况下做类似推广，因此本发明不受下面公开的具体实施例的限制。
56.智能推荐是在这个信息爆炸的时代缓解信息过载问题的技术。在推荐系统的不同研究分支中，基于会话的推荐旨在根据用户在会话中的行为序列向用户推荐下一个可能的交互物品。在传统的基于会话的推荐中，常使用单一类型的用户行为序列进行建模，导致推荐性能不佳，人们将该种推荐称为同构推荐。而现实世界电子商务平台中会话的行为序列通常是异构的，即由不止一种类型的行为组成，例如购买和浏览。我们将此类研究问题称为基于会话的异构推荐(heterogeneous session-based recommendation，简称hsbr)。
57.现有技术中基于会话的异构推荐可以分为两类，分别是基于rnn的方法以及基于gnn的方法。基于rnn的方法例如rib使用行为表征来区分异构会话中不同类型的行为，并将物品表征和行为表征的拼接作为门循环单元的输入层。但基于rnn的方法应用于本领域时的推荐效果并不如基于gnn的方法。基于gnn的方法mgnn-spred，它基于所有会话中两种类型的同构行为序列(即浏览序列和购买序列)以构建全局多关系物品图，并使用gnn方法来增强物品表征的学习。虽然mgnn-spred通过利用同构行为转换信息加强了物品表征的学习，但其对不同类型行为序列的建模是相同的，导致浏览和购买物品在特征空间中会得到相同的表征，这可能会限制模型的表达能力。
58.为了解决现有技术中存在的问题，本发明提供一种基于行为感知图神经网络的推荐处理方法，在本发明实施例中，获取每个异构行为会话，将各异构行为会话分别分为目标行为序列以及辅助行为序列，其中，所述异构行为会话为包含两种或两种以上用户对物品的不同行为的数据。基于所述目标行为序列，通过预先构建的同构行为转换图学习得到目标行为序列物品表征，并通过所述目标行为序列物品表征计算得到目标行为序列表征；基于所述辅助行为序列，通过预先构建的同构行为转换图以及异构行为转换图学习得到辅助行为序列物品表征，并通过所述辅助行为序列物品表征计算得到辅助行为序列表征；基于所述目标行为序列表征以及辅助行为序列表征，融合得到会话表征；基于所述会话表征计算得到物品的预测分数，并根据所述预测分数向用户推荐物品。因此，相较于现有技术中仅关注同构行为转换的方案，本发明通过预先构建的异构行为转换图对辅助行为序列的进行更加细粒度的建模，更多的关注不同类型行为之间转换的语义关系，以提高推荐的精确度。
59.示例性方法
60.如图1所示，本发明实施例提供一种基于行为感知图神经网络的推荐处理方法，上述方法包括如下步骤：
61.步骤s100、获取每个异构行为会话，将各异构行为会话分别分为目标行为序列以及辅助行为序列，其中，所述异构行为会话为包含两种或两种以上用户对物品的不同行为的数据。
62.在本实施例中，首先获取每一个用于训练或预测的异构行为会话，并将各异构行为会话分别分为目标行为序列以及辅助行为序列两部分，其中，所述异构行为会话为包含两种或两种以上用户的不同行为的数据。例如，希望通过一音乐软件预测用户添加歌曲到收藏列表的行为时，所述异构行为会话中可包含用户将某歌曲添加到收藏列表的数据、用户切歌行为的数据以及用户听完歌曲行为的数据，并在本步骤中认为用户将某歌曲添加到收藏列表的数据为目标行为序列，其余数据均为辅助行为序列。
63.步骤s200、基于所述目标行为序列，通过预先构建的同构行为转换图学习得到目标行为序列物品表征，并通过所述目标行为序列物品表征计算得到目标行为序列表征。
64.在本实施例中，根据得到的所述目标行为序列，将目标行为序列的每一物品输入预先构建的同构行为转换图中，通过传递同构行为转换图中的同构行为转换信息学习得到目标行为序列物品表征，并通过所述目标行为序列物品表征计算得到目标行为序列表征。
65.步骤s300、基于所述辅助行为序列，通过预先构建的同构行为转换图以及异构行为转换图学习得到辅助行为序列物品表征，并通过所述辅助行为序列物品表征计算得到辅助行为序列表征。
66.在本实施例中，根据得到的所述辅助行为序列，将所述辅助行为序列的每一物品输入同构行为转换图中，通过传递同构行为转换图中的同构行为转换信息学习得到关于辅助行为序列物品表征的第一视图物品表征。再通过将所述辅助行为序列的每一物品输入异构行为转换图中进行传递，学习得到用于提高辅助行为序列物品表征建模精准度的第二视图物品表征，并将所述第一视图物品表征以及第二视图物品表征进行融合得到精准度较高的辅助行为序列物品表征，并进一步通过计算得到对应的辅助行为序列表征。通过本步骤，实现通过异构行为转换图提高辅助行为序列建模的精准度。
67.步骤s400、基于所述目标行为序列表征以及辅助行为序列表征，融合得到会话表征。
68.在本实施例中，根据获取的目标行为序列表征以及辅助行为序列表征，通过门控模块融合计算得到最终的会话表征。
69.步骤s500、基于所述会话表征计算得到物品的预测分数，并根据所述预测分数向用户推荐物品。
70.在本实施例中，基于所述会话表征，进一步计算得到各物品的预测分数。在模型的预测阶段中，通过该预测分数可实现为用户推送符合用户购买意向的产品。在模型的训练阶段中，还可通过该预测分数对模型是否收敛进行判断。
71.由上可见，本发明实施例提供的基于行为感知图神经网络的推荐处理方法获取每个异构行为会话，将各异构行为会话分别分为目标行为序列以及辅助行为序列，其中，所述异构行为会话为包含两种或两种以上用户对物品的不同行为的数据。基于所述目标行为序列，通过预先构建的同构行为转换图学习得到目标行为序列物品表征，并通过所述目标行为序列物品表征计算得到目标行为序列表征；基于所述辅助行为序列，通过预先构建的同构行为转换图以及异构行为转换图学习得到辅助行为序列物品表征，并通过所述辅助行为序列物品表征计算得到辅助行为序列表征；基于所述目标行为序列表征以及辅助行为序列表征，融合得到会话表征；基于所述会话表征计算得到物品的预测分数，并根据所述预测分数向用户推荐物品。相较于现有技术中侧重于如何在序列建模中区分不同类型的行为或利
用每种行为序列内的同构行为转换进行推荐的方案，本发明方案可通过捕捉不同类型之间转换的语义关系实现精确度更高的智能推荐。
72.在进一步的实施例中，以电子商务平台的应用场景为例，提出一种行为感知的图神经网络bgnn(behavior-aware graph neural network)。在本实施例中，上述的目标行为为用户的购买行为，辅助行为为用户的浏览行为。
73.在一种应用场景中，获取每个异构行为会话，将各异构行为会话分别分为目标行为序列以及辅助行为序列，其中，所述异构行为会话为包含两种或两种以上用户对物品的不同行为的数据。
74.其中，所述获取每个异构行为会话，将各异构行为会话分别分为目标行为序列以及辅助行为序列的步骤之前包括：
75.预先获取所有异构行为会话，并将所有异构行为会话分为全局目标行为序列以及全局辅助行为序列；
76.通过捕获所述全局目标行为序列以及全局辅助行为序列中的同构行为转换信息，构建同构行为转换图；
77.通过捕获所述全局目标行为序列以及全局辅助行为序列之间的异构行为转换信息，构建异构行为转换图。
78.具体的，所述通过捕获所述全局目标行为序列以及全局辅助行为序列中的同构行为转换信息，构建同构行为转换图的步骤包括：
79.基于所述全局辅助行为序列以及全局目标行为序列，将异构行为会话中的物品作为节点，并在具有同构行为转换关系的两个连续物品之间构建同构行为转换边；
80.所述同构行为转换关系包括从辅助行为到辅助行为，以及从目标行为到目标行为的转换关系。
81.所述通过捕获所述全局目标行为序列以及全局辅助行为序列之间的异构行为转换信息，构建异构行为转换图的步骤包括：
82.基于所述全局辅助行为序列以及全局目标行为序列，将异构行为会话中的物品作为节点，并在具有定向异构行为转换关系的两个连续物品之间构建异构行为转换边；
83.所述定向异构行为转换关系包括从辅助行为到目标行为的转换关系。
84.举例说明，预先获取所有异构行为会话，控制将获取的所有异构行为会话分为两部分，包括一个浏览序列和一个购买序列和一个购买序列基于上述浏览序列es和购买序列ps构建两个不同的图，包括同构行为转换图(hobtg)和异构行为转换图(hebtg)。其中，所述hobtg捕获了浏览序列中“从浏览到浏览”和购买序列中“从购买到购买”的同构行为转换信息。所述hebtg则捕获了浏览序列和购买序列之间出现的异构行为转换信息，在本实施例中具体为同一会话中“从浏览到购买”的行为转换信息。
85.进一步的，以图2为例进行具体说明。将hobtg记为，其中，为节点集，ε为边集。具体来说，我们将所有会话的所有物品作为hobtg的节点集，并在两个连续物品之间构建具有同构行为转换的边，即从浏览到浏览(e2e)或从购买到购买(p2p)。例如，在会话1(session 1)的购买序列中可以看到存在从v2到v4的p2p转换，因此我们在hobtg中添加从节点v2到节点v4的p2p边。最后，所述hobtg由两种类型的边组成，即(v，e2e，v
′
)和(v，
p2p，v
′
)。具体来说，边(v，e2e，v
′
)表示用户在浏览商品v之后浏览了商品v
′
，(v，p2p，v
′
)表示用户购买商品v后购买商品v
′
。
86.请继续参阅图2。hobtg虽然收集了丰富的同构行为转换信息，但忽略了同一会话的浏览序列和购买序列之间的异构行为转换信息，这对于发现不同类型行为之间的复杂语义关系至关重要。为了解决这个问题，预先构造hebtg，具体来说，在拥有“从浏览到购买”的定向行为转换关系的两个连续物品之间构建边。例如，在会话2(session2)中可以看到存在e2p的行为转换，因此将节点v1连接到节点v4来构建一条(v，e2p，v
′
)边。则所述hebtg中的一条边可以表示为(v，e2p，v
′
)，表示用户在浏览物品v后购买了物品v
′
。
87.需注意的是，在本实施例中我们关注从浏览到购买的方向关系而不是相反方向的原因是我们想要对从辅助行为到目标行为的转换进行建模，这更符合我们预测购买行为的目标，即推荐一些用户可能购买的物品，并且可以使辅助行为序列对目标行为序列的贡献更加清晰。hebtg可以看作是一个行为感知图，它搭建了一个从辅助行为直接转换到目标行为的桥梁。
88.进一步的，对于hobtg和hebtg中的每条边，将其在所有会话中出现的频率作为其边的权重。并且，对于hobtg或hebtg中每个节点的每种边类型，只保留一定数量的边权最高的边，这样可以大大减少计算开销并避免因相邻节点信息量不足而引起的噪声的问题，实现进一步提高推荐准确度。
89.基于上述预先构建的hobtg以及hebtg，为了在基于会话的异构推荐场景中同时利用同构和异构行为转换信息，在本实施例中提出了一种名为基于行为感知图神经网络的推荐处理方法bgnn。
90.如图3所示，所述bgnn首先获取每个异构行为会话s，并将各个异构行为会话s分为浏览序列es和购买序列ps。再分别将由一个异构行为会话s得到的浏览序列es和购买序列ps输入辅助通道(auxiliary channel)以及目标通道(target channel)中，以学习每个序列的物品表征。
91.在一种应用场景中，所述bgnn基于所述目标行为序列，通过预先构建的同构行为转换图学习得到目标行为序列物品表征，并通过所述目标行为序列物品表征计算得到目标行为序列表征。
92.具体的，如图4所示，上述步骤s200包括：
93.步骤s201、通过将所述目标行为序列的每一物品在所述同构行为转换图中进行传递，学习得到目标行为序列物品表征；
94.步骤s202、基于所述目标行为序列物品表征，计算得到目标行为序列表征。
95.举例说明，请继续参阅图3。在bgnn的目标通道中，我们的目标是传递hobtg中的信息以学习到购买序列的高质量物品表征，所以在本实施例中，所述bgnn使用基于gnn的graphsage方法和均值聚合器来学习物品表征，因为它在本实施例设定中简单有效。其中，所述graphsage方法和均值聚合器可具体参考文献：william l.hamilton，rex ying，and jure leskovec.2017.inductive representation learning on large graphs.in proceedings of the 31st international conference on neural information processing systems(neurips’17).1025-1035。
96.每个节点v有四组同构相邻节点，即e2e/p2p同构行为转换的出度/入度相邻节点，
包括：包括：和
97.首先，分别聚合节点v的四组相邻节点，通过均值池化获得其四个k阶的邻居组表征如下：
[0098][0099][0100][0101][0102]
其中，代表节点v
′
的(k-1)阶表征，表示d行1列的实数矩阵集合。而目标节点v的k阶表征将通过下述公式以递归的方式更新：
[0103][0104]
其中，k为gnn的深度。即节点v的初始表征(第0层)为物品表征mv。
[0105]
由上可见，对于购买序列p＝{p1，p2，p3，...，p
|p|
}(此处为了简洁省略上标s)，可以得到它的物品表征其中其中
[0106]
进一步的，基于所述购买序列物品表征进一步的，基于所述购买序列物品表征通过下述公式计算得到会话s的购买序列表征
[0107][0108][0109]
其中，是h
p
的均值向量。是可训练的投影矩阵，σ(
·
)是sigmoid函数。
[0110]
在一种应用场景中，所述bgnn基于所述辅助行为序列，通过预先构建的同构行为
转换图以及异构行为转换图学习得到辅助行为序列物品表征，并通过所述辅助行为序列物品表征计算得到辅助行为序列表征。
[0111]
具体的，如图5所示，上述步骤s300包括：
[0112]
步骤s301、通过将所述辅助行为序列的每一物品在所述同构行为转换图中进行传递，学习得到关于所述辅助行为序列物品表征的第一视图物品表征；
[0113]
步骤s302、基于所述目标行为序列表征，通过将所述辅助行为序列的每一物品在所述异构行为转换图中进行个性化传递，学习得到关于所述辅助行为序列物品表征的第二视图物品表征；
[0114]
步骤s303、通过将所述第一视图物品表征以及第二视图物品表征进行权衡与融合，得到辅助行为序列物品表征；
[0115]
步骤s304、基于所述辅助行为序列物品表征，计算得到辅助行为序列表征。
[0116]
其中，所述基于所述目标行为序列表征，通过将所述辅助行为序列的每一物品在所述异构行为转换图中进行个性化传递，学习得到关于所述辅助行为序列物品表征的第二视图物品表征的步骤包括：
[0117]
基于所述异构行为转换图，为每个物品节点定义两组具有定向异构行为转换的相邻节点，其中，所述定向异构行为转换包括从辅助行为到目标行为的行为转换；
[0118]
基于所述目标行为序列表征，自适应调整各相邻节点的重要程度；
[0119]
基于所述重要程度，将所述辅助行为序列的每一物品在所述异构行为转换图中进行个性化传递，学习得到关于所述辅助行为序列表征的第二视图物品表征。
[0120]
举例说明，请继续参阅图3。在bgnn的辅助通道中，本实施例设置有三个部分，包括浏览序列在hobtg中的表征学习、在hebtg中的表征学习以及表征门控模块，用于学习和计算得到浏览序列的最终物品表征。
[0121]
首先，与在目标通道中所做的一样，对于辅助通道中的浏览序列e＝{e1，e2，e3，...，e
|e|
}，通过利用与目标通道通用的hobtg中的同构行为转换，可以得到浏览序列的通用视图物品表征即上述的关于辅助行为序列物品表征的第一视图物品表征，其中物品表征的第一视图物品表征，其中
[0122]
其次，尽管所述浏览序列的通用视图物品表征he已经包含来自hobtg的丰富的同构行为转换信息，但我们认为它还不够充分。一方面，hobtg中学习的表征是行为不可知的。例如，给定两个相同的物品序列，它们一个是点击序列，一个是购买序列，hobtg会向物品节点传递完全相同的信息，然后返回完全相同的物品表征。这是不合理的，这也表明了hobtg无法区分不同类型的行为。另一方面，hobtg中学习的表征忽略了与目标行为的语义联系，因此可能无法很好地捕捉用户的意图。因此，我们提出在hebtg中学习浏览序列的购买导向视图物品表征，即上述的关于辅助行为序列物品表征的第二视图物品表征。
[0123]
首先，根据hebtg，我们为每个物品节点v定义了两组行为感知的相邻节点，即通过e2p异构行为转换的出度/入度节点和其中是节点v为浏览行为时的相邻节点
集，是节点v为购买行为时的相邻节点集。可以看到，在本实施例的hebtg中，浏览行为的节点仅连接购买行为的节点，反之亦然。
[0124]
接着，为了个性化hebtg中的信息传递，在bgnn中提出了一个个性化物品邻居聚合器(ping)来根据在购买序列中捕获的用户购买偏好，即所述购买序列表征自适应地调整不同邻居节点的重要程度。例如，给定两个不同的会话，其中的浏览序列相同而购买序列完全不同，bgnn中的ping将调整不同相邻节点的贡献从而为这两个相同的浏览序列生成不同的物品表征，这有助于浏览序列的购买导向视图物品表征的学习。具体来说，ping通过下述公式递归地聚合并更新浏览行为节点v的表征：
[0125][0126][0127]
其中，表示浏览行为的节点v的k阶表征，表示浏览行为的节点v的k阶表征，表示购买行为的节点v
′
的(k-1)阶表征，是一个注意力值，表示在第(k-1)层相邻节点v
′
对目标节点v的重要程度，表示会话s的购买序列表征，是投影矩阵，σ(
·
)表示sigmoid函数。
[0128]
使得注意力值的计算将当前会话s的购买序列表征ps考虑在内，这可以个性化hebtg中相邻节点的聚合。类似地，购买行为节点v的表征聚合和更新如下：
[0129][0130][0131]
其中，是注意力值，和需注意的是，当消息在由e2p边所组成的hebtg中传递时，作为购买行为的节点会从作为浏览行为的节点收集信息，反之亦然。将hebtg中的ping聚合操作扩展到k层后，对于一个浏览序列e＝{e1，e2，e3，...，e
|e|
}，我们可以获得物品的购买导向视图物品表征即所述第二视图物品表征，其中
[0132]
进一步的，基于上述获取的浏览序列的通用视图物品表征进一步的，基于上述获取的浏览序列的通用视图物品表征以及购买导向视图物品表征以及购买导向视图物品表征所述bgnn通过一个表征门控模块(rng)对这两种关于浏览序列的物品表征进行权衡与融合，所述rng具体包含：
[0133][0134][0135]
其中，[
·
，
·
]表示拼接操作，σ(
·
)是sigmoid函数，γe表示一个浏览序列的两个表征矩阵的权衡值，是一个可训练的参数，而表示一个浏览序列的融合后的表征矩阵。可以看到，所述rng并不是如平均值池化或最大值池化一样的直接操作两个表征矩阵，而是使用两个矩阵的均值向量来计算两个表征矩阵的权重，并将两个表征矩阵的相应加权和作为物品的最终表征。
[0136]
进一步的，基于所述浏览序列的物品表征ze，通过与公式(6)和(7)相同的方法可计算得到异构会话s的浏览序列表征
[0137]
在一种应用场景中，所述bgnn基于所述目标行为序列表征以及辅助行为序列表征，融合得到会话表征。
[0138]
具体的，上述步骤s400包括：
[0139]
举例说明，基于学习得到的所述购买序列表征以及浏览序列表征所述bgnn通过门控函数获得会话s的最终表征：
[0140]rs
＝g
·es
+(1-g)
·
psꢀꢀ
(14)
[0141][0142]
其中，是一个可训练的参数。
[0143]
在一种应用场景中，所述bgnn基于所述会话表征计算得到物品的预测分数，并根据所述预测分数向用户推荐物品。
[0144]
具体的，上述步骤s500包括：
[0145]
举例说明，基于所述会话表征rs，所述bgnn计算得到对每一物品的预测分数：
[0146][0147]
其中，是可训练的参数，mi是物品i的表征。当所述bgnn模型应用于预测阶段时，通过该预测分数可向用户更准确的推荐用户希望购买的物品。
[0148]
其中，在所述基于所述会话表征计算得到物品的预测分数，并根据所述预测分数向用户推荐物品的步骤还包括：
[0149]
基于所述会话表征计算得到物品的预测分数，并利用所述预测分数判断模型是否收敛。
[0150]
举例说明，在训练阶段，还可以使用交叉熵作为模型的损失函数来训练整个模型：
[0151][0152]
其中yi∈{0，1}，表示物品i的真实标签。当yi＝1时，代表物品i为用户真实下一步交互的物品，否则yi＝0。
[0153]
基于上述实施例提出的基于行为感知图神经网络的推荐处理方法，进一步对其推荐效果进行验证，具体包括：
[0154]
为了评估bgnn模型的推荐效果，将bgnn与以下基线算法进行比较，包括一些传统的、基于rnn、基于注意力、基于transformer和基于gnn的方法，具体为两种传统方法pop和itemknn，五种基于同构会话的方法gru4rec、narm、stamp、sr-gnn和gce-gnn，以及五种基于异构会话的方法rib、m-sr、dmt-trans、mgnn-spred和mgnn spred-w。
[0155]
如图6所示，展示的是bgnn和上述十二个基线的推荐性能在tmall、yoochoose和ub三个数据集上的表现，其中最佳结果以粗体标记，次佳结果以下划线标记。可见，实验结果表明本发明实施例提出的bgnn模型优于其他相关的推荐算法，并且在三个数据集分别比最佳基线平均高21.87％、18.49和37.16％。
[0156]
此外，如图7所示，我们还将浏览和购买的表征可视化，以显示我们的bgnn是否学习了不同类型行为的语义信息。其中，五角星表示目标物品的表征，圆形表示浏览的表征，三角形表示购买的表征。具体来说，我们在每个数据集中随机选择一个目标物品(有待预测的购买物品)并检索使用该物品作为标签的会话，最后将这些会话中的浏览和购买的表征以及目标物品的表征可视化。需注意，表征的维数是64，因此我们使用t-sne工具进行可视化。为了与bgnn进行比较，我们还展示了mgnn-spred-w的可视化，这是我们上一实验中的最佳基线模型。在mgnn-spred-w的可视化中，我们没有观察到明显的模式，同时我们可以看到购买和浏览的表征之间存在一些重叠。而我们可以发现对于我们的bgnn：1)浏览的表征逐渐聚合到目标物品中，这是合理的，因为用户在购买物品之前的浏览更多相关的；2)与学习到的浏览表征相对紧密的分布相比，购买表征呈现出更加分散的状态，这反映了浏览和购买之间的语义差异。可见，所述bgnn学习到了不同类型行为的语义信息。
[0157]
示例性设备
[0158]
基于上述实施例，本发明提供了一种服务器，其原理框图可以如图8所示。上述服务器包括通过系统总线连接的处理器、存储器、网络接口以及显示屏。其中，该服务器的处理器用于提供计算和控制能力。该服务器的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该服务器的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时实现上述任意一种基于行为感知图神经网络的推荐处理方法的步骤。该服务器的显示屏可以是液晶显示屏或者电子墨水显示屏。
[0159]
本领域技术人员可以理解，图8中示出的原理框图，仅仅是与本发明方案相关的部分结构的框图，并不构成对本发明方案所应用于其上的服务器的限定，具体的服务器可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。
[0160]
在一个实施例中，提供了一种服务器，包括有存储器、处理器以及存储在上述存储器上并可在上述处理器上运行的程序，上述程序被上述处理器执行时进行以下操作指令：
[0161]
获取每个异构行为会话，将各异构行为会话分别分为目标行为序列以及辅助行为序列，其中，所述异构行为会话为包含两种或两种以上用户对物品的不同行为的数据。
[0162]
基于所述目标行为序列，通过预先构建的同构行为转换图学习得到目标行为序列物品表征，并通过所述目标行为序列物品表征计算得到目标行为序列表征；
[0163]
基于所述辅助行为序列，通过预先构建的同构行为转换图以及异构行为转换图学
习得到辅助行为序列物品表征，并通过所述辅助行为序列物品表征计算得到辅助行为序列表征；
[0164]
基于所述目标行为序列表征以及辅助行为序列表征，融合得到会话表征；
[0165]
基于所述会话表征计算得到物品的预测分数，并根据所述预测分数向用户推荐物品。应理解，上述实施例中各步骤的序号大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。
[0166]
所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将上述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
[0167]
在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。对于各个公式中表现形式相同的量，如无特殊说明则表示相同的量，各个公式之间可以相互参照。
[0168]
本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各实例的单元及方法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟是以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同的方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。
[0169]
在本发明所提供的实施例中，应该理解到，所揭露的装置/终端设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/终端设备实施例仅仅是示意性的，例如，上述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以由另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。
[0170]
上述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，上述计算机程序可存储于以计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，上述计算机程序包括计算机程序代码，上述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。上述计算机可读介质可以包括：能够携带上述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，上述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减。
[0171]
以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解；其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改
或者替换，并不是相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

技术特征：
1.一种基于行为感知图神经网络的推荐处理方法，其特征在于，包括如下步骤：获取每个异构行为会话，将各异构行为会话分别分为目标行为序列以及辅助行为序列，其中，所述异构行为会话为包含两种或两种以上用户对物品的不同行为的数据。基于所述目标行为序列，通过预先构建的同构行为转换图学习得到目标行为序列物品表征，并通过所述目标行为序列物品表征计算得到目标行为序列表征；基于所述辅助行为序列，通过预先构建的同构行为转换图以及异构行为转换图学习得到辅助行为序列物品表征，并通过所述辅助行为序列物品表征计算得到辅助行为序列表征；基于所述目标行为序列表征以及辅助行为序列表征，融合得到会话表征；基于所述会话表征计算得到物品的预测分数，并根据所述预测分数向用户推荐物品。2.根据权利要求1所述的一种基于行为感知图神经网络的推荐处理方法，其特征在于，所述获取每个异构行为会话，将各异构行为会话分别分为目标行为序列以及辅助行为序列，其中，所述异构行为会话为包含两种或两种以上用户对物品的不同行为的数据的步骤之前包括：预先获取所有异构行为会话，并将所有异构行为会话分为全局目标行为序列以及全局辅助行为序列；通过捕获所述全局目标行为序列以及全局辅助行为序列中的同构行为转换信息，构建同构行为转换图；通过捕获所述全局目标行为序列以及全局辅助行为序列之间的异构行为转换信息，构建异构行为转换图。3.根据权利要求2所述的一种基于行为感知图神经网络的推荐处理方法，其特征在于，所述通过捕获所述全局目标行为序列以及全局辅助行为序列中的同构行为转换信息，构建同构行为转换图的步骤包括：基于所述全局辅助行为序列以及全局目标行为序列，将异构行为会话中的物品作为节点，并在具有同构行为转换关系的两个连续物品之间构建同构行为转换边；所述同构行为转换关系包括从辅助行为到辅助行为，以及从目标行为到目标行为的转换关系。4.根据权利要求2所述的一种基于行为感知图神经网络的推荐处理方法，其特征在于，所述通过捕获所述全局目标行为序列以及全局辅助行为序列之间的异构行为转换信息，构建异构行为转换图的步骤包括：基于所述全局辅助行为序列以及全局目标行为序列，将异构行为会话中的物品作为节点，并在具有定向异构行为转换关系的两个连续物品之间构建异构行为转换边；所述定向异构行为转换关系包括从辅助行为到目标行为的转换关系。5.根据权利要求1所述的一种基于行为感知图神经网络的推荐处理方法，其特征在于，所述基于所述目标行为序列，通过预先构建的同构行为转换图学习得到目标行为序列物品表征，并通过所述目标行为序列物品表征计算得到目标行为序列表征的步骤包括：通过将所述目标行为序列的每一物品在所述同构行为转换图中进行传递，学习得到目标行为序列物品表征；基于所述目标行为序列物品表征，计算得到目标行为序列表征。
6.根据权利要求1所述的一种基于行为感知图神经网络的推荐处理方法，其特征在于，所述基于所述辅助行为序列，通过预先构建的同构行为转换图以及异构行为转换图学习得到辅助行为序列物品表征，并通过所述辅助行为序列物品表征计算得到辅助行为序列表征的步骤包括：通过将所述辅助行为序列的每一物品在所述同构行为转换图中进行传递，学习得到关于所述辅助行为序列物品表征的第一视图物品表征；基于所述目标行为序列表征，通过将所述辅助行为序列的每一物品在所述异构行为转换图中进行个性化传递，学习得到关于所述辅助行为序列物品表征的第二视图物品表征；通过将所述第一视图物品表征以及第二视图物品表征进行权衡与融合，得到辅助行为序列物品表征；基于所述辅助行为序列物品表征，计算得到辅助行为序列表征。7.根据权利要求6所述的一种基于行为感知图神经网络的推荐处理方法，其特征在于，所述基于所述目标行为序列表征，通过将所述辅助行为序列的每一物品在所述异构行为转换图中进行个性化传递，学习得到关于所述辅助行为序列物品表征的第二视图物品表征的步骤包括：基于所述异构行为转换图，为每个物品节点定义两组具有定向异构行为转换的相邻节点，其中，所述定向异构行为转换包括从辅助行为到目标行为的行为转换；基于所述目标行为序列表征，自适应调整各相邻节点的重要程度；基于所述重要程度，将所述辅助行为序列的每一物品在所述异构行为转换图中进行个性化传递，学习得到关于所述辅助行为序列表征的第二视图物品表征。8.根据权利要求1所述的一种基于行为感知图神经网络的推荐处理方法，其特征在于，所述基于所述会话表征计算得到物品的预测分数，并根据所述预测分数向用户推荐物品的步骤还包括：基于所述会话表征计算得到物品的预测分数，并利用所述预测分数判断模型是否收敛。9.一种服务器，其特征在于，所述服务器包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的基于行为感知图神经网络的推荐处理方法程序，所述基于行为感知图神经网络的推荐处理方法程序被所述处理器执行时实现如权利要求1-8任意一项所述基于行为感知图神经网络的推荐处理方法的步骤。10.一种非临时性计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行实现如权利要求1-8任意一项所述基于行为感知图神经网络的推荐处理方法的步骤。

技术总结
本发明公开了基于行为感知图神经网络的推荐处理方法，服务器及介质，具体包括：将获取的各异构行为会话分为目标行为序列以及辅助行为序列。基于目标行为序列，通过预先构建的同构行为转换图学习得到目标行为序列物品表征，并通过目标行为序列物品表征计算得到目标行为序列表征；基于辅助行为序列，通过预先构建的同构行为转换图以及异构行为转换图学习得到辅助行为序列物品表征，并进一步计算得到辅助行为序列表征；基于所述目标行为序列表征以及辅助行为序列表征，融合得到会话表征，进一步得到物品的预测分数，并根据预测分数向用户推荐物品。通过构建异构行为转换图使辅助行为序列对目标行为序列的贡献更加清晰，提高推荐准确度。荐准确度。荐准确度。

技术研发人员：骆锦潍何铭凯潘微科明仲
受保护的技术使用者：深圳大学
技术研发日：2021.12.13
技术公布日：2022/3/8

专利

最新回复(0)