媒体内容推荐方法、装置、电子设备及存储介质与流程

专利查询2023-12-2 116

1.本公开涉及计算机技术领域，尤其涉及一种媒体内容推荐方法、装置、电子设备及存储介质。

背景技术：

2.随着互联网的发展以及推荐技术的广泛应用，基于推荐模型向账号推荐媒体内容已成为一种常用的推荐方式。推荐模型通常会基于账号的特征和媒体内容的特征进行推荐。其中，特征是推荐模型基于行为信息训练得到的。行为信息包括至少一条行为数据，每一条行为数据能够表示一个媒体内容与一个账号之间的交互行为，如基于该账号展示该媒体内容的行为，或者基于该账号转发该媒体内容的行为等。推荐模型能够根据至少一条行为数据确定出每个媒体内容和每个账号的特征。
3.但是如何基于账号与媒体内容之间新的交互行为，提高推荐模型的推荐准确度成为亟待解决的问题。

技术实现要素：

4.本公开提供了一种媒体内容推荐方法、装置、电子设备及存储介质，提高了推荐准确度。
5.根据本公开实施例的一方面，提供一种媒体内容推荐方法，所述方法包括：
6.获取推荐模型，所述推荐模型包括多个对象的对象特征，所述多个对象包括用户账号和媒体内容；
7.基于第一用户账号的账号特征和第一媒体内容的内容特征，确定所述第一用户账号与所述第一媒体内容之间的相似度，所述第一用户账号为所述用户账号中的任意一个，所述第一媒体内容为所述媒体内容中任意一个；
8.基于所述相似度确定向所述第一用户账号推荐所述第一媒体内容；
9.其中，所述多个对象包括第一对象和第二对象，所述第一对象为新增行为数据中的对象，所述第二对象为与所述第一对象相关的对象，所述推荐模型是基于与第一相似度负相关的传播损失训练得到的，所述第一相似度基于所述第二对象的影响特征与所述第二对象的对象特征之间的相似度确定，所述影响特征表征所述第二对象在所述新增行为数据对应的交互行为的影响下的特征。
10.在一些实施例中，所述账号特征包括所述第一用户账号的第一记忆特征和第二记忆特征，所述第一记忆特征表征所述第一用户账号长期的特征，所述第二记忆特征表征所述第一用户账号短期的特征；所述内容特征包括所述第一媒体内容的第一记忆特征和第二记忆特征，所述第一媒体内容的第一记忆特征表征所述第一媒体内容长期的特征，所述第一媒体内容的第二记忆特征表征所述第一媒体内容短期的特征；
11.所述基于第一用户账号的账号特征和第一媒体内容的内容特征，确定所述第一用户账号与所述第一媒体内容之间的相似度，包括：
12.对所述第一用户账号的所述第一记忆特征和所述第二记忆特征进行融合，得到所述第一用户账号的融合特征，以及，对所述第一媒体内容的所述第一记忆特征和所述第二记忆特征进行融合，得到所述第一媒体内容的融合特征；
13.确定所述第一用户账号的融合特征和所述第一媒体内容的融合特征之间的相似度。
14.在一些实施例中，所述账号特征还包括所述第一用户账号的上下文特征，所述上下文特征表征所述第一用户账号在其他对象的影响下的特征；
15.所述对所述第一用户账号的所述第一记忆特征和所述第二记忆特征进行融合，得到所述第一用户账号的融合特征，包括：
16.对所述第一用户账号的所述第一记忆特征、所述第二记忆特征和所述上下文特征进行融合，得到所述第一用户账号的融合特征。
17.根据本公开实施例的再一方面，提供一种推荐模型处理方法，所述方法包括：
18.获取第一行为信息，所述第一行为信息包括新增行为数据和历史行为数据，所述新增行为数据用于表示属于不同类型的两个第一对象之间的交互行为，所述类型包括账号和媒体内容，所述历史行为数据为与任一所述第一对象相关的第二对象所对应的历史行为数据；
19.获取推荐模型，所述推荐模型包括多个对象的第一特征，所述多个对象包括所述两个第一对象以及所述历史行为数据中的至少一个第二对象；
20.对于每个所述第一对象，基于所述第一对象的第一特征和与所述第一对象相关的所述第二对象的交互时间差，确定所述第二对象的影响特征，任一所述第二对象的影响特征表征所述第二对象在所述新增行为数据对应的交互行为的影响下的特征，所述第二对象的交互时间差为所述新增行为数据的发生时间与所述第二对象所属的历史行为数据的发生时间之间的时间差；
21.基于与第一相似度负相关的传播损失，对所述推荐模型进行训练，所述第一相似度基于每个所述第二对象的影响特征与每个所述第二对象的第一特征之间的相似度确定，训练后的所述推荐模型包括所述多个对象的第二特征，且训练后的所述推荐模型用于基于所述多个对象的第二特征进行推荐。
22.在一些实施例中，所述对于每个所述第一对象，基于所述第一对象的第一特征和与所述第一对象相关的所述第二对象的交互时间差，确定所述第二对象的影响特征，包括：
23.对于每个所述第一对象，基于所述第一对象的交互时间差，对所述第一对象的第一特征进行衰减，得到所述第一对象的交互特征，所述第一对象的交互时间差为所述新增行为数据的发生时间与所述第一对象所属的历史行为数据的发生时间之间的时间差；
24.基于所述第一对象的交互特征和与所述第一对象属于同一历史行为数据的所述第二对象的交互时间差，确定与所述第一对象相关的所述第二对象的影响特征；
25.继续基于所述第二对象的影响特征和与所述第二对象属于同一历史行为数据的另一所述第二对象的交互时间差，确定另一所述第二对象的影响特征，直至确定出所述第一行为信息中与所述第一对象相关的每个所述第二对象的影响特征。
26.在一些实施例中，所述基于所述第一对象的交互特征和与所述第一对象属于同一历史行为数据的所述第二对象的交互时间差，确定与所述第一对象相关的所述第二对象的
影响特征，包括：
27.在所述交互时间差不大于时间差阈值的情况下，确定与所述交互时间差负相关的第一衰减参数，按照所述第一衰减参数对所述第一对象的交互特征进行衰减，得到所述第二对象的影响特征；或者，
28.在所述交互时间差大于所述时间差阈值的情况下，将预设影响特征确定为所述第二对象的影响特征。
29.在一些实施例中，所述第一行为信息包括属于不同节点类型的至少两个对象节点以及任两个对象节点之间连接的边，所述节点类型包括账号类型和媒体内容类型；其中，所述至少两个对象节点包括属于不同类型的两个第一对象节点和与任一所述第一对象节点直接连接或间接连接的第二对象节点；
30.所述两个第一对象节点及所述两个第一对象节点之间连接的第一边构成所述新增行为数据；
31.属于不同类型的所述第一对象节点和所述第二对象节点以及所述第一对象节点与所述第二对象节点之间连接的第二边构成一条历史行为数据，和/或，属于不同类型的任两个所述第二对象节点以及任两个所述第二对象节点之间连接的第三边构成一条历史行为数据；
32.所述对于每个所述第一对象，基于所述第一对象的第一特征和与所述第一对象相关的所述第二对象的交互时间差，确定所述第二对象的影响特征，包括：
33.对于每个所述第一对象节点，基于所述第一对象节点的交互时间差，对所述第一对象节点的第一特征进行衰减，得到所述第一对象节点的交互特征，所述第一对象节点的交互时间差为所述第一边的发生时间和所述第一对象节点所连接的第二边的发生时间之间的时间差；
34.基于所述第一对象节点的交互特征和与所述第一对象节点直接连接的所述第二对象节点的交互时间差，确定所述第二对象节点的影响特征；
35.继续基于所述第二对象节点的影响特征和与所述第二对象节点直接连接的另一所述第二对象节点的交互时间差，确定另一所述第二对象节点的影响特征，直至确定出所述第一行为信息中与任一所述第一对象节点直接连接或间接连接的每个所述第二对象节点的影响特征。
36.在一些实施例中，所述方法还包括：
37.对于每个所述第一对象，基于所述第一对象的交互时间差，对所述第一对象的第一特征进行衰减，得到衰减特征，所述衰减特征表征在所述新增行为数据对应的交互行为的影响下所述第一对象的第一特征衰减后的特征，所述第一对象的交互时间差为所述新增行为数据的发生时间与所述第一对象所属的历史行为数据的发生时间之间的时间差；
38.基于所述两个第一对象的衰减特征，确定与第二相似度负相关的交互损失，所述第二相似度为所述两个第一对象的衰减特征之间的相似度；
39.所述基于与第一相似度负相关的传播损失，对所述推荐模型进行训练，包括：
40.基于所述与第一相似度负相关的传播损失和所述交互损失，对所述推荐模型进行训练。
41.在一些实施例中，所述第一对象的第一特征包括第一记忆特征和第二记忆特征，
所述第一记忆特征表征所述第一对象长期的特征，所述第二记忆特征表征所述第一对象短期的特征；所述基于所述第一对象的交互时间差，对所述第一对象的第一特征进行衰减，得到衰减特征，包括：
42.基于所述第一对象的交互时间差，对所述第一对象的第二记忆特征进行衰减；
43.对所述第一对象的第一记忆特征与衰减后的所述第二记忆特征进行融合，得到所述第一对象的衰减特征。
44.在一些实施例中，所述基于所述第一对象的交互时间差，对所述第一对象的第二记忆特征进行衰减，包括：
45.基于所述第一对象的交互时间差和所述第一对象的类型对应的学习参数，确定第二衰减参数；
46.基于所述第二衰减参数对所述第二记忆特征进行衰减。
47.在一些实施例中，所述第一对象的第一特征还包括上下文特征，所述上下文特征表征所述第一对象在其他对象的影响下的特征；所述对所述第一对象的第一记忆特征与衰减后的所述第二记忆特征进行融合，得到所述第一对象的衰减特征，包括：
48.对所述第一对象的所述第一记忆特征、衰减后的所述第二记忆特征以及所述上下文特征进行加权融合，得到所述第一对象的衰减特征。
49.在一些实施例中，所述第一对象的上下文特征包括所述第一对象针对多种交互类型的上下文特征，所述新增行为数据包括所述交互行为对应的目标交互类型；
50.所述对所述第一对象的所述第一记忆特征、衰减后的所述第二记忆特征以及所述上下文特征进行加权融合，得到所述第一对象的衰减特征，包括：
51.从所述第一对象针对多种交互类型的上下文特征中，确定所述目标交互类型对应的上下文特征；
52.对所述第一对象的所述第一记忆特征、衰减后的所述第二记忆特征以及所述目标交互类型对应的上下文特征进行加权融合，得到所述第一对象的衰减特征。
53.在一些实施例中，所述推荐模型还包括模型参数，所述基于所述与第一相似度负相关的传播损失和所述交互损失，对所述推荐模型进行训练，包括：
54.将所述与第一相似度负相关的传播损失和所述交互损失进行融合，得到所述推荐模型的模型损失；
55.基于所述模型损失，对所述推荐模型中的模型参数和所述多个对象的第一特征进行更新，得到训练后的所述推荐模型。
56.在一些实施例中，所述方法还包括：
57.从第二行为信息中，确定每个所述第一对象对应的第三对象，所述第二行为信息包括所述新增行为数据和多条历史行为数据，所述第三对象为所述第二行为信息中除所述第一对象外的其他对象；
58.确定与第三相似度负相关的负采样损失，所述第三相似度基于所述第一对象的交互特征与所述第三对象的上下文特征之间的相似度确定，所述上下文特征表征所述第三对象在其他对象的影响下的特征；
59.所述基于与第一相似度负相关的传播损失，对所述推荐模型进行训练，包括：
60.基于所述与第一相似度负相关的传播损失和所述负采样损失，对所述推荐模型进
行训练。
61.在一些实施例中，所述方法还包括：
62.从第二行为信息中，确定每个所述第一对象对应的第三对象，所述第二行为信息包括所述新增行为数据和多条历史行为数据，所述第三对象为所述第二行为信息中除所述第一对象外的其他对象；
63.确定与第三相似度负相关的负采样损失，所述第三相似度基于所述第一对象的交互特征与所述第三对象的上下文特征之间的相似度确定，所述上下文特征表征所述第三对象在其他对象的影响下的特征；
64.所述基于所述与第一相似度负相关的传播损失和所述交互损失，对所述推荐模型进行训练，包括：
65.基于所述与第一相似度负相关的传播损失、所述交互损失和所述负采样损失，对所述推荐模型进行训练。
66.在一些实施例中，所述获取第一行为信息，包括：
67.按照所述新增行为数据中的所述两个第一对象，对第二行为信息进行采样，得到所述第一行为信息，所述第二行为信息包括所述新增行为数据和多条历史行为数据。
68.在一些实施例中，所述按照所述新增行为数据中的所述两个第一对象，对第二行为信息进行采样，得到所述第一行为信息，包括：
69.获取采样方式集合，所述采样方式集合包括多种采样方式；
70.从所述采样方式集合中，确定每个所述第一对象的采样方式；
71.对于每个所述第一对象，从所述第一对象开始，在所述第二行为信息中按照所确定的采样方式进行采样，将采样得到的历史行为数据与所述新增行为数据构成所述第一行为信息。
72.在一些实施例中，所述第二对象的第一特征包括上下文特征，所述上下文特征表征所述第二对象在其他对象的影响下的特征；所述方法还包括：
73.确定每个所述第二对象的影响特征和上下文特征之间的相似度；
74.将所述至少一个第二对象的相似度进行融合，得到所述第一相似度。
75.在一些实施例中，所述获取新增行为数据之前，所述方法还包括：
76.获取多条样本行为数据，每条所述样本行为数据用于表示属于不同类型的两个样本对象之间的交互行为；
77.将所述多条样本行为数据按照发生时间由远及近的顺序，分为多个样本集，每个所述样本集所包含的样本行为数据的数量相同；
78.基于所述多个样本集，依次训练所述推荐模型。
79.根据本公开实施例的再一方面，提供一种媒体内容推荐装置，所述装置包括：
80.第一获取单元，被配置为执行获取推荐模型，所述推荐模型包括多个对象的对象特征，所述多个对象包括用户账号和媒体内容；
81.第一确定单元，被配置为执行基于第一用户账号的账号特征和第一媒体内容的内容特征，确定所述第一用户账号与所述第一媒体内容之间的相似度，所述第一用户账号为所述用户账号中的任意一个，所述第一媒体内容为所述媒体内容中任意一个；
82.推荐单元，被配置为执行基于所述相似度确定向所述第一用户账号推荐所述第一
媒体内容；
83.其中，所述多个对象包括第一对象和第二对象，所述第一对象为新增行为数据中的对象，所述第二对象为与所述第一对象相关的对象，所述推荐模型是基于与第一相似度负相关的传播损失训练得到的，所述第一相似度基于所述第二对象的影响特征与所述第二对象的对象特征之间的相似度确定，所述影响特征表征所述第二对象在所述新增行为数据对应的交互行为的影响下的特征。
84.在一些实施例中，所述账号特征包括所述第一用户账号的第一记忆特征和第二记忆特征，所述第一记忆特征表征所述第一用户账号长期的特征，所述第二记忆特征表征所述第一用户账号短期的特征；所述内容特征包括所述第一媒体内容的第一记忆特征和第二记忆特征，所述第一媒体内容的第一记忆特征表征所述第一媒体内容长期的特征，所述第一媒体内容的第二记忆特征表征所述第一媒体内容短期的特征；
85.所述第一确定单元，被配置为执行对所述第一用户账号的所述第一记忆特征和所述第二记忆特征进行融合，得到所述第一用户账号的融合特征，以及，对所述第一媒体内容的所述第一记忆特征和所述第二记忆特征进行融合，得到所述第一媒体内容的融合特征；确定所述第一用户账号的融合特征和所述第一媒体内容的融合特征之间的相似度。
86.在一些实施例中，所述账号特征还包括所述第一用户账号的上下文特征，所述上下文特征表征所述第一用户账号在其他对象的影响下的特征；
87.所述第一确定单元，被配置为执行对所述第一用户账号的所述第一记忆特征、所述第二记忆特征和所述上下文特征进行融合，得到所述第一用户账号的融合特征。
88.根据本公开实施例的再一方面，提供一种推荐模型处理装置，所述装置包括：
89.第二获取单元，被配置为执行获取第一行为信息，所述第一行为信息包括新增行为数据和历史行为数据，所述新增行为数据用于表示属于不同类型的两个第一对象之间的交互行为，所述类型包括账号和媒体内容，所述历史行为数据为与任一所述第一对象相关的第二对象所对应的历史行为数据；
90.第三获取单元，被配置为执行获取推荐模型，所述推荐模型包括多个对象的第一特征，所述多个对象包括所述两个第一对象以及所述历史行为数据中的至少一个第二对象；
91.第二确定单元，被配置为执行对于每个所述第一对象，基于所述第一对象的第一特征和与所述第一对象相关的所述第二对象的交互时间差，确定所述第二对象的影响特征，任一所述第二对象的影响特征表征所述第二对象在所述新增行为数据对应的交互行为的影响下的特征，所述第二对象的交互时间差为所述新增行为数据的发生时间与所述第二对象所属的历史行为数据的发生时间之间的时间差；
92.训练单元，被配置为执行基于与第一相似度负相关的传播损失，对所述推荐模型进行训练，所述第一相似度基于每个所述第二对象的影响特征与每个所述第二对象的第一特征之间的相似度确定，训练后的所述推荐模型包括所述多个对象的第二特征，且训练后的所述推荐模型用于基于所述多个对象的第二特征进行推荐。
93.在一些实施例中，所述第二确定单元，被配置为执行对于每个所述第一对象，基于所述第一对象的交互时间差，对所述第一对象的第一特征进行衰减，得到所述第一对象的交互特征，所述第一对象的交互时间差为所述新增行为数据的发生时间与所述第一对象所
属的历史行为数据的发生时间之间的时间差；
94.基于所述第一对象的交互特征和与所述第一对象属于同一历史行为数据的所述第二对象的交互时间差，确定与所述第一对象相关的所述第二对象的影响特征；
95.继续基于所述第二对象的影响特征和与所述第二对象属于同一历史行为数据的另一所述第二对象的交互时间差，确定另一所述第二对象的影响特征，直至确定出所述第一行为信息中与所述第一对象相关的每个所述第二对象的影响特征。
96.在一些实施例中，所述第二确定单元，被配置为执行在所述交互时间差不大于时间差阈值的情况下，确定与所述交互时间差负相关的第一衰减参数，按照所述第一衰减参数对所述第一对象的交互特征进行衰减，得到所述第二对象的影响特征；或者，
97.所述第二确定单元，被配置为执行在所述交互时间差大于所述时间差阈值的情况下，将预设影响特征确定为所述第二对象的影响特征。
98.在一些实施例中，所述第一行为信息包括属于不同节点类型的至少两个对象节点以及任两个对象节点之间连接的边，所述节点类型包括账号类型和媒体内容类型；其中，所述至少两个对象节点包括属于不同类型的两个第一对象节点和与任一所述第一对象节点直接连接或间接连接的第二对象节点；
99.所述两个第一对象节点及所述两个第一对象节点之间连接的第一边构成所述新增行为数据；
100.属于不同类型的所述第一对象节点和所述第二对象节点以及所述第一对象节点与所述第二对象节点之间连接的第二边构成一条历史行为数据，和/或，属于不同类型的任两个所述第二对象节点以及任两个所述第二对象节点之间连接的第三边构成一条历史行为数据；
101.所述第二确定单元，被配置为执行对于每个所述第一对象节点，基于所述第一对象节点的交互时间差，对所述第一对象节点的第一特征进行衰减，得到所述第一对象节点的交互特征，所述第一对象节点的交互时间差为所述第一边的发生时间和所述第一对象节点所连接的第二边的发生时间之间的时间差；
102.基于所述第一对象节点的交互特征和与所述第一对象节点直接连接的所述第二对象节点的交互时间差，确定所述第二对象节点的影响特征；
103.继续基于所述第二对象节点的影响特征和与所述第二对象节点直接连接的另一所述第二对象节点的交互时间差，确定另一所述第二对象节点的影响特征，直至确定出所述第一行为信息中与任一所述第一对象节点直接连接或间接连接的每个所述第二对象节点的影响特征。
104.在一些实施例中，所述装置还包括：
105.第三确定单元，被配置为执行对于每个所述第一对象，基于所述第一对象的交互时间差，对所述第一对象的第一特征进行衰减，得到衰减特征，所述衰减特征表征在所述新增行为数据对应的交互行为的影响下所述第一对象的第一特征衰减后的特征，所述第一对象的交互时间差为所述新增行为数据的发生时间与所述第一对象所属的历史行为数据的发生时间之间的时间差；
106.基于所述两个第一对象的衰减特征，确定与第二相似度负相关的交互损失，所述第二相似度为所述两个第一对象的衰减特征之间的相似度；
107.所述训练单元，被配置为执行基于所述与第一相似度负相关的传播损失和所述交互损失，对所述推荐模型进行训练。
108.在一些实施例中，所述第一对象的第一特征包括第一记忆特征和第二记忆特征，所述第一记忆特征表征所述第一对象长期的特征，所述第二记忆特征表征所述第一对象短期的特征；所述第三确定单元，被配置为执行基于所述第一对象的交互时间差，对所述第一对象的第二记忆特征进行衰减；对所述第一对象的第一记忆特征与衰减后的所述第二记忆特征进行融合，得到所述第一对象的衰减特征。
109.在一些实施例中，所述第三确定单元，被配置为执行基于所述第一对象的交互时间差和所述第一对象的类型对应的学习参数，确定第二衰减参数；基于所述第二衰减参数对所述第二记忆特征进行衰减。
110.在一些实施例中，所述第一对象的第一特征还包括上下文特征，所述上下文特征表征所述第一对象在其他对象的影响下的特征；所述第三确定单元，被配置为执行对所述第一对象的所述第一记忆特征、衰减后的所述第二记忆特征以及所述上下文特征进行加权融合，得到所述第一对象的衰减特征。
111.在一些实施例中，所述第一对象的上下文特征包括所述第一对象针对多种交互类型的上下文特征，所述新增行为数据包括所述交互行为对应的目标交互类型；
112.所述第三确定单元，被配置为执行从所述第一对象针对多种交互类型的上下文特征中，确定所述目标交互类型对应的上下文特征；对所述第一对象的所述第一记忆特征、衰减后的所述第二记忆特征以及所述目标交互类型对应的上下文特征进行加权融合，得到所述第一对象的衰减特征。
113.在一些实施例中，所述推荐模型还包括模型参数，所述训练单元，被配置为执行将所述与第一相似度负相关的传播损失和所述交互损失进行融合，得到所述推荐模型的模型损失；基于所述模型损失，对所述推荐模型中的模型参数和所述多个对象的第一特征进行更新，得到训练后的所述推荐模型。
114.在一些实施例中，所述装置还包括：
115.第四确定单元，被配置为执行从第二行为信息中，确定每个所述第一对象对应的第三对象，所述第二行为信息包括所述新增行为数据和多条历史行为数据，所述第三对象为所述第二行为信息中除所述第一对象外的其他对象；确定与第三相似度负相关的负采样损失，所述第三相似度基于所述第一对象的交互特征与所述第三对象的上下文特征之间的相似度确定，所述上下文特征表征所述第三对象在其他对象的影响下的特征；
116.所述训练单元，被配置为执行基于所述与第一相似度负相关的传播损失和所述负采样损失，对所述推荐模型进行训练。
117.在一些实施例中，所述装置还包括：
118.第四确定单元，被配置为执行从第二行为信息中，确定每个所述第一对象对应的第三对象，所述第二行为信息包括所述新增行为数据和多条历史行为数据，所述第三对象为所述第二行为信息中除所述第一对象外的其他对象；
119.确定与第三相似度负相关的负采样损失，所述第三相似度基于所述第一对象的交互特征与所述第三对象的上下文特征之间的相似度确定，所述上下文特征表征所述第三对象在其他对象的影响下的特征；
120.所述训练单元，被配置为执行基于所述与第一相似度负相关的传播损失、所述交互损失和所述负采样损失，对所述推荐模型进行训练。
121.在一些实施例中，所述第二获取单元，被配置为执行按照所述新增行为数据中的所述两个第一对象，对第二行为信息进行采样，得到所述第一行为信息，所述第二行为信息包括所述新增行为数据和多条历史行为数据。
122.在一些实施例中，所述第二获取单元，被配置为执行获取采样方式集合，所述采样方式集合包括多种采样方式；从所述采样方式集合中，确定每个所述第一对象的采样方式；对于每个所述第一对象，从所述第一对象开始，在所述第二行为信息中按照所确定的采样方式进行采样，将采样得到的历史行为数据与所述新增行为数据构成所述第一行为信息。
123.在一些实施例中，所述第二对象的第一特征包括上下文特征，所述上下文特征表征所述第二对象在其他对象的影响下的特征；所述装置还包括：
124.第五确定单元，被配置为执行确定每个所述第二对象的影响特征和上下文特征之间的相似度；将所述至少一个第二对象的相似度进行融合，得到所述第一相似度。
125.在一些实施例中，所述装置还包括：
126.所述训练单元，还被配置为执行获取多条样本行为数据，每条所述样本行为数据用于表示属于不同类型的两个样本对象之间的交互行为；将所述多条样本行为数据按照发生时间由远及近的顺序，分为多个样本集，每个所述样本集所包含的样本行为数据的数量相同；基于所述多个样本集，依次训练所述推荐模型。
127.根据本公开实施例的再一方面，提供了一种电子设备，所述电子设备包括：
128.一个或多个处理器；
129.用于存储所述一个或多个处理器可执行指令的存储器；
130.其中，所述一个或多个处理器被配置为执行上述方面所述的媒体内容推荐方法或者推荐模型处理方法。
131.根据本公开实施例的再一方面，提供一种计算机可读存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述方面所述的媒体内容推荐方法或者推荐模型处理方法。
132.根据本公开实施例的再一方面，提供一种计算机程序产品，该计算机程序产品包括计算机程序，所述计算机程序被处理器执行以实现上述方面所述的媒体内容推荐方法或者推荐模型处理方法。
133.在本公开实施例中，新增行为数据代表了第一对象产生的新的交互行为，该交互行为会对与第一对象下相关的第二对象产生影响，通过确定受到新增行为数据对应的交互行为影响的第二对象的影响特征，从而基于该影响特征进行训练，这样训练得到的推荐模型所包括的对象特征的准确度较高，从而基于推荐模型确定出的第一用户账号和第一媒体内容之间的相似度的准确度也较高，进而提高了媒体内容的推荐准确度。
134.应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。
附图说明
135.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施
例，并与说明书一起用于解释本公开的原理。
136.图1是根据一示例性实施例示出的一种实施环境的示意图。
137.图2是根据一示例性实施例示出的一种推荐模型处理方法的流程图。
138.图3是根据一示例性实施例示出的一种推荐模型处理方法的流程图。
139.图4是根据一示例性实施例示出的一种推荐模型的训练过程示意图。
140.图5是根据一示例性实施例示出的一种推荐模型处理方法的流程图。
141.图6是根据一示例性实施例示出的一种媒体内容推荐方法的流程图。
142.图7是根据一示例性实施例示出的一种媒体内容推荐方法的流程图。
143.图8是根据一示例性实施例示出的一种媒体内容推荐装置的框图。
144.图9是根据一示例性实施例示出的一种推荐模型处理装置的框图。
145.图10是根据一示例性实施例示出的一种终端的结构框图。
146.图11是根据一示例性实施例示出的一种服务器的结构框图。
具体实施方式
147.为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。
148.需要说明的是，本公开的说明书和权利要求书及上述附图说明中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
149.需要说明的是，本公开所使用的术语“至少一个”、“多个”、“每个”、“任一”等，至少一个包括一个、两个或两个以上，多个包括两个或两个以上，每个是指对应的多个中的每一个，任一是指多个中的任意一个。
150.需要说明的是，本公开所涉及的用户数据(包括但不限于用户设备信息、用户个人信息等)，均为经用户授权或者经过各方充分授权的信息。
151.本公开实施例提供的媒体内容推荐方法的执行主体为电子设备。可选地，电子设备为终端或服务器，则该媒体内容推荐方法能够由终端或者服务器来实现，或者，由终端和服务器之间的交互实现，本公开实施例对此不加以限定。在本公开实施例中，以通过终端和服务器之间的交互实现媒体内容推荐方法为例进行说明。
152.图1是根据一示例性实施例示出的一种实施环境的示意图，参见图1，该实施环境包括：终端110与服务器120。终端110通过无线网络或有线网络与服务器120相连。
153.可选地，终端110为智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端110可以泛指多个终端中的一个，本实施例仅以终端110来举例说明。本领域技术人员可以知晓，上述终端的数量可以更多或更少。在一些实施例中，终端110安装有由服务器120提供服务的媒体内容展示应用。终端110能够通过该媒体内容展示应用实现与服务器120之间的数据交互。该媒体内容展示应用可以为视频应用或者音乐应用等。
154.可选地，服务器120为一台服务器、或者由若干服务器组成的服务器集群，或者是一个云计算服务中心。服务器120的数量可以更多或更少，本公开实施例对此不加以限定。当然，服务器120还可以包括其他功能服务器，以便提供更全面且多样化的服务。
155.在本公开实施例中，用户在终端110上对媒体内容进行某一种或多种行为，终端110登录有账号，因此账号与媒体内容之间产生交互行为，终端110获取到该交互行为对应的行为数据，向服务器120发送行为数据，由服务器102基于行为数据训练推荐模型。服务器120基于训练好的推荐模型确定推荐给账号的媒体内容，服务器120将媒体内容发送至登录该账号的终端110，终端110展示该媒体内容，以使操作终端110的用户能够查看该媒体内容。
156.需要说明的是，本公开实施例中用来训练推荐模型的行为数据既能够由终端上传至服务器，也能够由服务器自行获得，本公开实施例对此不加以限定。
157.在介绍完本公开实施例的实施环境之后，下面将结合上述实施环境，对本公开实施例的应用场景进行介绍。需要说明的是，在下述说明过程中，终端也即是上述终端110，服务器也即是上述服务器120。
158.在一些实施例中，本公开实施例提供的方法能够应用在媒体内容的推荐场景中。媒体内容包括视频、图片或者音频等。以媒体内容为短视频为例，在用户通过终端浏览短视频时，账号与短视频之间的交互行为被记录成新增行为数据，例如点赞行为、评论行为或者转发行为等。服务器采用本公开实施例提供的推荐模型处理方法，基于该新增行为数据，训练推荐模型。后续在对该终端中登录的账号进行推荐时，服务器采用本公开实施例提供的媒体内容推荐方法，根据已训练好的推荐模型确定为该账号推荐的短视频，从而为账号推荐该短视频。
159.在另一些实施例中，本公开实施例提供的方法还能应用在其他推荐场景中，例如物品推荐场景，在用户通过终端进行物品交易时，账号与物品之间的交互行为被记录成新增行为数据，例如交易行为、查看行为或者收藏行为等。服务器采用本公开实施例提供的推荐模型处理方法，基于新增行为数据，训练推荐模型。后续在对该终端中登录的账号进行推荐时，服务器采用本公开实施例提供的媒体内容推荐方法，根据已训练好的推荐模型确定为该账号推荐的物品，从而为账号推荐该物品。
160.需要说明的是，本公开实施例提供的推荐模型处理方法也能够应用在其他对模型进行处理的场景下，本公开实施例对此不加以限定。
161.图2是根据一示例性实施例示出的一种推荐模型处理方法的流程图，参见图2，该方法的执行主体为电子设备，包括以下步骤：
162.在步骤201中，电子设备获取第一行为信息，第一行为信息包括新增行为数据和历史行为数据，新增行为数据用于表示属于不同类型的两个第一对象之间的交互行为，类型包括账号和媒体内容，历史行为数据为与任一第一对象相关的第二对象所对应的历史行为数据。
163.在一些实施例中，一条新增行为数据为账号对媒体内容进行的交互行为对应的数据。历史行为数据是在生成新增行为数据之前，账号对媒体内容进行的交互行为对应的数据。第一行为信息中所包括的历史行为数据可以看做是受到新增行为数据影响的历史行为数据。
164.可选地，交互行为包括点赞行为、转发行为、发布行为、收藏行为或者评论行为等行为。相应地，交互行为所属的类型也即是交互类型包括多种，交互类型包括点赞类型、转发类型、发布类型、收藏类型或者评论类型等。
165.在一些实施例中，一个账号具有至少一个账号类型。也即是账号的账号类型为用户类型和作者类型中的至少一种。作者账号为发布媒体内容的账号，用户账号为与其他账号发布的媒体内容交互的账号。在本公开实施例中，由于一条新增行为数据是针对一个交互行为生成的，那么进行该交互行为的账号的账号类型是唯一的，例如账号发布媒体内容，则该账号为作者账号，再如账号点赞媒体内容，则该账号为用户账号。也即是一条新增行为数据中进行交互行为的账号可以是用户账号也可以是作者账号。
166.在步骤202中，电子设备获取推荐模型，推荐模型包括多个对象的第一特征，多个对象包括两个第一对象以及历史行为数据中的至少一个第二对象。
167.由于一个账号可能存在两种账号类型，也即是具有两种属性，然而每条新增行为数据是针对一种账号类型的账号而言的，那么对于具有两种账号类型的账号，推荐模型可以分别针对作者账号进行处理以及针对用户账号进行处理，从而训练得到的推荐模型中包括该账号的两个特征，两个特征分别为作者账号的特征和用户账号的特征，从而区分开同一个账号在不同的账号类型下的特征。其中，作者账号的特征也即是账号在作者属性下的特征，用户账号的特征也即是账号在用户属性下的特征。
168.对象的第一特征能够表示对象所匹配的媒体内容的语义信息，该语义信息是推荐模型的在训练过程中学习到的媒体内容的相关信息，例如语义信息能够表示媒体内容的类型或者其他信息。账号的第一特征表示账号所匹配的媒体内容的语义信息，媒体内容的第一特征表示该媒体内容的语义信息。匹配的媒体内容指的是账号所偏好的媒体内容。
169.在步骤203中，电子设备对于每个第一对象，基于第一对象的第一特征和与第一对象相关的第二对象的交互时间差，确定第二对象的影响特征。
170.其中，任一第二对象的影响特征表征第二对象在新增行为数据对应的交互行为的影响下的特征，第二对象的交互时间差为新增行为数据的发生时间与第二对象所属的历史行为数据的发生时间之间的时间差。
171.在步骤204中，电子设备基于与第一相似度负相关的传播损失，对推荐模型进行训练，第一相似度基于每个第二对象的影响特征与每个第二对象的第一特征之间的相似度确定。
172.其中，训练后的推荐模型包括多个对象的第二特征，且训练后的推荐模型用于基于多个对象的第二特征进行推荐。
173.在本公开实施例中，在两个第一对象进行交互行为得到新增行为数据之后，该交互行为能够对与第一对象相关的第二对象产生影响，从而通过基于第一对象的第一特征，以及，与该第一对象相关的第二对象的交互时间差，能够确定出表征新增行为数据对应的交互行为对该第二对象所产生的影响的影响特征，进一步地，由于传播损失是基于第二对象的影响特征与第二对象自身的第一特征之间的第一相似度确定的，使得推荐模型能够基于传播损失在训练过程中学习到该交互行为对第二对象的影响，这样不仅实现了在新发生交互行为时对推荐模型进行训练，还在训练时以此为基础结合了第二对象受到的新增行为数据的影响，进而大大提高了推荐模型的训练准确度。
174.在本公开实施例中，账号与媒体内容之间的交互行为是源源不断地在产生的，则新增行为数据在不断产生，从而电子设备能够基于新增行为数据以及受到该新增行为数据影响的历史行为数据，对推荐模型进行更新训练。
175.图3是根据一示例性实施例示出的一种推荐模型处理方法的流程图，参见图3，该方法的执行主体为电子设备，本公开实施例以基于第一行为信息，训练推荐模型为例进行说明，该方法包括以下步骤：
176.在步骤301中，电子设备获取第一行为信息，第一行为信息包括新增行为数据和历史行为数据，新增行为数据用于表示属于不同类型的两个第一对象之间的交互行为，类型包括账号和媒体内容，历史行为数据为与任一第一对象相关的第二对象所对应的历史行为数据。
177.例如，一条新增行为数据为(u，v，r，t)，其中，u为账号，v为媒体内容，r为交互行为对应的交互类型，t为新增行为数据的发生时间。其中，账号可以为用户类型的账号或者作者类型的账号。
178.在一些实施例中，第一行为信息包括属于不同节点类型的至少两个对象节点以及任两个对象节点之间连接的边，节点类型包括账号类型和媒体内容类型；其中，至少两个对象节点包括属于不同类型的两个第一对象节点和与任一第一对象节点直接连接或间接连接的第二对象节点。
179.两个第一对象节点及两个第一对象节点之间连接的第一边构成新增行为数据；属于不同类型的第一对象节点和第二对象节点以及第一对象节点与第二对象节点之间连接的第二边构成一条历史行为数据，和/或，属于不同类型的任两个第二对象节点以及任两个第二对象节点之间连接的第三边构成一条历史行为数据。
180.其中，第一行为信息以图的形式表示，一条行为数据由一条边和边连接的两个对象节点组成。边的边类型表示交互行为的交互类型，例如点赞类型或者转发类型等。节点类型中的账号类型还包括用户类型和作者类型，则对象节点包括作者账号节点、用户账号节点和媒体内容节点。由于对象节点存在多种节点类型，边也存在多种边类型，则第一行为信息对应的图为异构图。进一步地，用户账号可以对同一个媒体内容进行多个交互行为，例如点赞行为和收藏行为等，那么图中两个相连的对象节点之间可能存在多条不同边类型的边，则图为多重异构图。再进一步地，由于新增行为数据在不断产生，则图为动态的多重异构图。
181.在图中，一个账号对应用户节点和作者节点中的至少一种，图中的每个对象节点具有对应的特征，则一个账号可以有一个或者两个特征，也即是用户节点的特征和作者节点的特征中的至少一种。
182.在一些实施例中，在电子设备为终端的情况下，终端获取本端产生的新增行为数据，基于该新增行为数据和第二对象所对应的历史行为数据，训练推荐模型。或者，在电子设备为服务器的情况下，服务器借助于终端获取新增行为数据，基于该新增行为数据和第二对象所对应的历史行为数据，训练推荐模型。其中，终端将本端的账号和媒体内容进行的交互行为上报至服务器，服务器生成新增行为数据。
183.在一些实施例中，电子设备获取第一行为信息的实现方式包括：电子设备按照新增行为数据中的两个第一对象，对第二行为信息进行采样，得到第一行为信息，第二行为信
息包括新增行为数据和多条历史行为数据。
184.其中，第二行为信息包括大量的行为数据，第一行为信息是基于两个第一对象采样得到的少量行为数据。如第二行为信息以动态多重异构图表示，则第一行为信息为对动态多重异构图进行采样得到的激活子图。“激活”可以理解为第二对象受到了新增行为数据的影响。
185.在本公开实施例中，通过从包含较多历史行为数据的第二行为信息中采样得到第一行为信息，从而推荐模型无需每次在得到新增行为数据时都基于数据量较大的第二行为信息进行训练，而是基于数据量较少的第一行为信息进行训练即可，从而大大降低了模型训练的数据量，而且第一行为信息中的历史行为数据是按照新增行为数据中的两个第一对象采样得到的，是与新增行为数据有关的历史行为数据，后续基于新增行为数据和这些有关的历史行为数据训练推荐模型，能够充分考虑新增行为数据对历史行为数据的影响，进而提高推荐模型的准确度。
186.在一些实施例中，电子设备按照新增行为数据中的两个第一对象，对第二行为信息进行采样，得到第一行为信息的实现方式包括：电子设备获取采样方式集合，采样方式集合包括多种采样方式；从采样方式集合中，确定每个第一对象的采样方式；对于每个第一对象，从该第一对象开始，在第二行为信息中按照所确定的采样方式进行采样，将采样得到的历史行为数据与新增行为数据构成第一行为信息。
187.在本公开实施例中，通过按照每个第一对象对应的采样方式，从第二行为信息中采样得到第一行为信息，使得采样得到的第一行为信息较为准确。
188.可选地，第二行为信息以动态多重异构图表示，采样方式集合为元路径模式集合，元路径模式集合包括多个元路径模式，每个元路径模式指示一条元路径。元路径模式集合中的每个元路径模式都可以根据需要进行设置，本公开对此不加以限定。对于第一边连接的每个第一对象节点，电子设备从元路径模式集合中确定第一对象节点的至少一个元路径模式，以及设置好从第一对象节点出发采样的路径数，以及每条路径的路径长度。路径长度与路径所包括对象节点的数量对应，例如路径长度为5，则路径所包括对象节点的数量为5。
189.相应地，对于每个第一对象节点，电子设备从第二行为信息对应的动态多重异构图中按照元路径模式进行采样，得到该第一对象节点对应的路径集合，每条路径包括至少一条边。从而两个第一对象节点采样得到的多条路径组成激活子图。
190.例如，元路径模式集合为元路径模式为新边中的账号节点u的路径集合为其中，账号节点u存在k条路径，每条路径都满足元路径模式集合中的某个模式，满足条件如下：
[0191][0192]
其中，pi表示路径p的第i个对象节点，φ(pi)表示对象节点pi的节点类型，表示模式第个对象节点的节点类型，f(i,l)＝(i-1)modl)+1，mod为取余数运算，表示模式的路径长度为l，ψ(pj,p
j+1
)表示边(pj,p
j+1
)的边类型，pj和p
j+1
分别为边(pj,p
j+1
)连接的两个对象节点，表示模式第
个边的边类型。
[0193]
需要说明的是，由于事先设置的第一对象节点对应的每条路径的路径长度可能并不等于元路径模式所指示的元路径的路径长度，因此电子设备在采样过程中，可以对元路径模式中的路径进行重复，以使得元路径模式的路径长度足够长。
[0194]
例如，电子设备可以将元路径模式设置为对称形式。对于元路径模式集合中的非对称形式的元路径模式n为路径所包括的节点数量，电子设备可以将其转化为如下对称形式的元路径模式
[0195][0196]
需要说明的是，在获取到新增行为数据之后，在训练推荐模型之前，电子设备获取第一行为信息，从而在推荐模型的训练过程中，能够在基于第一行为信息进行推荐模型迭代训练的每次迭代过程中，使用事先采样得到的第一行为信息，无需每次迭代训练都重新进行采样。
[0197]
在步骤302中，电子设备获取推荐模型，推荐模型包括多个对象的第一特征，多个对象包括两个第一对象以及历史行为数据中的至少一个第二对象。
[0198]
可选地，第一特征能够以嵌入向量(embedding)的形式表示。
[0199]
在一些实施例中，该推荐模型为初始模型，也即是未经训练的模型。可选地，电子设备获取到的推荐模型所包括的多个对象的第一特征是推荐模型通过随机初始化得到的特征。其中，电子设备获取多条历史行为数据，从该多条历史行为数据中提取多个对象，通过推荐模型对该多个对象进行特征的随机初始化，得到多个对象的第一特征。
[0200]
在另一些实施例中，该推荐模型为训练好的模型。可选地，电子设备基于多个样本行为数据对初始模型进行训练，得到该推荐模型。基于多个样本行为数据训练得到推荐模型的实现过程参见图5所示实施例，在此不做赘述。若推荐模型为训练好的模型，则电子设备获取到的推荐模型所包括的多个对象的第一特征是推荐模型训练好的第一特征。
[0201]
在步骤303中，电子设备对于每个第一对象，基于第一对象的交互时间差，对第一对象的第一特征进行衰减，得到第一对象的交互特征，第一对象的交互时间差为新增行为数据的发生时间与第一对象所属的历史行为数据的发生时间之间的时间差。
[0202]
其中，第一对象所属的历史行为数据包括至少一条历史行为数据。在一些实施例中，第一对象所属的历史行为数据为该第一对象的最晚一次进行的交互行为对应的历史行为数据。其中，“最晚”表示在新增行为数据对应的交互行为发生之前且距离新增行为数据的发生时间最近。在本公开实施例中，通过在新增行为数据的发生时间的基础上，结合第一对象最晚一次进行的交互行为的发生时间，来确定第一对象的交互时间差，计算方式简单，获取交互时间差的效率较高。
[0203]
在另一些实施例中，第一对象所属的历史行为数据至少两条历史行为数据，该至少两条历史行为数据包括第一对象最晚进行的至少两次交互行为对应的历史行为数据。则电子设备获取第一对象的交互时间差的的实现方式包括：电子设备确定新增行为数据的发生时间与该至少两次交互行为中每次交互行为对应的历史行为数据的发生时间之间的时间差，基于至少两个时间差，确定第一对象的交互时间差。
[0204]
其中，第一对象的至少两次交互行为是依次进行的。该至少两次交互行为包括一
个时间段内的交互行为或者包括一定数量的交互行为。该时间段的时长可以根据需要设置，本公开实施例对此不加以限定。如时长为30分钟、1小时或者3小时等。该数量可以根据需要进行设置，本公开对此不加以限定。如数量为5、10或者20等。
[0205]
在该实施例的一种可能的实现方式中，电子设备基于至少两个时间差，确定第一对象的交互时间差的实现方式包括：电子设备将该至少两个时间差的平均值作为第一对象的交互时间差。在本公开实施例中，由于在确定对象的交互时间差时，参考了对象最晚进行的多次交互行为对应的交互时间，从而确定出的交互时间差的准确性较高。
[0206]
在一些实施例中，电子设备存储每条历史行为数据，从而电子设备能从已存储的历史行为数据中，获取第一对象所属的历史行为数据。需要说明的是，第一对象的交互时间差并不会随着推荐模型的迭代训练而改变，那么电子设备可以在获取到第一行为信息之后且在训练推荐模型之前，计算第一对象的交互时间差并存储，以使得推荐模型在迭代训练过程中可以获取已存储的第一对象的交互时间差，从而无需重复计算，进而能够提高模型的训练效率。
[0207]
在一些实施例中，第一对象的第一特征包括第一记忆特征和第二记忆特征。第一记忆特征表征第一对象长期的特征，第二记忆特征表征第一对象短期的特征。
[0208]
其中，第一记忆特征参考了第一对象在较长一段时间内产生的行为数据，能够表征第一对象长期以来的特征。第二记忆特征表征第一对象近期的特征，也就是近期产生的行为数据对第二记忆特征的影响更大。在一些实施例中，初始的推荐模型中的第一记忆特征和第二记忆特征是推荐模型随机初始化得到的，并不能准确表征第一对象的特征，但是随着推荐模型训练次数的增加，推荐模型结合新增行为数据对第二记忆特征进行衰减，使得第二记忆特征能够更加贴合第一对象近期的特征，从而训练完成的推荐模型包括了较为准确的第一记忆特征和第二记忆特征。
[0209]
则电子设备基于第一对象的交互时间差，对第一对象的第一特征进行衰减，得到第一对象的交互特征的实现方式包括以下步骤(1)-(2)：
[0210]
(1)电子设备基于第一对象的交互时间差，对第一对象的第二记忆特征进行衰减。
[0211]
在一些实施例中，电子设备基于第一对象的交互时间差，对第一对象的第二记忆特征进行衰减的实现方式包括：电子设备基于交互时间差和第一对象的类型对应的学习参数，确定第二衰减参数；基于第二衰减参数对第二记忆特征进行衰减。
[0212]
其中，第一对象的交互时间差越大，表示新增行为数据对应的交互行为与第一对象前一次或者前几次进行的交互行为之间的时间间隔较长，也即是第一对象近期进行交互行为的频率较低，则第二记忆特征难以准确表示第一对象近期匹配的媒体内容的语义信息。也即是对于第一对象而言，第二记忆特征与第一记忆特征的区别不大，因此可以将第二衰减参数设置的小一些，使得第二记忆特征在衰减前后的区别不大。相应地，第一对象的交互时间差越小，表示新增行为数据对应的交互行为与第一对象前一次或者前几次进行的交互行为之间的时间间隔较短，也即是第一对象近期进行交互行为的频率较高，则第二记忆特征能够准确表示第一对象近期匹配的媒体内容的语义信息。那么可以将第二衰减参数设置的大一些，使得第二记忆特征与第一记忆特征能够区分开。
[0213]
并且，第一对象的类型包括用户账号、作者账号或者媒体内容多种类型，电子设备能够基于第一对象的类型确定合适的学习参数，从而得到合适的第二衰减参数，使得不同
类型的第一对象，其第一特征的衰减程度也不一样。
[0214]
在本公开实施例中，第一对象的交互时间差能够体现第一对象的新增交互行为与历史交互行为之间的时间差，包含了交互行为的时间信息，而学习参数是与第一对象的类型对应的，包含了第一对象的类型的信息，通过结合交互时间差和学习参数对第二记忆特征进行衰减，使得第二记忆特征能够参考第一对象的时间信息和对象类型信息进行衰减，从而衰减后的第二记忆特征更加符合第一对象近期的特征，进而提高了第二记忆特征的准确性。
[0215]
可选地，电子设备采用以下公式，确定第二衰减参数：
[0216][0217]
其中，m为第二衰减参数，u为第一对象，φ(u)为第一对象的类型，α
φ(u)
为类型对应的学习参数，x和y为任意变量，δ(u)为交互时间差。
[0218]
在得到第二衰减参数之后，电子设备基于第二衰减参数对第二记忆特征进行衰减的实现方式包括：电子设备将第二衰减参数与第二记忆特征之积作为衰减后的第二记忆特征。
[0219]
(2)电子设备对第一对象的第一记忆特征与衰减后的第二记忆特征进行融合，得到第一对象的交互特征。
[0220]
在一些实施例中，本公开实施例对融合的实现方式不加以限定，以求和为例，电子设备将第一记忆特征和衰减后的第二记忆特征之和作为第一对象的交互特征。
[0221]
在本公开实施例中，由于交互特征融合了第一对象在动态交互过程中，通过自身相关的行为数据生成的第一记忆特征和第二记忆特征，也即是不仅融合了第一对象长期的特征，还融合了根据近期的交互行为的发生情况衰减后的短期的特征，因此该交互特征能够准确地表示第一对象的动态特征，准确性更高。
[0222]
在本公开实施例中，在确定出第一对象的交互特征之后，推荐模型能够结合第一对象的交互特征去确定推荐模型在这一次迭代训练过程中的模型损失，从而结合模型损失进行模型训练。其中，模型损失包括多个类型的损失。可选地，电子设备执行步骤303-步骤305的操作，确定推荐模型的交互损失，以及，电子设备执行步骤306-步骤308的操作，确定推荐模型的传播损失。本公开实施例对两个模型损失的确定顺序不加以限定。
[0223]
在步骤304中，电子设备基于第一对象的交互特征，确定第一对象的衰减特征，衰减特征表征在新增行为数据对应的交互行为的影响下第一对象的第一特征衰减后的特征。
[0224]
其中，第一对象的衰减特征是推荐模型在一次迭代训练过程中，基于第一对象的交互时间差预测出的第一对象的特征。在一些实施例中，电子设备直接将第一对象的交互特征作为第一对象的衰减特征。
[0225]
在另一些实施例中，第一对象的第一特征还包括上下文特征，上下文特征表示第一对象在其他对象的影响下的特征；则步骤304的实现方式包括：电子设备对第一对象的交互特征和上下文特征进行加权融合，得到第一对象的衰减特征。
[0226]
其中，本公开实施例对加权融合的实现方式不加以限定，以加权求和为例，电子设备将交互特征和上下文特征进行加权求和，得到衰减特征。权重可以根据需要进行设置，例
如，电子设备直接将交互特征和上下文特征之和作为衰减特征。
[0227]
在本公开实施例中，通过加权融合得到第一对象的衰减特征，使得确定出的衰减特征不仅参考了第一对象能够表示动态信息的交互特征，还参考了第一对象在其他对象的交互行为的影响下的上下文特征，这样由于参考了多个维度的特征，从而提高了衰减特征的准确性。
[0228]
在一些实施例中，第一对象的上下文特征包括第一对象针对多种交互类型的上下文特征，新增行为数据包括交互行为对应的目标交互类型。其中，每种交互类型对应一个上下文特征，则电子设备能够基于相应类型的上下文特征，来确定第一对象的衰减特征，以提高衰减特征的准确性。在该实施例的一种可能的实现方式中，电子设备对第一对象的交互特征和上下文特征进行加权融合，得到第一对象的衰减特征的实现方式包括：电子设备从第一对象针对多种交互类型的上下文特征中，确定目标交互类型对应的上下文特征；对第一对象的交互特征和目标交互类型对应的上下文特征进行加权融合，得到第一对象的衰减特征。
[0229]
其中，本公开实施例对加权融合的实现方式不加以限定，以加权求和为例，电子设备将第一对象的交互特征和目标交互类型对应的上下文特征进行加权求和，得到第一对象的衰减特征。权重可以根据需要进行设置，例如，电子设备直接将交互特征和目标交互类型对应的上下文特征之和作为衰减特征。
[0230]
在本公开实施例中，由于交互类型能够表示对象不同的交互行为，而不同的交互行为能够体现出对象与不同的媒体内容的联系，以对象为账号为例，例如账号对短视频a的点击行为与账号对短视频b的点赞行为能够体现出账号对这两个短视频不同偏好程度，账号对短视频b的偏好程度可能更大。因此交互类型也能对对象的特征产生影响。
[0231]
在本公开实施例中，由于不同交互类型对应有不同的上下文特征，通过基于新增行为数据的目标交互类型对应的上下文特征来确定第一对象的衰减特征，使得衰减特征与本次发生的交互行为对应的目标交互类型更加匹配，从而大大提高了衰减特征的准确性。
[0232]
可选地，电子设备采用以下公式，确定第一对象的衰减特征：
[0233][0234]
其中，a为第一对象，为衰减特征，为第一记忆特征，为第二记忆特征，r为目标交互类型，为目标交互类型对应的上下文特征，g(x)为第二衰减参数，x和y为任意变量，α
φ(a)
为学习参数，φ(a)为第一对象的类型，δa为交互时间差。
[0235]
例如，以新增行为数据对应的交互行为为动态多重异构图中的边(u,v,r,t)，两个对象分别为连接的账号节点u和媒体内容节点v为例，r为边类型，t为交互时间，则账号节点u的衰减特征为媒体内容节点v的衰减特征为
[0236]
在本公开实施例中，由于第一对象的衰减特征是将多个维度的特征进行融合得到的，从而衰减特征的准确性较高。
[0237]
在步骤305中，电子设备基于两个第一对象的衰减特征，确定与第二相似度负相关的交互损失，第二相似度为两个第一对象的衰减特征之间的相似度。
[0238]
其中，由于账号的特征指代账号匹配的媒体内容的语义信息，而媒体内容的特征指代媒体内容的语义信息，则若两个第一对象进行了交互行为，则这两个第一对象的特征应当更接近，从而表示账号更偏好该媒体内容。在推荐模型的训练过程中，模型的训练目标是最大化两个第一对象的衰减特征之间的相似度，也即是第二相似度。进一步地，交互损失与第二相似度负相关，则交互损失越小，表示两个第一对象的衰减特征越相似。
[0239]
在本公开实施例中，由于交互损失与两个第一对象的衰减特征之前的相似度负相关，从而交互损失能够准确表示出推荐模型在训练过程的预测偏差，并且交互损失的计算过程较为简单，从而降低了模型损失的计算难度。
[0240]
在一些实施例中，衰减特征以嵌入向量的形式表示，则两个第一对象的衰减特征之间的相似度能够通过两个衰减特征的内积表示。可选地，电子设备采用以下公式，确定交互损失：
[0241][0242]
其中，为交互损失，z为任意变量，和分别为两个第一对象的衰减特征。
[0243]
在本公开实施例中，通过用两个衰减特征的内积来计算推荐模型的交互损失，这样既降低了计算难度还能够准确表示两个衰减特征之间的相似度，从而能够又快又准的计算出交互损失。
[0244]
在步骤306中，电子设备对于每个第一对象，基于第一对象的交互特征和与第一对象属于同一历史行为数据的第二对象的交互时间差，确定与第一对象相关的第二对象的影响特征。
[0245]
其中，任一第二对象的影响特征表征第二对象在新增行为数据对应的交互行为的影响下的特征，第二对象的交互时间差为新增行为数据的发生时间与第二对象所属的历史行为数据的发生时间之间的时间差。
[0246]
其中，由于任一个第一对象在电子设备获取新增行为数据之前，很有可能已经进行过其他交互行为，也即是存在历史行为数据了，那么新增行为数据的发生会对这些历史行为数据产生影响，那么这些历史行为数据包括的第二对象的特征也应该更新。
[0247]
可选地，电子设备基于第一对象的交互特征和与第一对象属于同一历史行为数据的第二对象的交互时间差，确定与第一对象相关的第二对象的影响特征的实现方式包括：电子设备在该交互时间差不大于时间差阈值的情况下，确定与交互时间差负相关的第一衰减参数，按照第一衰减参数对第一对象的交互特征进行衰减，得到第二对象的影响特征；或者，在该交互时间差大于时间差阈值的情况下，将预设影响特征确定为第二对象的影响特征。
[0248]
其中，时间差阈值为设置好的一个时间差。第二对象的交互时间差大于时间差阈值，表示在进行该历史行为数据对应的交互行为之后较长一段时间内，第一对象才进行了新增行为数据对应的交互行为，那么新增行为数据对应的交互行为对该第二对象的影响程度较小，则电子设备可以直接将预设影响特征确定为第二对象的影响特征，相应地，预设影响特征设置为较小的数值。
[0249]
而第二对象的交互时间差不大于时间差阈值，表示在进行该历史行为数据对应的
交互行为之后较短一段时间内，第一对象就进行了新增行为数据对应的交互行为，那么新增行为数据对应的交互行为对该第二对象的影响程度较大，则电子设备可以进一步地根据交互时间差的大小确定不同的第一衰减参数，以使得第二对象的影响特征能够更加准确地表示第二对象所受到的影响的影响程度。可选地，交互时间差越大，表示影响程度越小，则第一衰减参数越小；交互时间差越小，表示影响程度越大，则第一衰减参数越大。
[0250]
其中，时间差阈值和预设影响特征可以根据需要进行设置，本公开实施例对此不加以限定，例如将预设影响特征设置为0，时间差阈值设置为1小时、2小时或者5小时等。
[0251]
在本公开实施例中，由于第二对象的交互时间差的大小能够影响到新增行为数据对应的交互行为对第二对象的影响程度，在交互时间差较小时，表示历史行为数据与新增行为数据的发生时间相距较近，新增行为数据对历史行为数据的影响较大，因此按照与交互时间差负相关的衰减参数对第一对象的交互特征进行衰减，能够更好地反映新增行为数据的影响，从而提高了影响特征的准确性。而在交互时间差较大时，表示历史行为数据与新增行为数据的发生时间相距较远，新增行为数据对历史行为数据的影响较小，因此将预设影响特征确定为第二对象的影响特征即可，而无需按照与交互时间差负相关的衰减参数对第一对象的交互特征进行衰减，节省了计算量。
[0252]
可选地，电子设备采用以下公式，确定第二对象的影响特征：
[0253][0254]
其中，p为第一对象和第二对象同属的历史行为数据，u
p
为第一对象，b
p
为第二对象，为第一对象的交互特征，为第二对象的影响特征，δ(t
p
)＝t-t
p
，t为新增行为数据的发生时间，t
p
为历史行为数据的发生时间，w为任意变量，τ为阈值，为第一衰减参数。
[0255]
在本公开实施例中，将第一对象衰减后的交互特征作为第二对象的影响特征，从而准确地表示了第二对象在受到新增行为数据对应的交互行为影响下的特征，从而提高了影响特征的准确性。
[0256]
在步骤307中，电子设备继续基于第二对象的影响特征和与第二对象属于同一历史行为数据的另一第二对象的交互时间差，确定另一第二对象的影响特征，直至确定出第一行为信息中与第一对象相关的每个第二对象的影响特征。
[0257]
其中，对于与第一对象相关的第二对象，第一对象对第二对象的影响程度随着第二对象与第一对象的距离增大而减小，也即是第二对象与第一对象的距离越大，则第二对象受到第一对象的影响程度越小，第一对象传播给该第二对象的信息越少。其中，以对象为动态多重异构图中的对象节点为例，两个对象之间的距离可以通过两个对象节点相隔的边的数量表示，例如两个对象节点通过一条边连接，则两个对象节点相距较近，两个对象节点之间通过其他对象节点以及多条边连接，则两个对象节点相距较远。
[0258]
在一些实施例中，电子设备基于第二对象的影响特征和与第二对象属于同一历史行为数据的另一第二对象的交互时间差，确定另一第二对象的影响特征的实现方式与步骤306的实现方式同理，在此不再赘述。步骤303以及步骤306-步骤307是电子设备对于每个第
一对象，基于第一对象的第一特征和与第一对象相关的第二对象的交互时间差，确定第二对象的影响特征的一种实现方式。
[0259]
在本公开实施例中，两个第一对象进行的交互行为会对第二对象产生影响，且该交互行为与第二对象所进行的交互行为之间的时间差越远，影响越小，通过基于第一对象的交互特征和第二对象的交互时间差来确定第二对象的影响特征，使得影响特征是在交互特征的基础上参考了交互时间差确定的，从而确定出影响特征的准确性较高。并且，在第一行为信息中包含着众多的对象，第一对象可以与多个第二对象直接或间接相关，因此根据第一对象与多个第二对象之间的关联关系，先确定与第一对象直接相关的第二对象的影响特征，再确定与该第二对象直接相关的另一第二对象的影响特征，这种逐次确定影响特征的方式能够更加贴切地反映第一对象与各个第二对象之间的关联性的强弱，从而提高了各个第二对象影响特征的准确性。
[0260]
在一些实施例中，电子设备对于每个第一对象，基于第一对象的第一特征和与第一对象相关的第二对象的交互时间差，确定第二对象的影响特征的过程能够以图结构的方式实现，相应地，该过程包括以下步骤：
[0261]
电子设备对于每个第一对象节点，基于第一对象节点的交互时间差，对第一对象节点的第一特征进行衰减，得到第一对象节点的交互特征，第一对象节点的交互时间差为第一边的发生时间和第一对象节点所连接的第二边的发生时间之间的时间差；基于第一对象节点的交互特征和与第一对象节点直接连接的第二对象节点的交互时间差，确定第二对象节点的影响特征；继续基于第二对象节点的影响特征和与第二对象节点直接连接的另一第二对象节点的交互时间差，确定另一第二对象节点的影响特征，直至确定出第一行为信息中与任一第一对象节点直接连接或间接连接的每个第二对象节点的影响特征。
[0262]
其中，对于第一边的每个第一对象节点，该第一对象节点的交互特征从该第一对象节点出发，沿着激活子图中的路径依次进行传播，从而第一对象节点的交互特征能够传播给路径上的每个第二对象节点，且交互特征在传播过程中逐步衰减。
[0263]
在本公开实施例中，通过以图结构的形式表示行为数据，使得多个对象之间的关联关系更加清晰，因此根据第一对象节点与多个第二对象节点之间的关联关系，先确定与第一对象节点直接连接的第二对象的影响特征，再确定与该第二对象直接连接的另一第二对象节点的影响特征，这种逐条处理，依次确定每个第二对象节点的影响特征的方式能够更加贴切地反映第一对象与各个第二对象之间的关联性的强弱，从而提高了各个第二对象影响特征的准确性。
[0264]
在步骤308中，电子设备确定与第一相似度负相关的传播损失，第一相似度基于每个第二对象的影响特征与每个第二对象的第一特征之间的相似度确定。
[0265]
其中，第二对象的第一特征包括上下文特征，上下文特征表征第二对象在其他对象的影响下的特征；则电子设备确定第一相似度的实现方式包括：电子设备确定每个第二对象的影响特征和上下文特征之间的相似度；将至少一个第二对象的相似度进行融合，得到第一相似度。
[0266]
其中，本公开实施例对融合的实现方式不加以限定，以求和为例，电子设备将至少一个第二对象的相似度之和作为第一相似度。
[0267]
在本公开实施例中，由于第二对象的上下文特征能够表征第二对象在其他对象的
影响下的特征，且第二对象的影响特征是第二对象在受到新增行为数据对应的交互行为的影响下的特征，那么第二对象的影响特征和上下文特征之间的相似度能够体现出推荐模型对第二对象的影响特征的预测准确度，因此确定出的第一相似度较为准确，进而提高了传播损失的准确性。
[0268]
推荐模型训练的训练目标应该是最大化第二对象的影响特征和上下文特征之间的相似度，也即是该相似度越大，则推荐模型的传播损失越小，则第一相似度与推荐模型的传播损失负相关。在一些实施例中，特征以嵌入向量的形式表示，则两个特征之间的相似度能够通过两个特征的内积表示，则电子设备能够采用以下公式，确定传播损失：
[0269][0270]
其中，为传播损失，pu∪pv为第一行为信息，pu为第一对象u相关的第二对象对应的历史行为数据，pv为第一对象v相关的第二对象对应的历史行为数据，p为第一行为信息中的任一条历史行为数据，r为历史行为数据p对应的交互行为所属的交互类型，为第二对象的交互类型r对应的上下文特征，为第二对象的影响特征。
[0271]
在本公开实施例中，通过用影响特征和上下文特征的内积来计算模型的传播损失，这样既降低了计算难度还能够准确表示两个特征的相似度，从而能够又快又准的计算出传播损失。
[0272]
例如，以第一行为信息为激活子图为例，推荐模型的传播损失可以采用如下公式确定：
[0273][0274]
其中，账号节点为u，媒体内容节点为v，为激活子图，为账号节点u对应的路径集合，为媒体内容节点v对应的路径集合，p为激活子图中的任一路径，i为路径p上的边的序号，《vi,ri》表示沿边类型为ri的边向节点vi传播，为节点vi沿路径p的影响特征，为节点vi针对边类型ri的上下文向量，χ(
·
)为示性函数。示性函数表示在事件为真事件时，取1，在事件为假事件时，取0。
[0275]
在步骤309中，电子设备将传播损失和交互损失进行融合，得到推荐模型的模型损失。
[0276]
其中，本公开实施例对融合的实现方式不加以限定，以求和为例，电子设备将传播损失和交互损失之和作为模型损失。
[0277]
在一些实施例中，模型损失还包括负采样损失。负采样损失表示推荐模型根据负样本进行训练得到的损失，而上述情况中的交互损失和传播损失均为推荐模型根据正样本进行训练得到的损失。其中，正样本也即是真实的行为数据，负样本是假的行为数据，也即是负样本中的每条行为数据中的至少两个对象并未发生交互行为。
[0278]
可选地，步骤309的实现方式包括：电子设备将交互损失、传播损失和负采样损失
进行融合，得到推荐模型的模型损失。则电子设备采用以下公式，确定模型损失：
[0279][0280]
其中，为交互损失，为传播损失，为负采样损失。
[0281]
在一些实施例中，电子设备确定负采样损失的实现方式包括：电子设备从第二行为信息中，确定每个第一对象对应的第三对象，第二行为信息包括新增行为数据和多条历史行为数据，第三对象为与第二行为信息中除第一对象外的其他对象；确定与第三相似度负相关的负采样损失，第三相似度基于第一对象的交互特征与第三对象的上下文特征之间的相似度确定，上下文特征表征第三对象在其他对象的影响下的特征。
[0282]
在一些实施例中，第三对象为第一对象的非交互对象，也即是第三对象和第一对象不同时属于任一条历史行为数据。以第一对象为账号为例，账号的非交互对象可以为账号或者媒体内容，而既然账号与非交互对象未交互，那么表示账号所属用户对该非交互对象对应的媒体资源的兴趣不大，那么账号的交互特征与非交互对象的上下文特征的相似度较小。在推荐模型的训练过程中，推荐模型的训练目标应该是最小化第一对象的交互特征与第三对象的上下文特征之间的相似度。
[0283]
在本公开实施例中，通过对第二行为信息进行负采样，以实现为推荐模型提供负样本，通过确定出推荐模型的负采样损失，从而在传播损失和交互损失的基础上额外添加负采样损失，使得推荐模型能够结合正样本和负样本进行训练，进而提高了推荐模型训练的准确性。
[0284]
在一些实施例中，电子设备从第二行为信息中，确定每个第一对象的第三对象的实现方式包括：电子设备基于目标概率分布的方式，从第二行为信息中，确定每个第一对象的第三对象。其中，目标概率分布可以根据需要进行设置，如随机分布、均匀分布或者高斯分布。对于每个第一对象，电子设备基于目标概率分布，确定第二行为信息中除两个第一对象以外的每个对象的概率，确定一个随机数，该随机数的取值范围为(0，1)，将该随机数所在的范围对应的概率所属的对象作为第三对象。其中，电子设备可以设置好第三对象的数量，从而依次按照上述实现方式从第二行为信息中选择该数量个第三对象。
[0285]
在一些实施例中，特征以嵌入向量的形式表示，则两个特征之间的相似度能够通过两个特征的内积表示，则电子设备能够采用以下公式，确定负采样损失：
[0286][0287]
其中，ns为第三对象的数量，s表示负采样，j＝1、2、3、
……
、ns，p
neg
为负采样满足的目标概率分布，k为第三对象在目标概率分布下对应的概率，e表示期望，q1为第一对象u的第三对象，q2为第一对象v的第三对象，是第三对象q1针对边类型r的上下文特征，为第一对象u的交互特征，是第三对象q2针对边类型r的上下文特征，为第一对象v的交互特征。
[0288]
在本公开实施例中，通过用第一对象的交互特征和第三对象的上下文特征的内积来计算推荐模型的负采样损失，这样既降低了计算难度还能够准确表示两个特征的相似度，从而能够又快又准的计算出负采样损失。
[0289]
在本公开实施例中，推荐模型还包括模型参数，则电子设备在得到模型损失之后，执行步骤310的操作。
[0290]
在步骤310中，电子设备基于模型损失，对推荐模型中的模型参数和多个对象的第一特征进行更新，得到训练后的推荐模型，训练后的推荐模型包括多个对象的第二特征，且训练后的推荐模型用于基于多个对象的第二特征进行推荐。
[0291]
在一些实施例中，电子设备在模型训练的第i次迭代过程中，将新增行为数据输入第i-1次迭代过程所确定的推荐模型，得到该第i次迭代过程的模型损失，基于模型损失对第i-1次迭代过程所确定的模型参数和多个对象的第一特征进行更新，其中，i为大于1的正整数；基于更新后的模型参数和多个对象的第一特征进行第i+1次迭代过程，重复上述训练的迭代过程，直至训练满足目标条件。
[0292]
在一些实施例中，训练满足的目标条件为模型的训练迭代次数达到目标次数，该目标次数为预先设定的训练迭代次数，如1000次；或者，训练满足的目标条件为模型损失满足目标阈值条件，如模型损失小于0.00001。本公开实施例对目标条件的设置不加以限定。
[0293]
在本公开实施例中，通过将传播损失和交互损失进行融合，得到模型损失，该模型损失能够体现第二对象受到新增行为数据的影响而带来的损失，以及两个第一对象之间的交互行为对第一对象的影响而带来的损失，从而通过基于模型损失对推荐模型进行迭代训练，能够训练出较优的模型参数和对象的第二特征，以获取到预测能力较优的推荐模型，进而提高了推荐模型的预测准确性。
[0294]
在本公开实施例中，电子设备可以直接将交互损失作为模型损失，基于交互损失对推荐模型进行训练，也即是电子设备在执行完步骤301-步骤305之后，直接执行步骤310的操作。或者，电子设备可以直接将传播损失作为模型损失，基于传播损失对推荐模型进行训练，也即是电子设备执行完步骤301-步骤303之后，执行步骤306-步骤308，然后执行步骤310的操作。再或者，电子设备可以将交互损失和传播损失进行融合，根据融合得到的模型损失对推荐模型进行训练，也即是电子设备在执行完成301-步骤308之后，执行步骤309-步骤310的操作。
[0295]
在本公开实施例中，通过结合基于两个第一对象的衰减特征之间的相似度确定的交互损失以及基于第二对象的影响特征和自身的第一特征之间的相似度确定的传播损失，来对推荐模型进行训练，使得推荐模型在训练过程中能够参考上述两个相似度，从而提高了训练准确度。
[0296]
需要说明的是，电子设备还能够直接基于传播损失和负采样损失对推荐模型进行训练，则电子设备基于与第一相似度负相关的传播损失，对推荐模型进行训练的实现方式包括：电子设备基于与第一相似度负相关的传播损失和负采样损失，对推荐模型进行训练。可选地，该过程的实现方式与步骤309-步骤310的实现方式同理，在此不再赘述。
[0297]
在本公开实施例中，由于负采样损失是基于对第二行为信息进行负采样得到第三对象的第一特征以及第一对象的交互特征之前的相似度确定的，且传播损失是基于第二对象的影响特征和自身的第一特征之间的相似度确定的，通过结合负采样损失和传播损失来对推荐模型进行训练，使得推荐模型在训练过程中能够参考上述两个相似度，从而提高了训练准确度。
[0298]
需要说明的是，本公开实施例是以新增行为数据的数量为1为例进行说明的。在一
reciprocal rank，正确召回值在召回记过中的排名)指标具有平均23.62％的相对提升。说明，本公开实施例提供的supa推荐模型考虑了随时间变化不同对象类型和不同交互类型对对象特征造成的不同影响，更好利用了行为数据中的语义信息和时间信息，能够较好的捕获动态流式数据中丰富的语义信息，并且学习到对象的特征在不同时间不同交互行为下的差异化表达。
[0304]
在本公开实施例中，在两个第一对象进行交互行为得到新增行为数据之后，该交互行为能够对与第一对象相关的第二对象产生影响，从而通过基于第一对象的第一特征，以及，与该第一对象相关的第二对象的交互时间差，能够确定出表征新增行为数据对应的交互行为对该第二对象所产生的影响的影响特征，进一步地，由于传播损失是基于第二对象的影响特征与第二对象自身的第一特征之间的第一相似度确定的，使得推荐模型能够基于传播损失在训练过程中学习到该交互行为对第二对象的影响，这样不仅实现了在新发生交互行为时对推荐模型进行训练，还在训练时以此为基础结合了第二对象受到的新增行为数据的影响，进而大大提高了推荐模型的训练准确度。
[0305]
上述图3所示的实施例对推荐模型的训练过程进行了介绍，在另一实施例中，在基于第一行为信息训练推荐模型之前，电子设备能够基于样本行为数据训练推荐模型，以得到具有一定推荐准确度的推荐模型。
[0306]
图5是根据一示例性实施例示出的一种推荐模型处理方法的流程图，参见图5，该方法的执行主体为电子设备，包括以下步骤：
[0307]
在步骤501中，电子设备获取多条样本行为数据，每条样本行为数据用于表示属于不同类型的两个样本对象之间的交互行为。
[0308]
其中，样本对象为账号或者媒体内容。在一些实施例中，样本行为数据为历史交互过程中，账号与媒体内容进行交互行为产生的行为数据。也即是，样本行为数据可以为第二行为信息中除新增行为数据以外的历史行为数据。
[0309]
在步骤502中，电子设备将多条样本行为数据按照发生时间由远及近的顺序，分为多个样本集，每个样本集所包含的样本行为数据的数量相同。
[0310]
其中，多条样本行为数据可以以数据表(edges)的形式输入到推荐模型中，每条样本行为数据的发生时间可以以时间戳的形式表示。在一些实施例中，由于多条样本行为数据的数量较多，电子设备分批次对推荐模型(model)进行训练。而由于则通过按照交互时间由远及近的顺序对多个样本行为进行排序，使得推荐模型能够参考到行为数据的发生时间对对象特征的确定所产生的影响，每相邻目标数量(batch_size)条样本行为数据作为一个样本集(batch)。本公开对目标数量的设置不加以限定。例如，多条样本行为数据的数量为1000，则可以每100条样本行为数据组成一个样本集。
[0311]
在步骤503中，电子设备基于多个样本集，依次训练推荐模型。
[0312]
在一些实施例中，电子设备在每个样本集内对推荐模型进行迭代训练。每迭代目标轮次(valid_interval)，就基于验证集验证推荐模型的效果，验证集可以是当前样本集中交互时间靠后的一定数量(valid_size)的样本行为数据。对于每个样本集的训练终止条件，也即是训练满足的目标条件可以是推荐模型的效果不断提升但达到最大训练迭代次数(max_iter)，或者，还可以是推荐模型的效果连续下降轮数超过最大值(max_patient)。
[0313]
其中，每个样本集的迭代训练终止之后，选择验证效果最好的推荐模型续训练下
一个样本集，直到多个样本集训练完成。在一些实施例中，对于每个样本集，步骤503的实施方式与步骤301-步骤310的实施方式同理，在此不再赘述。
[0314]
需要说明的是，本公开实施例是以动态多重异构图为例进行说明，此外电子设备还可以通过本公开实施例提供的推荐模型对同构图或者静态图形式的行为数据进行训练。其中，同构图为节点类型的数量和边类型的数量均为1的图。静态图为每个边的发生时间都相同的图。相应地，在对同构图形式的行为数据进行训练时，电子设备将交互类型和对象类型均设置为1。在对静态图形式的行为数据进行训练时，电子设备将每条行为数据的发生时间设置成相同的时间即可。
[0315]
在本公开实施例中，由于账号与媒体内容之间的交互行为是源源不断地在产生的，那么第二行为信息所包括的行为数据的数量不断增大。则通过根据现有的行为数据对初始模型进行训练，得到一个推荐准确性较高的推荐模型，再根据新增行为数据对推荐模型进行更新训练，从而推荐模型采用的是一个单趟遍历的训练框架进行训练，无需每次在获取到新增行为数据之后用全部历史行为数据和新增行为数据一起对推荐模型进行更新训练，从而大大提高了模型训练效率。
[0316]
在一些实施例中，在训练好推荐模型之后，电子设备能够调用该推荐模型进行推荐。图6是根据一示例性实施例示出的一种媒体内容推荐方法的流程图，参见图6，该方法的执行主体为电子设备，包括以下步骤：
[0317]
在步骤601中，电子设备获取推荐模型，推荐模型包括多个对象的对象特征，多个对象包括用户账号和媒体内容。
[0318]
在步骤602中，电子设备基于第一用户账号的账号特征和第一媒体内容的内容特征，确定第一用户账号与第一媒体内容之前的相似度，第一用户账号为用户账号中的任意一个，第一媒体内容为媒体内容中任意一个。
[0319]
在步骤603中，电子设备基于相似度确定向第一用户账号推荐第一媒体内容。
[0320]
其中，多个对象包括第一对象和第二对象，第一对象为新增行为数据中的对象，第二对象为与第一对象相关的对象，推荐模型是基于与第一相似度负相关的传播损失训练得到的，第一相似度基于第二对象的影响特征与第二对象的对象特征之间的相似度确定，影响特征表征第二对象在新增行为数据对应的交互行为的影响下的特征。
[0321]
在一些实施例中，推荐模型中包括账号的用户类型对应的特征和作者类型对应的特征中的至少一种。推荐模型可以为用户类型的账号也即用户账号推荐媒体内容，则在账号的账号类型为用户类型时，电子设备获取账号用户类型的特征；在账号具有作者类型和用户类型两个类型时，电子设备也获取该账号用户类型的特征。
[0322]
在本公开实施例中，新增行为数据代表了第一对象产生的新的交互行为，该交互行为会对与第一对象下相关的第二对象产生影响，通过确定受到新增行为数据对应的交互行为影响的第二对象的影响特征，从而基于该影响特征进行训练，这样训练得到的推荐模型所包括的对象特征的准确度较高，从而基于推荐模型确定出的第一用户账号和第一媒体内容之间的相似度的准确度也较高，进而提高了媒体内容的推荐准确度。
[0323]
图7是根据一示例性实施例示出的一种媒体内容推荐方法的流程图，参见图7，该方法的执行主体为电子设备，本公开实施例以电子设备向账号推荐媒体内容为例进行说明，该方法包括以下步骤：
[0324]
在步骤701中，电子设备获取推荐模型，推荐模型包括多个对象的对象特征，多个对象包括用户账号和媒体内容。
[0325]
其中，推荐模型基于步骤301-步骤310训练得到，本公开在此不再赘述。一个账号具有至少一个账号类型，本公开实施例以向用户类型的账号也即用户账号推荐媒体内容为例进行说明。
[0326]
在步骤702中，电子设备基于第一用户账号的账号特征，确定第一用户账号的融合特征，以及，基于第一媒体内容的内容特征，确定第一媒体内容的融合特征。
[0327]
其中，第一用户账号为用户账号中的任意一个，第一媒体内容为媒体内容中任意一个。在一些实施例中，账号特征包括第一用户账号的第一记忆特征和第二记忆特征，第一记忆特征表征第一用户账号长期的特征，第二记忆特征表征第一用户账号短期的特征；内容特征包括第一媒体内容的第一记忆特征和第二记忆特征，第一媒体内容的第一记忆特征表征第一媒体内容长期的特征，第一媒体内容的第二记忆特征表征第一媒体内容短期的特征。
[0328]
可选地，电子设备基于第一用户账号的账号特征，确定第一用户账号的融合特征的实现方式包括：电子设备对第一用户账号的第一记忆特征和第二记忆特征进行融合，得到第一用户账号的融合特征。电子设备基于第一媒体内容的内容特征，确定第一媒体内容的融合特征的实现方式包括：电子设备对第一媒体内容的第一记忆特征和第二记忆特征进行融合，得到第一媒体内容的融合特征。
[0329]
其中，本公开实施例对融合的实现方式不加以限定，以求和为例，电子设备将第一用户账号的第一记忆特征和第二记忆特征之和作为第一用户账号的融合特征，将第一媒体内容的第一记忆特征和第二记忆特征之和作为第一媒体内容的融合特征。
[0330]
在另一些实施例中，账号特征包括还包括第一用户账号的上下文特征，上下文特征表示第一用户账号在其他对象的影响下的特征；则电子设备对第一用户账号的第一记忆特征和第二记忆特征进行融合，得到第一用户账号的融合特征的实现方式包括：电子设备对第一用户账号的第一记忆特征、第二记忆特征和上下文特征进行融合，得到第一用户账号的融合特征。第一媒体内容的融合特征的确定过程同理，在此不再赘述。
[0331]
需要说明的是，第一用户账号的上下文特征包括第一用户账号针对多个交互类型的上下文特征，电子设备可以确定出第一用户账号针对每个交互类型的融合特征。同理，电子设备还可以确定出第一媒体内容针对每个交互类型的融合特征。
[0332]
在本公开实施例中，由于第一用户账号的融合特征是将第一用户账号多个维度的特征进行融合得到的，从而该融合特征不仅参考了第一用户账号本身进行的交互行为对应的记忆特征，还参考了第一用户账号在其他对象进行的交互行为的影响下对应的上下文特征，进而提高了融合特征的准确性。
[0333]
在步骤703中，电子设备确定第一用户账号的融合特征和第一媒体内容的融合特征之间的相似度。
[0334]
其中，相似度可以为余弦相似度，或者其他能衡量特征之间的相似度的参数。在本公开实施例中，以相似度为余弦相似度为例进行说明。在一些实施例中，若融合特征包括针对多个交互类型的融合特征，则电子设备确定第一用户账号和第一媒体内容针对同一交互类型的相似度。例如，多个交互类型包括点赞类型、转发类型和收藏类型，则针对每个交互
类型，电子设备分别确定出一个相似度。
[0335]
在一些实施例中，步骤702-步骤703为电子设备基于第一用户账号的账号特征和第一媒体内容的内容特征，确定第一用户账号与第一媒体内容之间的相似度的一种实现方式。
[0336]
在本公开实施例中，由于对象的融合特征融合了对象在动态交互过程中，通过自身相关的行为数据生成的第一记忆特征和第二记忆特征，也即是不仅融合了对象长期的特征，还融合了根据近期的交互行为的发生情况衰减后的短期的特征，因此该融合特征能够准确地表示对象的动态特征，使得基于第一用户账号的融合特征和第一媒体内容的融合特征确定出的相似度，就可以分别参考第一用户账号和第一媒体内容各自在动态新增的行为数据影响下特征的变化情况，从而提高了相似度的准确性。
[0337]
在步骤704中，电子设备基于相似度确定向第一用户账号推荐第一媒体内容。
[0338]
在一些实施例中，电子设备向第一用户账号推荐相似度大于相似度阈值的第一媒体内容。或者，电子设备向第一用户账号推荐相似度排序靠前的一定数量个第一媒体内容。该数量可以根据需要进行设置，本公开实施例对此不加以限定。
[0339]
例如，以异构图为例，对于图中的一个用户账号节点，通过计算该用户账号节点与图中媒体内容节点的相似度，即可确定该用户账号节点未来可能建立的边。
[0340]
在本公开实施例中，新增行为数据代表了第一对象产生的新的交互行为，该交互行为会对与第一对象下相关的第二对象产生影响，通过确定受到新增行为数据对应的交互行为影响的第二对象的影响特征，从而基于该影响特征进行训练，这样训练得到的推荐模型所包括的对象特征的准确度较高，从而基于推荐模型确定出的第一用户账号和第一媒体内容之间的相似度的准确度也较高，进而提高了媒体内容的推荐准确度。
[0341]
图8是根据一示例性实施例示出的一种媒体内容推荐装置的框图。参见图8，该装置包括：
[0342]
第一获取单元801，被配置为执行获取推荐模型，推荐模型包括多个对象的对象特征，多个对象包括用户账号和媒体内容；
[0343]
第一确定单元802，被配置为执行基于第一用户账号的账号特征和第一媒体内容的内容特征，确定第一用户账号与第一媒体内容之间的相似度，第一用户账号为用户账号中的任意一个，第一媒体内容为媒体内容中任意一个；
[0344]
推荐单元803，被配置为执行基于相似度确定向第一用户账号推荐第一媒体内容；
[0345]
其中，多个对象包括第一对象和第二对象，第一对象为新增行为数据中的对象，第二对象为与第一对象相关的对象，推荐模型是基于与第一相似度负相关的传播损失训练得到的，第一相似度基于第二对象的影响特征与第二对象的对象特征之间的相似度确定，影响特征表征第二对象在新增行为数据对应的交互行为的影响下的特征。
[0346]
在一些实施例中，账号特征包括第一用户账号的第一记忆特征和第二记忆特征，第一记忆特征表征第一用户账号长期的特征，第二记忆特征表征第一用户账号短期的特征；内容特征包括第一媒体内容的第一记忆特征和第二记忆特征，第一媒体内容的第一记忆特征表征第一媒体内容长期的特征，第一媒体内容的第二记忆特征表征第一媒体内容短期的特征；
[0347]
第一确定单元802，被配置为执行对第一用户账号的第一记忆特征和第二记忆特
征进行融合，得到第一用户账号的融合特征，以及，对第一媒体内容的第一记忆特征和第二记忆特征进行融合，得到第一媒体内容的融合特征；确定第一用户账号的融合特征和第一媒体内容的融合特征之间的相似度。
[0348]
在一些实施例中，账号特征还包括第一用户账号的上下文特征，上下文特征表征第一用户账号在其他对象的影响下的特征；
[0349]
第一确定单元802，被配置为执行对第一用户账号的第一记忆特征、第二记忆特征和上下文特征进行融合，得到第一用户账号的融合特征。
[0350]
在本公开实施例中，新增行为数据代表了第一对象产生的新的交互行为，该交互行为会对与第一对象下相关的第二对象产生影响，通过确定受到新增行为数据对应的交互行为影响的第二对象的影响特征，从而基于该影响特征进行训练，这样训练得到的推荐模型所包括的对象特征的准确度较高，从而基于推荐模型确定出的第一用户账号和第一媒体内容之间的相似度的准确度也较高，进而提高了媒体内容的推荐准确度。
[0351]
图9是根据一示例性实施例示出的一种推荐模型处理装置的框图。参见图9，该装置包括：
[0352]
第二获取单元901，被配置为执行获取第一行为信息，第一行为信息包括新增行为数据和历史行为数据，新增行为数据用于表示属于不同类型的两个第一对象之间的交互行为，类型包括账号和媒体内容，历史行为数据为与任一第一对象相关的第二对象所对应的历史行为数据；
[0353]
第三获取单元902，被配置为执行获取推荐模型，推荐模型包括多个对象的第一特征，多个对象包括两个第一对象以及历史行为数据中的至少一个第二对象；
[0354]
第二确定单元903，被配置为执行对于每个第一对象，基于第一对象的第一特征和与第一对象相关的第二对象的交互时间差，确定第二对象的影响特征，任一第二对象的影响特征表征第二对象在新增行为数据对应的交互行为的影响下的特征，第二对象的交互时间差为新增行为数据的发生时间与第二对象所属的历史行为数据的发生时间之间的时间差；
[0355]
训练单元904，被配置为执行基于与第一相似度负相关的传播损失，对推荐模型进行训练，第一相似度基于每个第二对象的影响特征与每个第二对象的第一特征之间的相似度确定，训练后的推荐模型包括多个对象的第二特征，且训练后的推荐模型用于基于多个对象的第二特征进行推荐。
[0356]
在一些实施例中，第二确定单元903，被配置为执行对于每个第一对象，基于第一对象的交互时间差，对第一对象的第一特征进行衰减，得到第一对象的交互特征，第一对象的交互时间差为新增行为数据的发生时间与第一对象所属的历史行为数据的发生时间之间的时间差；
[0357]
基于第一对象的交互特征和与第一对象属于同一历史行为数据的第二对象的交互时间差，确定与第一对象相关的第二对象的影响特征；
[0358]
继续基于第二对象的影响特征和与第二对象属于同一历史行为数据的另一第二对象的交互时间差，确定另一第二对象的影响特征，直至确定出第一行为信息中与第一对象相关的每个第二对象的影响特征。
[0359]
在一些实施例中，第二确定单元903，被配置为执行在交互时间差不大于时间差阈
值的情况下，确定与交互时间差负相关的第一衰减参数，按照第一衰减参数对第一对象的交互特征进行衰减，得到第二对象的影响特征；或者，
[0360]
第二确定单元，被配置为执行在交互时间差大于时间差阈值的情况下，将预设影响特征确定为第二对象的影响特征。
[0361]
在一些实施例中，第一行为信息包括属于不同节点类型的至少两个对象节点以及任两个对象节点之间连接的边，节点类型包括账号类型和媒体内容类型；其中，至少两个对象节点包括属于不同类型的两个第一对象节点和与任一第一对象节点直接连接或间接连接的第二对象节点；
[0362]
两个第一对象节点及两个第一对象节点之间连接的第一边构成新增行为数据；
[0363]
属于不同类型的第一对象节点和第二对象节点以及第一对象节点与第二对象节点之间连接的第二边构成一条历史行为数据，和/或，属于不同类型的任两个第二对象节点以及任两个第二对象节点之间连接的第三边构成一条历史行为数据；
[0364]
第二确定单元903，被配置为执行对于每个第一对象节点，基于第一对象节点的交互时间差，对第一对象节点的第一特征进行衰减，得到第一对象节点的交互特征，第一对象节点的交互时间差为第一边的发生时间和第一对象节点所连接的第二边的发生时间之间的时间差；
[0365]
基于第一对象节点的交互特征和与第一对象节点直接连接的第二对象节点的交互时间差，确定第二对象节点的影响特征；
[0366]
继续基于第二对象节点的影响特征和与第二对象节点直接连接的另一第二对象节点的交互时间差，确定另一第二对象节点的影响特征，直至确定出第一行为信息中与任一第一对象节点直接连接或间接连接的每个第二对象节点的影响特征。
[0367]
在一些实施例中，装置还包括：
[0368]
第三确定单元，被配置为执行对于每个第一对象，基于第一对象的交互时间差，对第一对象的第一特征进行衰减，得到衰减特征，衰减特征表征在新增行为数据对应的交互行为的影响下第一对象的第一特征衰减后的特征，第一对象的交互时间差为新增行为数据的发生时间与第一对象所属的历史行为数据的发生时间之间的时间差；
[0369]
基于两个第一对象的衰减特征，确定与第二相似度负相关的交互损失，第二相似度为两个第一对象的衰减特征之间的相似度；
[0370]
训练单元，被配置为执行基于与第一相似度负相关的传播损失和交互损失，对推荐模型进行训练。
[0371]
在一些实施例中，第一对象的第一特征包括第一记忆特征和第二记忆特征，第一记忆特征表征第一对象长期的特征，第二记忆特征表征第一对象短期的特征；第三确定单元，被配置为执行基于第一对象的交互时间差，对第一对象的第二记忆特征进行衰减；对第一对象的第一记忆特征与衰减后的第二记忆特征进行融合，得到第一对象的衰减特征。
[0372]
在一些实施例中，第三确定单元，被配置为执行基于第一对象的交互时间差和第一对象的类型对应的学习参数，确定第二衰减参数；基于第二衰减参数对第二记忆特征进行衰减。
[0373]
在一些实施例中，第一对象的第一特征还包括上下文特征，上下文特征表征第一对象在其他对象的影响下的特征；第三确定单元，被配置为执行对第一对象的第一记忆特
征、衰减后的第二记忆特征以及上下文特征进行加权融合，得到第一对象的衰减特征。
[0374]
在一些实施例中，第一对象的上下文特征包括第一对象针对多种交互类型的上下文特征，新增行为数据包括交互行为对应的目标交互类型；
[0375]
第三确定单元，被配置为执行从第一对象针对多种交互类型的上下文特征中，确定目标交互类型对应的上下文特征；对第一对象的第一记忆特征、衰减后的第二记忆特征以及目标交互类型对应的上下文特征进行加权融合，得到第一对象的衰减特征。
[0376]
在一些实施例中，推荐模型还包括模型参数，训练单元904，被配置为执行将与第一相似度负相关的传播损失和交互损失进行融合，得到推荐模型的模型损失；基于模型损失，对推荐模型中的模型参数和多个对象的第一特征进行更新，得到训练后的推荐模型。
[0377]
在一些实施例中，装置还包括：
[0378]
第四确定单元，被配置为执行从第二行为信息中，确定每个第一对象对应的第三对象，第二行为信息包括新增行为数据和多条历史行为数据，第三对象为第二行为信息中除第一对象外的其他对象；确定与第三相似度负相关的负采样损失，第三相似度基于第一对象的交互特征与第三对象的上下文特征之间的相似度确定，上下文特征表征第三对象在其他对象的影响下的特征；
[0379]
训练单元904，被配置为执行基于与第一相似度负相关的传播损失和负采样损失，对推荐模型进行训练。
[0380]
在一些实施例中，装置还包括：
[0381]
第四确定单元，被配置为执行从第二行为信息中，确定每个第一对象对应的第三对象，第二行为信息包括新增行为数据和多条历史行为数据，第三对象为第二行为信息中除第一对象外的其他对象；
[0382]
确定与第三相似度负相关的负采样损失，第三相似度基于第一对象的交互特征与第三对象的上下文特征之间的相似度确定，上下文特征表征第三对象在其他对象的影响下的特征；
[0383]
训练单元904，被配置为执行基于与第一相似度负相关的传播损失、交互损失和负采样损失，对推荐模型进行训练。
[0384]
在一些实施例中，第二获取单元901，被配置为执行按照新增行为数据中的两个第一对象，对第二行为信息进行采样，得到第一行为信息，第二行为信息包括新增行为数据和多条历史行为数据。
[0385]
在一些实施例中，第二获取单元901，被配置为执行获取采样方式集合，采样方式集合包括多种采样方式；从采样方式集合中，确定每个第一对象的采样方式；对于每个第一对象，从第一对象开始，在第二行为信息中按照所确定的采样方式进行采样，将采样得到的历史行为数据与新增行为数据构成第一行为信息。
[0386]
在一些实施例中，第二对象的第一特征包括上下文特征，上下文特征表征第二对象在其他对象的影响下的特征；装置还包括：
[0387]
第五确定单元，被配置为执行确定每个第二对象的影响特征和上下文特征之间的相似度；将至少一个第二对象的相似度进行融合，得到第一相似度。
[0388]
在一些实施例中，装置还包括：
[0389]
训练单元904，还被配置为执行获取多条样本行为数据，每条样本行为数据用于表
示属于不同类型的两个样本对象之间的交互行为；将多条样本行为数据按照发生时间由远及近的顺序，分为多个样本集，每个样本集所包含的样本行为数据的数量相同；基于多个样本集，依次训练推荐模型。
[0390]
在本公开实施例中，在两个第一对象进行交互行为得到新增行为数据之后，该交互行为能够对与第一对象相关的第二对象产生影响，从而通过基于第一对象的第一特征，以及，与该第一对象相关的第二对象的交互时间差，能够确定出表征新增行为数据对应的交互行为对该第二对象所产生的影响的影响特征，进一步地，由于传播损失是基于第二对象的影响特征与第二对象自身的第一特征之间的第一相似度确定的，使得推荐模型能够基于传播损失在训练过程中学习到该交互行为对第二对象的影响，这样不仅实现了在新发生交互行为时对推荐模型进行训练，还在训练时以此为基础结合了第二对象受到的新增行为数据的影响，进而大大提高了推荐模型的训练准确度。
[0391]
关于上述实施例中的装置，其中各个单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。
[0392]
在示例性实施例中，提供了一种电子设备，该电子设备包括一个或多个处理器，以及用于存储该一个或多个处理器可执行指令的存储器；其中，该一个或多个处理器被配置为执行上述实施例中的推荐模型处理方法或者媒体内容推荐方法。
[0393]
在一些实施例中，该电子设备提供为终端。图10是根据一示例性实施例示出的一种终端1000的结构框图。该终端1000可以是便携式移动终端，比如：智能手机、平板电脑、mp3播放器(moving picture experts group audio layer iii，动态影像专家压缩标准音频层面3)、mp4(moving picture experts group audio layer iv，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端1000还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
[0394]
终端1000包括有：处理器1001和存储器1002。
[0395]
处理器1001可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器1001可以采用dsp(digital signal processing，数字信号处理)、fpga(field－programmable gate array，现场可编程门阵列)、pla(programmable logic array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1001也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称cpu(central processing unit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器1001可以集成有gpu(graphics processing unit，图像处理器)，gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器1001还可以包括ai(artificial intelligence，人工智能)处理器，该ai处理器用于处理有关机器学习的计算操作。
[0396]
存储器1002可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器1002还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器1002中的非暂态的计算机可读存储介质用于存储至少一条可执行指令，该至少一条可执行指令用于被处理器1001所执行以实现本公开中方法实施例提供的推荐模型处理方法或者媒体内容推荐方法。
[0397]
在一些实施例中，终端1000还可选包括有：外围设备接口1003和至少一个外围设
备。处理器1001、存储器1002和外围设备接口1003之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1003相连。具体地，外围设备包括：射频电路1004、显示屏1005、摄像头组件1006、音频电路1007、定位组件1008和电源1009中的至少一种。
[0398]
外围设备接口1003可被用于将i/o(input/output，输入/输出)相关的至少一个外围设备连接到处理器1001和存储器1002。在一些实施例中，处理器1001、存储器1002和外围设备接口1003被集成在同一芯片或电路板上；在一些其他实施例中，处理器1001、存储器1002和外围设备接口1003中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。
[0399]
射频电路1004用于接收和发射rf(radio frequency，射频)信号，也称电磁信号。射频电路1004通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1004将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路1004包括：天线系统、rf收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1004可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：万维网、城域网、内联网、各代移动通信网络(2g、3g、4g及5g)、无线局域网和/或wifi(wireless fidelity，无线保真)网络。在一些实施例中，射频电路1004还可以包括nfc(near field communication，近距离无线通信)有关的电路，本公开对此不加以限定。
[0400]
显示屏1005用于显示ui(user interface，用户界面)。该ui可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1005是触摸显示屏时，显示屏1005还具有采集在显示屏1005的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1001进行处理。此时，显示屏1005还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏1005可以为一个，设置在终端1000的前面板；在另一些实施例中，显示屏1005可以为至少两个，分别设置在终端1000的不同表面或呈折叠设计；在另一些实施例中，显示屏1005可以是柔性显示屏，设置在终端1000的弯曲表面上或折叠面上。甚至，显示屏1005还可以设置成非矩形的不规则图形，也即异形屏。显示屏1005可以采用lcd(liquid crystal display，液晶显示屏)、oled(organic light-emitting diode，有机发光二极管)等材质制备。
[0401]
摄像头组件1006用于采集图像或视频。可选地，摄像头组件1006包括前置摄像头和后置摄像头。前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及vr(virtual reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件1006还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。
[0402]
音频电路1007可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器1001进行处理，或者输入至射频电路1004以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端1000的不同部位。
麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1001或射频电路1004的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路1007还可以包括耳机插孔。
[0403]
定位组件1008用于定位终端1000的当前地理位置，以实现导航或lbs(location based service，基于位置的服务)。定位组件1008可以是基于美国的gps(global positioning system，全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯定位系统或欧盟的伽利略定位系统的定位组件。
[0404]
电源1009用于为终端1000中的各个组件进行供电。电源1009可以是交流电、直流电、一次性电池或可充电电池。当电源1009包括可充电电池时，该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
[0405]
在一些实施例中，终端1000还包括有一个或多个传感器1010。该一个或多个传感器1010包括但不限于：加速度传感器1011、陀螺仪传感器1012、压力传感器1013、指纹传感器1014、光学传感器1015以及接近传感器1016。
[0406]
加速度传感器1011可以检测以终端1000建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器1011可以用于检测重力加速度在三个坐标轴上的分量。处理器1001可以根据加速度传感器1011采集的重力加速度信号，控制显示屏1005以横向视图或纵向视图进行用户界面的显示。加速度传感器1011还可以用于游戏或者用户的运动数据的采集。
[0407]
陀螺仪传感器1012可以检测终端1000的机体方向及转动角度，陀螺仪传感器1012可以与加速度传感器1011协同采集用户对终端1000的3d动作。处理器1001根据陀螺仪传感器1012采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变ui)、拍摄时的图像稳定、游戏控制以及惯性导航。
[0408]
压力传感器1013可以设置在终端1000的侧边框和/或显示屏1005的下层。当压力传感器1013设置在终端1000的侧边框时，可以检测用户对终端1000的握持信号，由处理器1001根据压力传感器1013采集的握持信号进行左右手识别或快捷操作。当压力传感器1013设置在显示屏1005的下层时，由处理器1001根据用户对显示屏1005的压力操作，实现对ui界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
[0409]
指纹传感器1014用于采集用户的指纹，由处理器1001根据指纹传感器1014采集到的指纹识别用户的身份，或者，由指纹传感器1014根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器1001授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1014可以被设置在终端1000的正面、背面或侧面。当终端1000上设置有物理按键或厂商logo时，指纹传感器1014可以与物理按键或厂商logo集成在一起。
[0410]
光学传感器1015用于采集环境光强度。在一个实施例中，处理器1001可以根据光学传感器1015采集的环境光强度，控制显示屏1005的显示亮度。具体地，当环境光强度较高
时，调高显示屏1005的显示亮度；当环境光强度较低时，调低显示屏1005的显示亮度。在另一个实施例中，处理器1001还可以根据光学传感器1015采集的环境光强度，动态调整摄像头组件1006的拍摄参数。
[0411]
接近传感器1016，也称距离传感器，设置在终端1000的前面板。接近传感器1016用于采集用户与终端1000的正面之间的距离。在一个实施例中，当接近传感器1016检测到用户与终端1000的正面之间的距离逐渐变小时，由处理器1001控制显示屏1005从亮屏状态切换为息屏状态；当接近传感器1016检测到用户与终端1000的正面之间的距离逐渐变大时，由处理器1001控制显示屏1005从息屏状态切换为亮屏状态。
[0412]
本领域技术人员可以理解，图10中示出的结构并不构成对终端1000的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。
[0413]
在另一些实施例中，该电子设备提供为服务器。图11是根据一示例性实施例示出的一种服务器的结构框图，该服务器1100可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(central processing units，cpu)1101和一个或一个以上的存储器1102，其中，存储器1102中存储有至少一条可执行指令，该至少一条可执行指令由处理器1101加载并执行以实现上述各个方法实施例提供的方法。当然，该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该服务器还可以包括其他用于实现设备功能的部件，在此不做赘述。
[0414]
在示例性实施例中，还提供了一种计算机可读存储介质，当存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述推荐模型处理方法或者媒体内容推荐方法。可选地，计算机可读存储介质可以是rom(只读存储器，read only memory)、ram(随机存取存储器，random access memory)、cd-rom(只读光盘，compact disc read-only memory)、磁带、软盘和光数据存储设备等。
[0415]
在示例性实施例中，还提供了一种计算机程序产品，该计算机程序产品包括计算机程序，该计算机程序被处理器执行以实现上述推荐模型处理方法或者媒体内容推荐方法。
[0416]
在一些实施例中，本技术实施例所涉及的计算机程序可被部署在一个计算机设备上执行，或者在位于一个地点的多个计算机设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算机设备上执行，分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链系统。
[0417]
本领域技术人员在考虑说明书及实践这里的公开后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。
[0418]
应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

技术特征：
1.一种媒体内容推荐方法，其特征在于，所述方法包括：获取推荐模型，所述推荐模型包括多个对象的对象特征，所述多个对象包括用户账号和媒体内容；基于第一用户账号的账号特征和第一媒体内容的内容特征，确定所述第一用户账号与所述第一媒体内容之间的相似度，所述第一用户账号为所述用户账号中的任意一个，所述第一媒体内容为所述媒体内容中任意一个；基于所述相似度确定向所述第一用户账号推荐所述第一媒体内容；其中，所述多个对象包括第一对象和第二对象，所述第一对象为新增行为数据中的对象，所述第二对象为与所述第一对象相关的对象，所述推荐模型是基于与第一相似度负相关的传播损失训练得到的，所述第一相似度基于所述第二对象的影响特征与所述第二对象的对象特征之间的相似度确定，所述影响特征表征所述第二对象在所述新增行为数据对应的交互行为的影响下的特征。2.根据权利要求1所述的媒体内容推荐方法，其特征在于，所述账号特征包括所述第一用户账号的第一记忆特征和第二记忆特征，所述第一记忆特征表征所述第一用户账号长期的特征，所述第二记忆特征表征所述第一用户账号短期的特征；所述内容特征包括所述第一媒体内容的第一记忆特征和第二记忆特征，所述第一媒体内容的第一记忆特征表征所述第一媒体内容长期的特征，所述第一媒体内容的第二记忆特征表征所述第一媒体内容短期的特征；所述基于第一用户账号的账号特征和第一媒体内容的内容特征，确定所述第一用户账号与所述第一媒体内容之间的相似度，包括：对所述第一用户账号的所述第一记忆特征和所述第二记忆特征进行融合，得到所述第一用户账号的融合特征，以及，对所述第一媒体内容的所述第一记忆特征和所述第二记忆特征进行融合，得到所述第一媒体内容的融合特征；确定所述第一用户账号的融合特征和所述第一媒体内容的融合特征之间的相似度。3.一种推荐模型处理方法，其特征在于，所述方法包括：获取第一行为信息，所述第一行为信息包括新增行为数据和历史行为数据，所述新增行为数据用于表示属于不同类型的两个第一对象之间的交互行为，所述类型包括账号和媒体内容，所述历史行为数据为与任一所述第一对象相关的第二对象所对应的历史行为数据；获取推荐模型，所述推荐模型包括多个对象的第一特征，所述多个对象包括所述两个第一对象以及所述历史行为数据中的至少一个第二对象；对于每个所述第一对象，基于所述第一对象的第一特征和与所述第一对象相关的所述第二对象的交互时间差，确定所述第二对象的影响特征，任一所述第二对象的影响特征表征所述第二对象在所述新增行为数据对应的交互行为的影响下的特征，所述第二对象的交互时间差为所述新增行为数据的发生时间与所述第二对象所属的历史行为数据的发生时间之间的时间差；基于与第一相似度负相关的传播损失，对所述推荐模型进行训练，所述第一相似度基于每个所述第二对象的影响特征与每个所述第二对象的第一特征之间的相似度确定，训练后的所述推荐模型包括所述多个对象的第二特征，且训练后的所述推荐模型用于基于所述
多个对象的第二特征进行推荐。4.根据权利要求3所述的推荐模型处理方法，其特征在于，所述对于每个所述第一对象，基于所述第一对象的第一特征和与所述第一对象相关的所述第二对象的交互时间差，确定所述第二对象的影响特征，包括：对于每个所述第一对象，基于所述第一对象的交互时间差，对所述第一对象的第一特征进行衰减，得到所述第一对象的交互特征，所述第一对象的交互时间差为所述新增行为数据的发生时间与所述第一对象所属的历史行为数据的发生时间之间的时间差；基于所述第一对象的交互特征和与所述第一对象属于同一历史行为数据的所述第二对象的交互时间差，确定与所述第一对象相关的所述第二对象的影响特征；继续基于所述第二对象的影响特征和与所述第二对象属于同一历史行为数据的另一所述第二对象的交互时间差，确定另一所述第二对象的影响特征，直至确定出所述第一行为信息中与所述第一对象相关的每个所述第二对象的影响特征。5.根据权利要求4所述的推荐模型处理方法，其特征在于，所述基于所述第一对象的交互特征和与所述第一对象属于同一历史行为数据的所述第二对象的交互时间差，确定与所述第一对象相关的所述第二对象的影响特征，包括：在所述交互时间差不大于时间差阈值的情况下，确定与所述交互时间差负相关的第一衰减参数，按照所述第一衰减参数对所述第一对象的交互特征进行衰减，得到所述第二对象的影响特征；或者，在所述交互时间差大于所述时间差阈值的情况下，将预设影响特征确定为所述第二对象的影响特征。6.一种媒体内容推荐装置，其特征在于，所述装置包括：第一获取单元，被配置为执行获取推荐模型，所述推荐模型包括多个对象的对象特征，所述多个对象包括用户账号和媒体内容；第一确定单元，被配置为执行基于第一用户账号的账号特征和第一媒体内容的内容特征，确定所述第一用户账号与所述第一媒体内容之间的相似度，所述第一用户账号为所述用户账号中的任意一个，所述第一媒体内容为所述媒体内容中任意一个；推荐单元，被配置为执行基于所述相似度确定向所述第一用户账号推荐所述第一媒体内容；其中，所述多个对象包括第一对象和第二对象，所述第一对象为新增行为数据中的对象，所述第二对象为与所述第一对象相关的对象，所述推荐模型是基于与第一相似度负相关的传播损失训练得到的，所述第一相似度基于所述第二对象的影响特征与所述第二对象的对象特征之间的相似度确定，所述影响特征表征所述第二对象在所述新增行为数据对应的交互行为的影响下的特征。7.一种推荐模型处理装置，其特征在于，所述装置包括：第二获取单元，被配置为执行获取第一行为信息，所述第一行为信息包括新增行为数据和历史行为数据，所述新增行为数据用于表示属于不同类型的两个第一对象之间的交互行为，所述类型包括账号和媒体内容，所述历史行为数据为与任一所述第一对象相关的第二对象所对应的历史行为数据；第三获取单元，被配置为执行获取推荐模型，所述推荐模型包括多个对象的第一特征，
所述多个对象包括所述两个第一对象以及所述历史行为数据中的至少一个第二对象；第二确定单元，被配置为执行对于每个所述第一对象，基于所述第一对象的第一特征和与所述第一对象相关的所述第二对象的交互时间差，确定所述第二对象的影响特征，任一所述第二对象的影响特征表征所述第二对象在所述新增行为数据对应的交互行为的影响下的特征，所述第二对象的交互时间差为所述新增行为数据的发生时间与所述第二对象所属的历史行为数据的发生时间之间的时间差；训练单元，被配置为执行基于与第一相似度负相关的传播损失，对所述推荐模型进行训练，所述第一相似度基于每个所述第二对象的影响特征与每个所述第二对象的第一特征之间的相似度确定，训练后的所述推荐模型包括所述多个对象的第二特征，且训练后的所述推荐模型用于基于所述多个对象的第二特征进行推荐。8.一种电子设备，其特征在于，所述电子设备包括：一个或多个处理器；用于存储所述一个或多个处理器可执行指令的存储器；其中，所述一个或多个处理器被配置为执行如权利要求1至权利要求2任一项所述的媒体内容推荐方法，或者被配置为执行如权利要求3至权利要求5任一项所述的推荐模型处理方法。9.一种计算机可读存储介质，其特征在于，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行如权利要求1至权利要求2任一项所述的媒体内容推荐方法，或者能够执行如权利要求3至权利要求5任一项所述的推荐模型处理方法。10.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至权利要求2任一项所述的媒体内容推荐方法，或者能够执行如权利要求3至权利要求5任一项所述的推荐模型处理方法。

技术总结
本公开是关于一种媒体内容推荐方法、装置、电子设备及存储介质，属于计算机技术领域。该方法包括：获取推荐模型，推荐模型包括多个对象的对象特征，多个对象包括用户账号和媒体内容；基于第一用户账号的账号特征和第一媒体内容的内容特征，确定第一用户账号与第一媒体内容之间的相似度；基于相似度确定向第一用户账号推荐第一媒体内容；多个对象包括第一对象和第二对象，推荐模型是基于与第一相似度负相关的传播损失训练得到的，第一相似度基于第二对象的影响特征与第二对象的对象特征之间的相似度确定。上述方法中训练得到的推荐模型中的对象特征较为准确，从而基于推荐模型确定出的相似度较为准确，进而提高了媒体内容的推荐准确度。准确度。准确度。

技术研发人员：王朝坤吴呈徐劲草王昶平宋洋
受保护的技术使用者：北京达佳互联信息技术有限公司
技术研发日：2021.12.06
技术公布日：2022/3/8

专利

最新回复(0)