1.本技术属于数据处理技术领域,具体涉及一种欺诈检测方法、装置、电子设备及存储介质。
背景技术:
2.人们在网上购买产品时,通常会先查看评论,然后决定是否购买。但现在虚假评论泛滥,这会严重影响消费者的购买意图。因此,欺诈检测已经成为网上购物的一个关键问题。当相关的欺诈检测方法的检测精度还有待提高。
技术实现要素:
3.鉴于上述问题,本技术提出了一种欺诈检测方法、装置、电子设备以及存储介质,以实现改善上述问题。
4.第一方面,本技术实施例提供了一种欺诈检测方法,所述方法包括:获取与检测内容相关的多个同构图数据,所述多个同构图数据各自对应的元路径模式不同,所述同构图数据包括待检测节点、所述待检测节点的邻居节点、以及基于元路径模式建立的连接所述待检测节点与所述邻居节点之间的路径;将所述多个同构图数据输入到训练好的异构神经网络模型,获取所述训练好的异构神经网络输出的所述待检测节点的表示向量;将所述待检测节点的表示向量输入训练好的检测模型中,以对所述待检测节点进行检测。
5.第二方面,本技术实施例提供了一种欺诈检测装置,所述装置包括:数据获取单元,用于获取与检测内容相关的多个同构图数据,所述多个同构图数据各自对应的元路径模式不同,所述同构图数据包括待检测节点、所述待检测节点的邻居节点、以及基于元路径模式建立的连接所述待检测节点与所述邻居节点之间的路径;向量获取单元,用于将所述多个同构图数据输入到训练好的异构神经网络模型,获取所述训练好的异构神经网络输出的所述待检测节点的表示向量;检测单元,用于所述待检测节点的表示向量输入训练好的检测模型中,以对所述待检测节点进行检测。
6.第三方面,本技术实施例提供了一种电子设备,包括一个或多个处理器以及存储器;一个或多个程序,其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述的方法。
7.第四方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有程序代码,其中,在所述程序代码运行时执行上述的方法。
8.本技术实施例提供了一种欺诈检测方法、装置、电子设备及存储介质。首先获取与检测内容相关的多个同构图数据,所述多个同构图数据各自对应的元路径模式不同,所述同构图数据包括待检测节点、所述待检测节点的邻居节点、以及基于元路径模式建立的连接所述待检测节点与所述邻居节点之间的路径,然后将多个同构图数据输入到训练好的异构神经网络模型,获取训练好的异构神经网络输出的待检测节点的表示向量,进而将待检测节点的表示向量输入训练好的检测模型中,以对待检测节点进行检测。通过上述方法,通
过同构图的方式,将与待检测节点有关的多个同构图输入到训练好的异构神经网络中,可以使得训练好的神经网络可以更好的关注到同一元路径模式下的待检测节点的邻居节点的特征信息,以及不同元路径模式下的待检测节点的邻居节点的特征信息,提高了待检测节点的表示能力,进而通过训练好的异构神经网络对待检测节点进检测,可以提高对待检测节点进行检测的检测精度。
附图说明
9.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
10.图1示出了本技术一实施例提出的一种欺诈检测方法的流程图;
11.图2示出了本技术另一实施例提出的一种欺诈检测方法的流程图;
12.图3示出了本技术再一实施例提出的一种欺诈检测方法的流程图;
13.图4示出了本技术再一实施例提出的一种隐式特征交互的示意图;
14.图5示出了本技术再一实施例提出的得到待检测节点的最终表示向量的过程示意图;
15.图6示出了本技术又一实施例提出的一种欺诈检测方法的流程图;
16.图7示出了本技术实施例提出的一种欺诈检测装置的结构框图;
17.图8示出了本技术实施例提出的一种欺诈检测装置的结构框图;
18.图9示出了本技术实时中的用于执行根据本技术实施例的欺诈检测方法的电子设备的结构框图;
19.图10示出了本技术实时中的用于保存或者携带实现根据本技术实施例的欺诈检测方法的程序代码的存储单元。
具体实施方式
20.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
21.欺诈检测:在机器学习中,欺诈检测是分类问题,其目标是预测离散标签0或1,其中,0通常表示非欺诈性的,1表示欺诈性的。在欺诈网络中,以节点v作为目标实体,需要对其可疑性进行判断,从而判断图上的欺诈检测问题。例如,该节点可以表示交易系统上的交易,也可以表示评论网站上的评论。
22.发明人在对相关的欺诈检测方法的研究中发现,相关的欺诈检测的检测精度还有待提高。
23.因此,发明人提出了本技术中的通过同构图的方式,将与待检测节点有关的多个同构图输入到训练好的异构神经网络中,可以使得训练好的神经网络可以更好的关注到同一元路径模式下的待检测节点的邻居节点的特征信息,以及不同元路径模式下的待检测节
点的邻居节点的特征信息,提高了待检测节点的表示能力,进而通过训练好的异构神经网络对待检测节点进检测,可以提高对待检测节点进行检测的检测精度的欺诈检测方法、装置、电子设备及存储介质。
24.下面将结合附图具体描述本技术的各实施例。
25.请参阅图1,本技术实施例提供的一种欺诈检测方法,所述方法包括:
26.步骤s110:获取与检测内容相关的多个同构图数据,所述多个同构图数据各自对应的元路径模式不同,所述同构图数据包括待检测节点、所述待检测节点的邻居节点、以及基于元路径模式建立的连接所述待检测节点与所述邻居节点之间的路径。
27.在本技术实施例中,所述检测内容为确定的需要进行欺诈检测的内容,可以为评论、用户以及商品中的任意一种。多个同构图数据各自对应的元路径模式不同可以理解为多个同构图数据各自对应的元路径不同。其中,元路径是一条包含关系序列的路径,而这些关系定义在不同类型的实体之间。具体的,实体可以包括用户、评论以及商品等,因此,元路径可以包括“用户-评论-用户”、“评论-用户-评论”、“用户-商品-用户”、“评论-商品-评论”、“商品-用户-商品”以及“商品-评论-商品”等,在此不做具体限定。
28.可选的,在本技术实施例中,待检测节点可以通过不同的元路径模式与邻居节点建立连接。待检测节点通过一种元路径模式与邻居节点建立连接后,就构成了一个同构图,也就是一个同构图数据。进而所述多个同构图数据是待检测节点通过多种元路径模式与邻居节点建立连接后构成的多个基于不同元路径模式的同构图。其中,所述待检测节点为输出待检测内容的节点。可以理解的是,可以根据待检测内容选择待检测节点。
29.作为一种方式,可以根据是否接收到外部设备发送的欺诈检测指令来确定是否触发获取与检测内容相关的多个同构图数据,其中外部设备可以为安装有目标应用的智能设备,可选的,目标应用可以为商品购买应用。具体的,若接收到外部设备发送的欺诈检测指令,则确定触发开始获取与检测内容相关的多个同构图数据;若未接收到外部设备发送的欺诈检测指令,则确定不触发获取与检测内容相关的同构图数据。
30.可选的,可以预先根据不同的待检测节点、不同的邻居节点、不同的元路径模式构成不同的同构图,进而可以将构成的不同的同构图存储在云服务器中,在对不同的同构图进行存储时,可以按照确定的待检测节点进行归类存储,也就是如果待检测节点为用户,那么就可以将用户作为待检测节点,进而将用户作为待检测节点构成的同构图划分为一类。
31.当接收到欺诈检测指令时,可以先确定待检测节点的类型,进而可以根据待检测节点的类型,从云服务器中获取对应的多个同构图数据。其中,欺诈检测指令中可以携带待检测节点的类型,进而在确定待检测节点的类型时,可以根据欺诈检测指令中携带的信息来确定待检测节点的类型。
32.进一步的,也可以通过不同的方式来触发外部设备发送欺诈检测指令,作为其中一种方式,可以预先设置为每隔预设时间段,就通过云服务器向外部设备发送控制信号,基于该控制信号触发外部设备发送欺诈检测指令。作为其中另一种方式,也可以通过用户的触控操作来触发外部设备发送欺诈检测指令,具体的,当检测到用户在外部设备的特定界面点击指定内容时,触发外部设备发送欺诈检测指令。示例性的,所述特定界面可以为目标应用的浏览界面,浏览界面中可以包括商品、评论以及用户id等,当检测到用户点击评论时,触发外部设备发送欺诈检测指令。
33.步骤s120:将所述多个同构图数据输入到训练好的异构神经网络模型,获取所述训练好的异构神经网络输出的所述待检测节点的表示向量。
34.作为一种方式,所述训练好的异构神经网络模型用于根据输入的多个同构图数据,聚合待检测节点的邻居节点的信息,进而可以输出待检测节点的表示向量。
35.当获取到多个同构图数据时,可以依次将多个同构图数据输入到训练好的异构神经网络,进而训练好的异构神经网络可以依次输出每个同构图数据对应的待检测节点的表示向量,进而可以通过预设规则得到待检测节点的表示向量。其中,预设规则可以为将每个同构图数据对应的待检测节点的表示向量进行相加或者拼接等。
36.作为另一种方式,可以将获取到的多个同构图数据一起输入到训练好的异构神经网络中,进而可以直接获取到训练好的异构神经网络输出的待检测节点的表示向量。
37.步骤s130:将所述待检测节点的表示向量输入训练好的检测模型中,以对所述待检测节点进行检测。
38.在本技术实施例中,所述检测模型用于根据输入的待检测节点的表示向量,输出该待检测节点的可疑性,也就是确定该待检测节点是非欺诈性的,还是欺诈性的。所述检测模型可以是二分类模型、逻辑回归模型或者神经网络模型等具有分类能力的机器学习模型,在此不做具体限定。
39.若确定该待检测节点为欺诈性的,则提示用户该待检测节点是欺诈性的,进而用户可以重新选择新的待检测节点进行检测;若确定该待检测节点为非欺诈性的,则提示用户可以继续下一步操作,比如,若该待检测节点为商品,待检测节点为非欺诈性的,则确定该商品为真的,则可以提示用户可以点击购买该商品。
40.本技术提供的一种欺诈检测方法,首先获取与检测内容相关的多个同构图数据,所述多个同构图数据对应的元路径模式不同,所述同构图数据包括待检测节点、所述待检测节点的邻居节点、以及基于元路径模式建立的连接所述待检测节点与所述邻居节点之间的路径,然后将多个同构图数据输入到训练好的异构神经网络模型,获取异构神经网络输出的待检测节点的表示向量,进而将待检测节点的表示向量输入训练好的检测模型中,对待检测节点进行检测。通过上述方法,通过同构图的方式,将与待检测节点有关的多个同构图输入到训练好的异构神经网络中,可以使得训练好的神经网络可以更好的关注到同一元路径模式下的待检测节点的邻居节点的特征信息,以及不同元路径模式下的待检测节点的邻居节点的特征信息,提高了待检测节点的表示能力,进而通过训练好的异构神经网络对待检测节点进检测,可以提高对待检测节点进行检测的检测精度。
41.请参阅图2,本技术实施例提供的一种欺诈检测方法,所述方法包括:
42.步骤s210:获取与检测内容相关的多个同构图数据,所述多个同构图数据各自对应的元路径模式不同,所述同构图数据包括待检测节点、所述待检测节点的邻居节点、以及基于元路径模式建立的连接所述待检测节点与所述邻居节点之间的路径。
43.在本实施例中,步骤s210的具体实施方式,可以参考上文实施例所提供的步骤s110的阐述,此处不再赘述。
44.步骤s220:将所述多个同构图数据输入到所述关系内聚合子层,获取所述关系内聚合子层输出的所述待检测节点的多个第一表示向量,其中,所述多个第一表示向量表征所述多个同构图数据各自对应的所述待检测节点的邻域信息,所述邻域信息为聚合的每个
同构图数据中的所述待检测节点的邻居节点的信息。
45.在本技术实施例中,所述邻域信息为邻居节点的特征信息。所述训练好的异构神经网络模型包括关系内聚合子层、关系间融合子层以及更新子层。其中,关系内聚合子层用于分别聚合每个同构图数据中的待检测节点的邻居节点的特征信息;关系间融合子层用于对通过关系内聚合子层进行聚合后的待检测节点的邻居节点的特征信息再次进行融合,得到不同的同构图数据之间的语义信息;更新子层用于更新待检测节点的表示向量,充分交互待检测节点与聚合的邻居节点的特征信息。
46.作为一种方式,当获取到多个同构图数据后,将多个同构图数据输入到关系内聚合子层,进而可以通过关系内聚合子层分别对多个同构图数据中每一个同构图数据对应的待检测节点的邻居节点的特征信息进行聚合,进而可以得到关系内聚合子层输出的待检测节点的多个第一表示向量。
47.步骤s230:将所述多个第一表示向量输入到所述关系间融合子层,获取所述关系间融合子层输出的所述待检测节点的第二表示向量。
48.当获取到关系内聚合子层输出的多个第一表示向量后,将多个第一表示向量输入到关系间融合子层,进而可以通过关系间融合子层对多个第一表示向量进行融合,得到多个同构图数据之间的语义信息,也就是待检测节点的第二表示向量。
49.步骤s240:将所述第二表示向量输入到所述更新子层,获取所述更新子层输出的所述待检测节点的表示向量。
50.在本技术实施例中,当获取到关系间融合子层输出的待检测节点的第二表示向量后,将待检测节点的第二表示向量输入到更新子层,进而可以通过更新子层基于待检测节点的第二表示向量,更新待检测节点的表示向量。
51.步骤s250:将所述待检测节点的表示向量输入训练好的检测模型中,以对所述待检测节点进行检测。
52.在本实施例中,步骤s250的具体实施方式,可以参考上文实施例所提供的步骤s130的阐述,此处不再赘述。
53.本技术提供的一种欺诈检测方法,首先获取与检测内容相关的多个同构图数据,然后将多个同构图数据输入到关系内聚合子层中,获取关系内聚合子层输出的待检测节点的多个第一表示向量,再将多个第一表示向量输入到关系间融合子层,获取关系间融合子层输出的待检测节点的第二表示向量,将第二表示向量输入到更新子层,获取更新子层输出的待检测节点的表示向量,最后将待检测节点的表示向量输入训练好的检测模型中,以对待检测节点进行检测。通过上述方法,通过同构图的方式,将与待检测节点有关的多个同构图输入到训练好的异构神经网络中,可以使得训练好的神经网络可以更好的关注到同一元路径模式下的待检测节点的邻居节点的特征信息,以及不同元路径模式下的待检测节点的邻居节点的特征信息,提高了待检测节点的表示能力,进而通过训练好的异构神经网络对待检测节点进检测,可以提高对待检测节点进行检测的检测精度。
54.请参阅图3,本技术实施例提供的一种欺诈检测方法,所述方法包括:
55.步骤s310:获取与检测内容相关的多个同构图数据,所述多个同构图数据各自对应的元路径模式不同,所述同构图数据包括待检测节点、所述待检测节点的邻居节点、以及基于元路径模式建立的连接所述待检测节点与所述邻居节点之间的路径。
56.在本实施例中,给定一条元路径p,将异构图g中所有基于元路径p的所有邻居节点对组成的记为g
p
,即基于元路径的同构图数据。
57.步骤s320:将所述多个同构图数据输入到所述关系内聚合子层,通过聚合器级注意力机制分别对所述多个同构图数据中的每个同构图数据中所述待检测节点的邻居节点的信息进行融合,以得到所述待检测节点的多个第一表示向量。
58.在本技术实施例中,所述聚合器级注意力机制为通过多种聚合器对待检测接地那的邻居节点的特征信息进行融合。其中,多种聚合器可以包括均值聚合器、最大值聚合器、最小值聚合器以及方差聚合器等,在此不做具体限定。通过不同的聚合器对同构图数据中的邻居节点的特征信息进行聚合,可以聚合得到不同的邻居节点的表示向量。比如,均值聚合器可以捕捉到邻居节点的总体背景信息;最大值聚合器可以反映邻居节点的判别信息(discriminant information)等。当通过不同的聚合器对同构图数据中的邻居节点的特征信息进行聚合时,可以对每一个邻居节点使用不同的聚合器进行特征信息融合。示例性的,若在基于元路径p构成的同构图数据中,待检测节点的邻居接节点包括节点1、节点2以及节点3,那么就可以通过聚合器1、聚合器2以及聚合器3分别对节点1、节点2以及节点3进行的特征信息进行融合。
59.在本技术实施例中,所述第一表示向量可以通过如下公式计算得到:其中,表示在基于元路径p的子图内节点v聚合的邻域信息;k表示多头注意力的头数;s
agg
表示聚合器集合;aggi表示第i个聚合器;表示在基于元路径p的子图内聚合器i对节点v的重要性;表示在基于元路径p的子图内聚合器aggi生成中心节点v的固定维数的邻居节点嵌入。具体的,子图可以理解为一个同构图数据;节点v可以理解为待检测节点;邻居节点嵌入可以理解为邻居节点的表示向量。
60.步骤s330:将所述多个第一表示向量输入到所述关系间融合子层,通过关系级注意力机制对所述多个第一表示向量进行融合,以得到所述待检测节点的第二表示向量。
61.在本技术实施例中,所述关系级注意力机制也就是元路径级注意力机制。为了学习到更综合的信息,需要根据元路径将多种语义信息融合到一起。将关系内聚合子层通过聚合器级注意力机制输出的结果作为关系间融合子层的输入,来学习每条语义的权重。
62.在本技术实施例中,所述第二表示向量可以通过如下公式计算得到:其中,h
n(v)
表示节点v相对于所有元路径聚合的邻域信息;m表示元路径条数;表示元路径pi的重要性;表示基于元路径pi的子图内节点v聚合的邻域信息。
63.作为一种方式,在关系间融合子层中,通过关系级注意力机制对待检测节点的所有基于元路径的同构图数据中的邻居节点的特征信息进行融合,通过上式计算得到待检测节点的第二表示向量。
64.步骤s340:获取当前时刻的第二表示向量以及上一时刻的第二表示向量。
65.在异构图神经网络的更新子层中,可以通过隐式特征交互和显示特征交互组合的方式来更新待检测节点的表示向量。隐式特征交互的过程可以通过如图4所示。在图4中,hv为当前时刻的第二表示向量,h
n(v)
为前一时刻的第二表示向量,基于当前时刻的第二表示向量和前一时刻的表示向量通过如图4所示的过程可以计算得到对应的隐藏向量。同样的,通过显式特征交互的过程也可以计算得到对应的隐藏向量。
66.步骤s350:将所述当前时刻的第二表示向量以及上一时刻的第二表示向量输入到所述更新子层中,通过隐式特征交互网络分别得到第一隐藏表示向量和第二隐藏表示向量。
67.在本技术实施例中,在隐式特征交互网络中,所述第一隐藏表示向量可以通过如下公式计算得到:zv=σ(w
zhv
+u
zhn(v)
),rv=σ(w
rhv
+u
zhn(v)
),其中,为第一隐藏向量,hv为当前时刻的第二表示向量,h
n(v)
为前一时刻的第二表示向量,σ、wz、wr、w以及u都是预先设置好的参数值。所述第二隐藏表示向量可以通过如下公式计算得到:z
n(v)
=σ(w
zhn(v)
+u
zhv
),r
n(v)
=σ(w
rhn(v)
+u
zhv
),其中,为第二隐藏向量,hv为当前时刻的第二表示向量,h
n(v)
为前一时刻的第二表示向量,σ、wz、wr、w以及u都是预先设置好的参数值。
68.步骤s360:通过显示特征交互网络分别得到第三隐藏表示向量和第四隐藏表示向量。
69.在本技术实施例中,在显式特征交互网络中,第三隐藏表示向量可以通过如下计算式计算得到:其中,为第三隐藏表示向量,σ、w1也都是预先设置好的参数,表示对h
n(v)
进行转置后得到的表示向量。第四隐藏表示向量可以通过如下公式计算得到:其中,为第四隐藏表示向量,σ、w2为预先设置好的参数,表示对hv进行转置后得到的表示向量。
70.步骤s370:基于所述第一隐藏表示向量和第二隐藏表示向量,以及所述第三隐藏表示向量和第四隐藏表示向量,计算得到所述待检测节点的表示向量。
71.作为一种方式,将隐式特征交互和显式特征交互后得到的隐藏表示向量进行求和分别得到:与进而再将与进行求和得到待检测节点的表示向量:进而可以对待检测节点的表示向量进行更新。
72.对于每一个节点,取异构图神经网络的最后的输出作为节点的最终表示向量。
73.步骤s380:将所述待检测节点的表示向量输入训练好的检测模型中,以对所述待检测节点进行检测。
74.在本技术实施例中,将待检测节点的最终表示向量输入到训练好的检测模型中,通过sigmoid函数计算该待检测节点的可疑性。
75.根据上述描述,得到待检测节点的最终表示向量的过程可以如图5所示,在图5中,
首先会构建基于元路径的输入图,进而在关系内聚合子层中通过聚合器级注意力网络聚合邻居节点的特征信息,再将聚合得到的不同元路径的邻居节点的特征信息输入到关系间融合子层,通过关系级注意力机制进行融合得到待检测节点的第二表示向量。
76.进而获取当前时刻的第二表示向量和前一时刻的第二表示向量,将当前时刻的第二表示向量和前一时刻的第二表示向量输入到显式特征交互网络和隐式特征交互网络,得到待检测节点的最终表示向量,进而将待检测节点的最终表示向量输入到训练好的检测模型中,对待检测节点进行检测。其中,隐式特征交互网络可以为gru网络。
77.本技术提供的一种欺诈检测方法,获取与检测内容相关的多个同构图数据,将多个同构图数据输入到关系内聚合子层,通过聚合器级注意力机制分别对多个同构图中的每个同构图数据中待检测节点的邻居节点的信息进行融合,以得到待检测节点的多个第一表示向量,然后将多个第一表示向量输入到关系间融合子层,通过关系级注意力机制对多个第一表示向量进行融合,以得到待检测节点的第二表示向量,再获取当前时刻的第二表示向量以及上一时刻的第二表示向量,将当前时刻的第二表示向量以及上一时刻的第二表示向量输入到更新子层中,通过隐式特征交互网络分别得到第一隐藏表示向量和第二隐藏表示向量,通过显示特征交互网络分别得到第三隐藏表示向量和第四隐藏表示向量,然后基于第一隐藏表示向量、第二隐藏表示向量、第三隐藏表示向量和第四隐藏表示向量,计算得到待检测节点的表示向量,最后将待检测节点的表示向量输入训练好的检测模型中,以对待检测节点进行检测,通过上述方法,通过聚合器级注意力机制从多方面学习邻居节点的信息,从而学习到更丰富的邻域信息,提高了待检测节点的表示能力,再者,在更新子层中,通过隐式与显示特征交互更新待检测节点的表示向量,充分地交互了待检测节点与聚合的邻域信息,从而提高了异构神经网络的表达能力,进而提高了对待检测节点进行检测的检测精度。
78.请参阅图6,本技术实施例提供的一种欺诈检测方法,所述方法包括:
79.步骤s410:获取第一数据集和第二数据集。
80.在本技术实施例中,第一数据集为yelp数据集,第二数据集为amazon数据集。其中,yelp数据集包含了被yelp推荐(合法)和过滤(欺诈)的餐厅和酒店评论。在此,使用yelp数据集进行欺骗评论检测任务,使用amazon数据集进行欺骗用户检测任务。
81.步骤s420:基于第一预设元路径模式,构建所述第一数据集对应的多个第一同构图。
82.作为一种方式,在yelp数据集中,对于欺诈评论图,将评论视为节点,设计了三种元路径,因此,所述第一预设元路径模式可以包括1)r-s-r:它连接对同一产品有相同评级(1-5星)的评价;2)r-u-r:它连接同一用户发布的评论;3)r-t-r:它连接在同一个月对同一产品发布的两个评论。
83.在本技术实施例中,基于上述三种元路径构建三种不同的同构图数据,将这三种同构图数据作为第一数据集对应的多个第一同构图。
84.步骤s430:基于第二预设元路径模式,构建所述第二数据集对应的多个第二同构图。
85.作为一种方式,在amazon数据集中,对于欺诈用户图,将用户视为节点,设计了三种元路径,因此,所述第二预设元路径模式可以包括1)u-s-u:它连接一周内至少发表过一
次相同评级的用户;2)u-p-u:它连接至少对同一产品进行过评论的用户;3)u-v-u:它连接所有用户中前5%(top 5%)的相互评论文本相似度(由tf-idf衡量)的用户。
86.在本技术实施例中,基于上述三种元路径构建三种不同的同构图数据,将这三种同构图数据作为第二数据集对应的多个第二同构图。
87.步骤s440:将所述多个第一同构图和所述多个第二同构图输入到异构神经网络模型中,对所述异构神经网络模型进行训练,以得到所述训练好的异构神经网络模型。
88.作为一种方式,对所述异构神经网络模型进行训练的步骤包括:获取目标损失函数;根据所述目标损失函数,迭代训练所述异构神经网络模型,直至损失值满足预设条件,将迭代完成的所述异构神经网络模型作为所述训练好的异构神经网模型。
89.在本技术实施例中,将多个第一同构图和多个第二同构图输入到还未训练的异构神经网络模型中,获取目标损失函数,基于目标损失函数对还未训练的异构神经网络模型进行训练。其中,目标损失函数如下:其中,yv表示节点v的标签;λ1表示超参数;mlp表示多层感知机;并且所有模型参数的l2正则项用||θ||2表示。
90.对于每个节点,取异构神经网络模型的最后一层的输出作为节点的最终表示向量,利用反向传播的交叉熵损失函数来训练该异构神经网络模型的参数,得到训练好的异构神经网络模型。
91.具体的,在对异构神经网络模型进行训练时,可以通过损失值来确定模型是否已经训练好,当损失值满足于预设损失值范围时,确定模型已经训练完成。
92.步骤s450:获取与检测内容相关的多个同构图数据,所述多个同构图数据各自对应的元路径模式不同,所述同构图数据包括待检测节点、所述待检测节点的邻居节点、以及基于元路径模式建立的连接所述待检测节点与所述邻居节点之间的路径。
93.步骤s460:将所述多个同构图数据输入到训练好的异构神经网络模型,获取所述训练好的异构神经网络模型输出的所述待检测节点的表示向量。
94.步骤s470:将所述待检测节点的表示向量输入训练好的检测模型中,以对所述待检测节点进行检测。
95.在本实施例中,步骤s450、步骤s460以及步骤s470的具体实施方式,可以参考上文实施例所提供的步骤s110、步骤s120以及步骤s130的阐述,此处不再一一赘述。
96.本技术提供的一种欺诈检测方法,获取第一数据集和第二数据集,基于第一预设元路径模式,构建第一数据集对应的多个第一同构图,基于第二预设元路径模式,构建第二数据集对应的多个第二同构图,将多个第一同构图和多个第二同构图输入到异构神经网络模型中,对异构神经网络模型进行训练,以得到训练好的异构神经网络模型。在实际检测阶段,获取与检测内容相关的多个同构图数据,将多个同构图数据输入到训练好的异构神经网络模型,获取训练好的异构神经网络模型输出的待检测节点的表示向量,将待检测节点的表示向量输入训练好的检测模型中,以对待检测节点进行检测。通过上述方法,通过同构图的方式,将与待检测节点有关的多个同构图输入到训练好的异构神经网络中,可以使得训练好的神经网络可以更好的关注到同一元路径模式下的待检测节点的邻居节点的特征信息,以及不同元路径模式下的待检测节点的邻居节点的特征信息,提高了待检测节点的
表示能力,进而通过训练好的异构神经网络对待检测节点进检测,可以提高对待检测节点进行检测的检测精度。
97.请参阅图7,本技术实施例提供的一种欺诈检测装置500,所述装置500包括:
98.数据获取单元510,用于获取与检测内容相关的多个同构图数据,所述多个同构图数据各自对应的元路径模式不同,所述同构图数据包括待检测节点、所述待检测节点的邻居节点、以及基于元路径模式建立的连接所述待检测节点与所述邻居节点之间的路径。
99.向量获取单元520,用于将所述多个同构图数据输入到训练好的异构神经网络模型,获取所述训练好的异构神经网络输出的所述待检测节点的表示向量。
100.作为一种方式,所述训练好的异构神经网络模型包括关系内聚合子层、关系间融合子层以及更新子层。所述向量获取单元520具体包括第一表示向量获取模块、第二表示向量获取模块以及表示向量获取模块。
101.其中,第一表示向量获取模块,用于将所述多个同构图数据输入到所述关系内聚合子层,获取所述关系内聚合子层输出的所述待检测节点的多个第一表示向量,其中,所述多个第一表示向量表征所述多个同构图数据各自对应的所述待检测节点的邻域信息,所述邻域信息为聚合的每个同构图数据中的所述待检测节点的邻居节点的信息。
102.可选的,所述第一表示向量获取模块具体用于将所述多个同构图数据输入到所述关系内聚合子层,通过聚合器级注意力机制分别对所述多个同构图数据中的每个同构图数据中所述待检测节点的邻居节点的信息进行融合,以得到所述待检测节点的多个第一表示向量。
103.第二表示向量获取模块,用于将所述多个第一表示向量输入到所述关系间融合子层,获取所述关系间融合子层输出的所述待检测节点的第二表示向量。
104.具体的,所述第二表示向量获取模块用于将所述多个第一表示向量输入到所述关系间融合子层,通过关系级注意力机制对所述多个第一表示向量进行融合,以得到所述待检测节点的第二表示向量。
105.表示向量获取模块,用于将所述第二表示向量输入到所述更新子层,获取所述更新子层输出的所述待检测节点的表示向量。
106.具体的,所述表示向量获取模块还用于获取当前时刻的第二表示向量以及上一时刻的第二表示向量;将所述当前时刻的第二表示向量以及上一时刻的第二表示向量输入到所述更新子层中,通过隐式特征交互网络分别得到第一隐藏表示向量和第二隐藏表示向量;通过显示特征交互网络分别得到第三隐藏表示向量和第四隐藏表示向量;基于所述第一隐藏表示向量和第二隐藏表示向量,以及所述第三隐藏表示向量和第四隐藏表示向量,计算得到所述待检测节点的表示向量。
107.检测单元530,用于所述待检测节点的表示向量输入训练好的检测模型中,以对所述待检测节点进行检测。
108.请参阅图8,所述装置500还包括:
109.模型训练单元540,用于获取第一数据集和第二数据集;基于第一预设元路径模式,构建所述第一数据集对应的多个第一同构图;基于第二预设元路径模式,构建所述第二数据集对应的多个第二同构图;将所述多个第一同构图和所述多个第二同构图输入到异构神经网络模型中,对所述异构神经网络模型进行训练,以得到所述训练好的异构神经网络。
110.具体的,所述模型训练单元540,具体用于获取目标损失函数;根据所述目标损失函数,迭代训练所述异构神经网络模型,直至损失值满足预设条件,将迭代完成的所述异构神经网络模型作为所述训练好的异构神经网络模型。
111.需要说明的是,本技术中装置实施例与前述方法实施例是相互对应的,装置实施例中具体的原理可以参见前述方法实施例中的内容,此处不再赘述。
112.下面将结合图9对本技术提供的一种电子设备进行说明。
113.请参阅图9,基于上述的欺诈检测方法、装置,本技术实施例还提供的另一种可以执行前述欺诈检测方法的电子设备800。电子设备800包括相互耦合的一个或多个(图中仅示出一个)处理器802、存储器804以及网络模块806。其中,该存储器804中存储有可以执行前述实施例中内容的程序,而处理器802可以执行该存储器804中存储的程序。
114.其中,处理器802可以包括一个或者多个处理核。处理器802利用各种接口和线路连接整个电子设备800内的各个部分,通过运行或执行存储在存储器804内的指令、程序、代码集或指令集,以及调用存储在存储器804内的数据,执行电子设备800的各种功能和处理数据。可选地,处理器802可以采用数字信号处理(digital signal processing,dsp)、现场可编程门阵列(field-programmable gate array,fpga)、可编程逻辑阵列(programmable logic array,pla)中的至少一种硬件形式来实现。处理器802可集成中央处理器(central processing unit,cpu)、图像处理器(graphics processing unit,gpu)和调制解调器等中的一种或几种的组合。其中,cpu主要处理操作系统、用户界面和应用程序等;gpu用于负责显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器802中,单独通过一块通信芯片进行实现。
115.存储器804可以包括随机存储器(random access memory,ram),也可以包括只读存储器(read-only memory)。存储器804可用于存储指令、程序、代码、代码集或指令集。存储器804可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储终端800在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。
116.所述网络模块806用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯,例如和音频播放设备进行通讯。所述网络模块806可包括各种现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(sim)卡、存储器等等。所述网络模块806可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。例如,网络模块806可以与基站进行信息交互。
117.请参考图10,其示出了本技术实施例提供的一种计算机可读存储介质的结构框图。该计算机可读介质900中存储有程序代码,所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。
118.计算机可读存储介质900可以是诸如闪存、eeprom(电可擦除可编程只读存储器)、eprom、硬盘或者rom之类的电子存储器。可选地,计算机可读存储介质900包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储
介质900具有执行上述方法中的任何方法步骤的程序代码910的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码910可以例如以适当形式进行压缩。
119.本技术提供的一种欺诈检测方法、装置、电子设备以及存储介质,首先获取与检测内容相关的多个同构图数据,所述多个同构图数据对应的元路径模式不同,所述同构图数据包括待检测节点、所述待检测节点的邻居节点、以及基于元路径模式建立的连接所述待检测节点与所述邻居节点之间的路径,然后将多个同构图数据输入到训练好的异构神经网络模型,获取异构神经网络输出的待检测节点的表示向量,进而将待检测节点的表示向量输入训练好的检测模型中,对待检测节点进行检测。通过上述方法,通过同构图的方式,将与待检测节点有关的多个同构图输入到训练好的异构神经网络中,可以使得训练好的神经网络可以更好的关注到同一元路径模式下的待检测节点的邻居节点的特征信息,以及不同元路径模式下的待检测节点的邻居节点的特征信息,提高了待检测节点的表示能力,进而通过训练好的异构神经网络对待检测节点进检测,可以提高对待检测节点进行检测的检测精度。
120.上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
技术特征:
1.一种欺诈检测方法,其特征在于,所述方法包括:获取与检测内容相关的多个同构图数据,所述多个同构图数据各自对应的元路径模式不同,所述同构图数据包括待检测节点、所述待检测节点的邻居节点、以及基于元路径模式建立的连接所述待检测节点与所述邻居节点之间的路径;将所述多个同构图数据输入到训练好的异构神经网络模型,获取所述训练好的异构神经网络输出的所述待检测节点的表示向量;将所述待检测节点的表示向量输入训练好的检测模型中,以对所述待检测节点进行检测。2.根据权利要求1所述的方法,其特征在于,所述训练好的异构神经网络模型包括关系内聚合子层、关系间融合子层以及更新子层,所述将所述多个同构图数据输入到训练好的异构神经网络模型,获取所述训练好的异构神经网络输出的所述待检测节点的表示向量,包括:将所述多个同构图数据输入到所述关系内聚合子层,获取所述关系内聚合子层输出的所述待检测节点的多个第一表示向量,其中,所述多个第一表示向量表征所述多个同构图数据各自对应的所述待检测节点的邻域信息,所述邻域信息为聚合的每个同构图数据中的所述待检测节点的邻居节点的信息;将所述多个第一表示向量输入到所述关系间融合子层,获取所述关系间融合子层输出的所述待检测节点的第二表示向量;将所述第二表示向量输入到所述更新子层,获取所述更新子层输出的所述待检测节点的表示向量。3.根据权利要求2所述的方法,其特征在于,所述将所述多个同构图数据输入到所述关系内聚合子层,获取所述关系内聚合子层输出的所述待检测节点的多个第一表示向量,包括:将所述多个同构图数据输入到所述关系内聚合子层,通过聚合器级注意力机制分别对所述多个同构图数据中的每个同构图数据中所述待检测节点的邻居节点的信息进行融合,以得到所述待检测节点的多个第一表示向量。4.根据权利要求2所述的方法其特征在于,所述将所述多个第一表示向量输入到所述关系间融合子层,获取所述关系间融合子层输出的所述待检测节点的第二表示向量,包括:将所述多个第一表示向量输入到所述关系间融合子层,通过关系级注意力机制对所述多个第一表示向量进行融合,以得到所述待检测节点的第二表示向量。5.根据权利要求2所述的方法,其特征在于,所述将所述第二表示向量输入到所述更新子层,获取所述更新子层输出的所述待检测节点的表示向量,包括:获取当前时刻的第二表示向量以及上一时刻的第二表示向量;将所述当前时刻的第二表示向量以及上一时刻的第二表示向量输入到所述更新子层中,通过隐式特征交互网络分别得到第一隐藏表示向量和第二隐藏表示向量;通过显示特征交互网络分别得到第三隐藏表示向量和第四隐藏表示向量;基于所述第一隐藏表示向量和第二隐藏表示向量,以及所述第三隐藏表示向量和第四隐藏表示向量,计算得到所述待检测节点的表示向量。6.根据权利要求1所述的方法,其特征在于,所述获取与检测内容相关的多个同构图数
据之前还包括:获取第一数据集和第二数据集;基于第一预设元路径模式,构建所述第一数据集对应的多个第一同构图;基于第二预设元路径模式,构建所述第二数据集对应的多个第二同构图;将所述多个第一同构图和所述多个第二同构图输入到异构神经网络模型中,对所述异构神经网络模型进行训练,以得到所述训练好的异构神经网络模型。7.根据权利要求5所述的方法,其特征在于,所述将所述多个第一同构图和所述多个第二同构图输入到异构神经网络模型中,对所述异构神经网络模型进行训练,以得到所述训练好的异构神经网络模型,包括:获取目标损失函数;根据所述目标损失函数,迭代训练所述异构神经网络模型,直至损失值满足预设条件,将迭代完成的所述异构神经网模型络作为所述训练好的异构神经网络模型。8.一种欺诈检测装置,其特征在于,所述装置包括:数据获取单元,用于获取与检测内容相关的多个同构图数据,所述多个同构图数据各自对应的元路径模式不同,所述同构图数据包括待检测节点、所述待检测节点的邻居节点、以及基于元路径模式建立的连接所述待检测节点与所述邻居节点之间的路径;向量获取单元,用于将所述多个同构图数据输入到训练好的异构神经网络模型,获取所述训练好的异构神经网络输出的所述待检测节点的表示向量;检测单元,用于所述待检测节点的表示向量输入训练好的检测模型中,以对所述待检测节点进行检测。9.一种电子设备,其特征在于,包括一个或多个处理器以及存储器;一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行权利要求1-7任一所述的方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序代码,其中,在所述程序代码被处理器运行时执行权利要求1-7任一所述的方法。
技术总结
本申请实施例公开了一种欺诈检测方法、装置、电子设备及存储介质。所述方法包括:获取与检测内容相关的多个同构图数据,所述多个同构图数据各自对应的元路径模式不同,所述同构图数据包括待检测节点、所述待检测节点的邻居节点、以及基于元路径模式建立的连接所述待检测节点与所述邻居节点之间的路径;将所述多个同构图数据输入到训练好的异构神经网络模型,获取所述异构神经网络输出的所述待检测节点的表示向量;将所述待检测节点的表示向量输入训练好的检测模型中,以对所述待检测节点进行检测。通过上述方法,可以提高对待检测节点进行检测的检测精度。检测的检测精度。检测的检测精度。
技术研发人员:姜楠 段福先 李媛媛 万涛 高莉 刘西蒙
受保护的技术使用者:华东交通大学
技术研发日:2021.12.06
技术公布日:2022/3/8