本申请涉及人工智能,尤其涉及一种特征衍生方法、装置、设备、存储介质及程序产品。
背景技术:
1、在数据分析和建模过程中,通过合理应用特征转换、特征组合等从原始数据中创造新的特征或变量,可以大幅提升模型的准确性和鲁棒性,也即,从已有的基础特征中衍生出新的特征信息,可以显著提高模型的性能,在交易过程中也常使用该模型进行高效工作。
2、目前,常用的特征衍生方法为:通过多层感知机、深度卷积网络等神经网络对单一模态数据进行特征建模;若将这种特征衍生方式应用至多模态场景,则只是基于神经网络对不同模态数据进行编码拼接,然而,采用编码拼接的方式难以捕捉不同模态之间的关联性,导致无法生成有效的衍生特征。
技术实现思路
1、本申请的主要目的在于提供一种发明名称,旨在解决采用编码拼接的方式难以捕捉不同模态之间的关联性,导致无法生成有效的衍生特征的技术问题。
2、为实现上述目的,本申请提出一种特征衍生方法,所述的方法包括:
3、获取在设定时间范围内用户的交易基础特征与交易序列基础特征,以及所述用户的账户基础特征;
4、对所述账户基础特征与所述交易基础特征进行表格型特征编码,获得表格型特征表示,并对所述交易序列基础特征进行交易序列时间特征编码,获得交易序列型特征表示;
5、对所述表格型特征表示与所述交易序列型特征表示进行低秩融合,获得衍生特征。
6、在一实施例中,所述对所述表格型特征表示与所述交易序列型特征表示进行低秩融合,获得衍生特征的步骤包括:
7、基于预设低秩权重张量,对所述表格型特征表示与所述交易序列型特征表示进行特征融合,获得衍生特征。
8、在一实施例中,所述基于预设低秩权重张量,对所述表格型特征表示与所述交易序列型特征表示进行特征融合,获得衍生特征的步骤之前,包括:
9、对预设高维权重张量进行低秩分解,获得所述预设低秩权重张量。
10、在一实施例中,所述对所述交易序列基础特征进行交易序列时间特征编码,获得交易序列型特征表示的步骤包括:
11、对所述交易序列基础特征中的特征数值进行无量纲化处理,并对所述交易序列基础特征中各结点对应时间戳进行多通道交易时间特征编码,获得时间特征序列;
12、基于预设自注意力机制对所述时间特征序列进行交易序列时间特征编码,获得交易序列型特征表示。
13、在一实施例中,所述对所述交易序列基础特征中的特征数值进行无量纲化处理,并对所述交易序列基础特征中各结点对应时间戳进行多通道交易时间特征编码,获得时间特征序列的步骤包括:
14、对所述交易序列基础特征中的特征数值进行无量纲化处理,得到无量纲特征;
15、从所述交易序列基础特征中识别各结点对应时间戳;
16、对所述时间戳进行时间特征编码,获得时间维度的时间特征;
17、将所述时间特征与所述无量纲特征进行拼接,获得时间特征序列。
18、在一实施例中,所述对所述账户基础特征与所述交易基础特征进行表格型特征编码,获得表格型特征表示的步骤包括:
19、将所述账户基础特征与所述交易基础特征进行拼接,获得表格基础特征;
20、基于预设多层感知机对所述表格基础特征进行表格型特征编码,获得表格型特征表示。
21、此外,为实现上述目的,本申请还提出一种特征衍生装置,所述特征衍生装置包括:
22、获取模块,用于获取用户在设定时间范围内的账户基础特征、交易基础特征以及交易序列基础特征;
23、编码模块,用于对所述账户基础特征与所述交易基础特征进行表格型特征编码,获得表格型特征表示,并对所述交易序列基础特征进行交易序列时间特征编码,获得交易序列型特征表示;
24、融合模块,用于对所述表格型特征表示与所述交易序列型特征表示进行低秩融合,获得衍生特征。
25、此外,为实现上述目的,本申请还提出一种特征衍生设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如上文所述的特征衍生方法的步骤。
26、此外,为实现上述目的,本申请还提出一种存储介质,所述存储介质为计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上文所述的特征衍生方法的步骤。
27、此外,为实现上述目的,本申请还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如上文所述的特征衍生方法的步骤。
28、本申请提出的一个或多个技术方案,至少具有以下技术效果:
29、本申请通过获取在设定时间范围内用户的交易基础特征,以获取用户在设定时间范围内每笔交易的信息,再获取在设定时间范围内用户的交易序列基础特征,以获取在设定时间范围内连续交易的信息特征,并获取表征用户信息的账户基础特征;通过对账户基础特征与交易基础特征进行表格型特征编码,能够将账户基础特征与交易基础特征转换为神经网络层可以接受的形式,有利于神经网络的收敛;通过对交易序列基础特征进行交易序列时间特征编码,能够确定交易序列基础特征在时间维度上的行为特征;可以理解,表格型特征能够反映某一时间对应的不同用户的属性,交易序列基础特征能够反映用户行为特征;因此,通过对表格型特征表示与交易序列型特征表示进行低秩融合,能够学习得到用户的属性与用户行为特征之间的关联性,从而生成有效的衍生特征;相较于相关技术中将不同模态数据进行简单拼接,本申请采用上述技术方案能够提升衍生特征的有效性。
1.一种特征衍生方法,其特征在于,所述的方法包括:
2.如权利要求1所述的方法,其特征在于,所述对所述表格型特征表示与所述交易序列型特征表示进行低秩融合,获得衍生特征的步骤包括:
3.如权利要求2所述的方法,其特征在于,所述基于预设低秩权重张量,对所述表格型特征表示与所述交易序列型特征表示进行特征融合,获得衍生特征的步骤之前,包括:
4.如权利要求1至3中任一项所述的方法,其特征在于,所述对所述交易序列基础特征进行交易序列时间特征编码,获得交易序列型特征表示的步骤包括:
5.如权利要求4所述的方法,其特征在于,所述对所述交易序列基础特征中的特征数值进行无量纲化处理,并对所述交易序列基础特征中各结点对应时间戳进行多通道交易时间特征编码,获得时间特征序列的步骤包括:
6.如权利要求1所述的方法,其特征在于,所述对所述账户基础特征与所述交易基础特征进行表格型特征编码,获得表格型特征表示的步骤包括:
7.一种特征衍生装置,其特征在于,所述装置包括:
8.一种特征衍生设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如权利要求1至6中任一项所述的特征衍生方法的步骤。
9.一种存储介质,其特征在于,所述存储介质为计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的特征衍生方法的步骤。
10.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的特征衍生方法的步骤。