企业风险预测方法、装置、电子设备和介质与流程

1.本技术涉及数据分析技术领域，尤其涉及一种企业风险预测方法、装置、电子设备、介质和程序产品。

背景技术：

2.企业客户的违约风险对于金融机构是重点防控的领域，任何一家金融机构为了更好的控制经营风险，防止大规模的客户违约问题，都会投入巨量资源进行客户数据分析调查。
3.实际上由于现实中各家企业在生产贸易上的协作关系，很多企业在资金、业务上往来十分密切，由于这种商业联系的存在，当一家企业出现违约时，很有可能会连带导致相关企业资金链也出现问题进而陷入债务危机。所以在违约风险上把各个客户之间的连带关系探索清楚，对于风险防范有着非常重要的作用。

技术实现要素：

4.本技术提供一种企业风险预测方法、装置、电子设备、介质和程序产品，以实现企业违约金额风险的精准预测。
5.第一方面，本技术提供了一种企业风险预测方法，该方法包括：
6.利用时间序列模型对各企业的历史违约金额时间序列数据进行过滤，得到各企业的残差序列，并组成残差序列矩阵；
7.利用所述残差序列矩阵拟合相关度模型，其中，所述相关度模型用于反映多维数据间的概率相依结构；
8.根据所述拟合好的相关度模型和所述时间序列模型对所述各企业未来的违约金额进行预测。
9.第二方面，本技术还提供了一种企业风险预测装置，该装置包括：
10.过滤模块，用于利用时间序列模型对各企业的历史违约金额时间序列数据进行过滤，得到各企业的残差序列，并组成残差序列矩阵；
11.模型拟合模块，用于利用所述残差序列矩阵拟合相关度模型，其中，所述相关度模型用于反映多维数据间的概率相依结构；
12.预测模块，用于根据所述拟合好的相关度模型和所述时间序列模型对所述各企业未来的违约金额进行预测。
13.第三方面，本技术还提供了一种电子设备，包括：
14.一个或多个处理器；
15.存储装置，用于存储一个或多个程序，
16.当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如上所述的企业风险预测方法。
17.第四方面，本技术还提供了一种计算机可读存储介质，其上存储有计算机程序，该
程序被处理器执行时实现如上所述的企业风险预测方法。
18.第五方面，本技术还提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现如上所述的企业风险预测方法。
19.本技术的技术方案中，利用时间序列模型对各企业的历史违约金额时间序列数据进行过滤，得到各企业的残差序列组成的残差序列矩阵，并利用所述残差序列矩阵拟合相关度模型，然后根据拟合好的相关度模型和所述时间序列模型对各企业未来的违约金额进行预测。由此，采用时间序列过滤法对各个企业的历史违约数据进行过滤，将各个企业的历史违约数据中真正相关联的部分提取出来，然后根据过滤出的数据采用相依结构模型进行关联度模拟，基于模拟结果预测各个企业的违约金额，才能提高预测结果的准确性，继而更准确地把握各个企业的整体风险情况。
附图说明
20.图1是本技术实施例中的企业风险预测方法的流程图；
21.图2是本技术实施例中的企业风险预测方法的流程图；
22.图3是本技术实施例中的企业风险预测装置的结构示意图；
23.图4是本技术实施例中的电子设备的结构示意图。
具体实施方式
24.下面结合附图和实施例对本技术作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本技术，而非对本技术的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本技术相关的部分而非全部结构。
25.图1为本技术实施例中的企业风险预测方法的流程图，本实施例可适用于根据拟合的相关度模型和时间序列模型对各企业未来的违约风险进行预测的情况，涉及数据分析技术领域。该方法可以由企业风险预测装置来执行，该装置可以采用软件和/或硬件的方式实现，优选是配置于电子设备中，例如计算机设备或服务器等。如图1所示，该方法具体包括：
26.s101、利用时间序列模型对各企业的历史违约金额时间序列数据进行过滤，得到各企业的残差序列，并组成残差序列矩阵。
27.s102、利用残差序列矩阵拟合相关度模型，其中，相关度模型用于反映多维数据间的概率相依结构。
28.相关度模型是反映多维数据间概率相依结构的模型，其本质是联合概率分布函数的变种。通过相关度模型可以借助概率意义上的相关度来反映各个分量数据之间互相联动的强度关系。因此，可以利用相关度模型，基于这种相依结构来精准量化不同企业之间其违约金额风险的关联性大小，进而预测这些企业的违约总额情况。
29.其中，相关度模型可以利用历史数据进行拟合，通过拟合来确定模型中的各个参数。所述历史数据即为各企业的历史违约金额时间序列数据，例如可以是过去一段时间内各企业每月的违约金额时间序列数据，记载每个企业每个月的违约金额。此外，如果企业的历史违约数据有缺失，则将该月的所有企业数据删除，或者用加权平均的算法取历史平均值对数据进行填充，以防止数据结构不符导致模型无法计算。
30.然而需要说明的是，预要精准描述企业违约风险之间的关联性，并不能简单的直接对企业的历史风险数据进行分析，因为各企业间虽然有业务往来，但并不等于这种风险会绝对传导。具体来说就是，协作企业之间的相互业务占比很难达到100％，所以两家企业即使业务相关度高，也不等于一家资金出问题就一定会导致另一家也跟着出问题，毕竟另一家企业也有其他商业伙伴，从其他渠道融资是可以一定程度上抵御风险的。因此，对于这种企业间违约风险的关联性，需要事先对各自风险数据进行一些过滤工作，将其中真正相关联的部分提取出来，才能更准确的把握金融机构所有企业客户整体的风险情况。
31.本技术实施例中，则是采用时间序列过滤法对各个企业的历史违约金额数据进行过滤，将过滤出的数据部分采用相依结构模型进行关联度模拟。其中，时间序列模型可以根据系统观测得到的时间序列数据，用曲线拟合的方法对系统进行客观的描述，例如包括自回归模型或移动平均模型等。本技术实施例对时间序列模型的具体结构不作任何限定。具体而言，利用时间序列模型进行过滤，可以从各企业的历史违约金额时间序列数据中，挖掘出不同企业之间其违约风险真正相关联的数据部分，得到残差序列，各企业的残差序列即可组成残差序列矩阵。根据该残差序列矩阵来拟合相关度模型，即可更准确的来衡量各企业间违约风险的关联性，从而准确对企业未来的违约金额进行预测。
32.s103、根据拟合好的相关度模型和时间序列模型对各企业未来的违约金额进行预测。
33.具体的，利用拟合好的相关度模型可以生成多组随机数，这些随机数即可表示预测的各企业未来的违约金额，只不过由于相关度模型是根据经过滤得到的残差序列矩阵拟合而成，因此相关度模型生成的这些预测结果属于残差数据，还需要经时间序列模型进行逆运算，即可得到各企业未来违约金额的预测值，将这些预测值采用求平均和求和的方式，即可得到各企业未来的违约预测总额。
34.本技术实施例的技术方案，采用时间序列过滤法对各个企业的历史违约数据进行过滤，将各个企业的历史违约数据中真正相关联的部分提取出来，然后根据过滤出的数据采用相依结构模型进行关联度模拟，基于模拟结果预测各个企业的违约金额，才能提高预测结果的准确性，继而更准确地把握各个企业的整体风险情况。
35.图2为本技术实施例中的企业风险预测方法的流程图，本实施例在上述实施例的基础上进行进一步地优化。如图2所示，所述方法包括：
36.s201、利用时间序列模型对各企业的历史违约金额时间序列数据进行过滤，得到各企业的残差序列，并组成残差序列矩阵。
37.其中，所述相关度模型为copula模型。本技术实施例不对具体的copula模型结构做任何限定。
38.s202、将残差序列矩阵中的各列数据替换为其所在列的经验分布概率值，得到经转化的残差序列矩阵。
39.具体的，可以通过如下过程实现转化：
40.将残差序列矩阵中的各列数据按照大小顺序进行排序，排序后得到各列的样本总体；将经排序的各列数据中的每个数据，转化为其在各列样本总体中对应的分位点值，其中，分位点值的取值范围为0至1；根据每个数据对应的分位点值得到经转换的残差序列矩阵。
41.此外，在不改变所述排序的顺序的情况下，还可以将每个数据在各列样本总体对应的分位点值中出现的极值进行缩放。
42.需要说明的是，copula模型面对的数据类型是0-1上的数值，因为它是专门用来处理各个概率分布函数间关系的结构，因此，各企业的违约金额数据是无法直接代入模型中使用的，需要将数据进行转换。也即：输入数据必须和概率分布函数一样取值只能在0-1范围内。本技术中可以采用经验分布的方法，将各企业的违约金额数据一字排开作为样本总体，将每个数据转化为其在样本总体中的对应分位点值即可。此外，因为在现实案例中0％和100％分位点不太常见，为了使数据更合理，在不改变数据排序的情况下，本技术中还可以将最小和最大的数值(0％和100％分位点的数据)对应的分位点作适当放缩，比如，分别改成0.01％和99.99％，以使得转化后的数据不会出现0和1这样的数值，这样模型计算出的结果往往会更加精确。
43.s203、将经转化的残差序列矩阵中的数据划分为用于拟合相关度模型的训练集，和用于对相关度模型的预测效果进行假设检验的测试集。
44.例如，可以按3：1的比例，将经转化的残差序列矩阵中的数据划分为训练集和测试集。其中，样本数量多的数据集作为训练集用于拟合copula模型，数量少的为测试集，用于后续模型预测效果的假设检验。
45.s204、将训练集输入预先构造的相关度模型，并依据极大似然法拟合相关度模型。
46.具体的，将训练集的数据输入copula模型进行拟合，拟合方法可以采用极大似然法，通过计算似然函数使之取最大值，此时的参数值就是最终的参数估计值，从而唯一确定copula模型结构。
47.s205、根据拟合好的相关度模型和时间序列模型对测试集中的每一个数据进行多次预测，得到与测试集的每个违约总额对应的多个违约预测总额。
48.s206、将多个违约预测总额取平均值，作为各企业未来的违约预测总额的目标值。
49.基于拟合好的copula模型和时间序列模型，对各企业未来的违约金额进行预测，将预测结果加总即可得到各企业的违约预测总额。具体的，采用这种copula模型和时间序列模型的模型组合，对每一个测试集数据做多次预测，得到与测试集的每个违约总额对应的多个违约预测总额，取平均后，即可得到各企业未来的违约预测总额的目标值。
50.此外，本技术实施例还可以将测试集的每一个违约总额和对应的多个预测总额进行对比分析，即，根据测试集的每个违约总额和与之对应的多个违约预测总额计算均方误差(mse)，将均方误差的结果作为精准度，用来评判相关度模型的预测效果。
51.在一种实施方式中，本技术实施例的方法还包括根据多个违约预测总额计算风险控制线，其中，风险控制线是根据风险分位点值确定，用于表示潜在风险上限。
52.风险控制线用var
α
来表示，其中，α是置信度。以var
0.95
为例，它代表的含义是超过这个风险控制线的概率是5％。本技术实施例中经步骤s205，得到与测试集的每个违约总额对应的多个违约预测总额，于是，可以通过在多个违约预测总额中选择其中的95％分位点，即可得到var
0.95
。var
α
的作用在于：它是一个人为选定的潜在风险上限，也就是说金融机构按照这个资金违约额风险去配置自己的资金安全防范措施，那么相关度模型正确的情况下，现实中自己的资金安全防范措施失效的概率就只有1-α。实际上随着α提高，var
α
的数值是增大的，并且若将var
α
视作α的函数，则该函数随α往往成几何级数增长，对应现实场景来
说，意味着为确保资金安全，相应的安防措施的经济成本会成几何级数增长，对金融机构来说，这是巨大的负担，过高var
α
带来的成本压力是不可接受的，因此需要对var
α
做出精准预估，在违约风险可承受的情况下，尽量降低var
α
，进而降低违约防范措施的成本。
53.需要说明的是，计算完风险控制线var，评估其是否准确就成为了另一个必须解决的问题。本技术实施例中采用的是基于var构造的模型预测效果假设检验，也即，依托var和测试集总和数据构造lruc、lrind、lrcc三大假设检验。因此，本技术实施例的方法还包括：根据风险控制线和测试集，构造如下假设检验中的至少一种，以对相关度模型的预测效果进行假设检验：lruc、lrind、lrcc。
54.具体的，将拟合好的相关度模型(如copula模型)模拟产生新数据作为企业违约金额的预测，预测数据的样本数量应该正好和测试集数据相等，然后将预测数据和测试集数据的各个分量加总计算总额，对比预测的总额和测试集的总额之间的差异，进行预测效果的假设检验。如果模型构造正确，则可以基于模型设定代入测试集计算得到风险控制线var。
55.由此，本技术可以依托var和测试集数据构造lruc、lrind、lrcc三大假设检验，具体如下：
56.lruc——用来评估测试集中观测数值x
t
超过var
α
的次数的发生频率是否与置信度α有显著不同，假设测试集样本容量为n，i
α
(t)为示性函数，当x
t
大于var
α
(t)时，i
α
(t)为1，否则为0。那么在本技术假设下，i
α
(t)服从参数为α的伯努利分布，于是lruc统计量服从参数为1的卡方分布，有：
[0057][0058]
这里是实际观测到的x
t
超过var
α
(t)的比例，是对应伯努利对数似然函数值。
[0059]
lrind——用来评估测试集中观测数值x
t
超过var
α
的次数的发生时刻是否彼此之间独立，即前一次发生的极端事件与后续极端事件互不影响。记π
ij
＝p(i
α
(t)＝j|i
α
(t-1)＝i)，即已知前一次示性函数取值为i的情况下后一次取值为j的频率统计,n
ij
表示i
α
从i变为j的统计次数。于是给定：
[0060][0061][0062]
显然于是有：
[0063][0064]
lrcc——是lruc与lrind的结合，在模型设定成立的前提下有：
[0065][0066]
如上，将三大假设检验合在一起就构成了完备的理论检验体系，如果无法通过任何一个检验，就说明var的精度有问题，模型的预测效果不合格。因此，上述检验体系是模型可靠性的最终保障。
[0067]
本技术实施例的技术方案，基于时间序列过滤企业的违约金额历史数据，对残差采用copula算法构造相依性，通过这种模型组合达到精准模拟现实数据的目的。而且，基于时间序列过滤加copula算法的组合，对各企业未来违约情况进行精准预测，作为评估风险的依据，并通过预测结果构造风险控制线var，帮助金融机构经营管理者评估风险等级，安排违约风险防范措施，极大提高了企业经营效率和安全性。此外，基于var构造模型预测结果假设检验作为评价模型效果好坏的依据，为模型的改造和自我优化提供了极大的便利。
[0068]
图3是本实施例中的企业风险预测装置的结构示意图。本实施例可适用于根据拟合的相关度模型和时间序列模型对各企业未来的违约风险进行预测的情况，涉及数据分析技术领域。该装置可实现本技术任意实施例所述的企业风险预测方法。如图3所示，该装置具体包括：
[0069]
过滤模块301，用于利用时间序列模型对各企业的历史违约金额时间序列数据进行过滤，得到各企业的残差序列，并组成残差序列矩阵；
[0070]
模型拟合模块302，用于利用所述残差序列矩阵拟合相关度模型，其中，所述相关度模型用于反映多维数据间的概率相依结构；
[0071]
预测模块303，用于根据所述拟合好的相关度模型和所述时间序列模型对所述各企业未来的违约金额进行预测。
[0072]
可选的，所述相关度模型为copula模型。
[0073]
可选的，所述装置还包括数据转化模块，具体用于：
[0074]
将所述残差序列矩阵中的各列数据替换为其所在列的经验分布概率值，得到经转化的残差序列矩阵；
[0075]
将所述经转化的残差序列矩阵中的数据划分为用于拟合所述相关度模型的训练集，和用于对所述相关度模型的预测效果进行假设检验的测试集。
[0076]
可选的，所述模型拟合模块302具体用于：
[0077]
将所述训练集输入预先构造的相关度模型，并依据极大似然法拟合相关度模型。
[0078]
可选的，所述预测模块303，包括：
[0079]
预测单元，用于根据所述拟合好的相关度模型和所述时间序列模型对所述测试集中的每一个数据进行多次预测，得到与所述测试集的每个违约总额对应的多个违约预测总额；
[0080]
计算单元，用于将所述多个违约预测总额取平均值，作为所述各企业未来的违约预测总额的目标值。
[0081]
可选的，所述装置还包括：
[0082]
均方误差评价模块，用于根据所述测试集的每个违约总额和与之对应的多个违约预测总额计算均方误差，其中，所述均方误差的结果作为精准度，用于评判所述相关度模型的预测效果。
[0083]
可选的，所述装置还包括：
[0084]
风险控制线计算模块，用于根据所述多个违约预测总额计算风险控制线，其中，所述风险控制线是根据风险分位点值确定，用于表示潜在风险上限。
[0085]
可选的，所述装置还包括：
[0086]
假设检验模块，用于根据所述风险控制线和测试集，构造如下假设检验中的至少
一种，以对所述相关度模型的预测效果进行假设检验：lruc、lrind、lrcc。
[0087]
可选的，所述数据转化模块具体用于：
[0088]
将所述残差序列矩阵中的各列数据按照大小顺序进行排序，排序后得到各列的样本总体；
[0089]
将经排序的各列数据中的每个数据，转化为其在各列样本总体中对应的分位点值，其中，所述分位点值的取值范围为0至1；
[0090]
根据所述每个数据对应的分位点值得到所述经转换的残差序列矩阵。
[0091]
可选的，所述数据转化模块还用于：
[0092]
在不改变所述排序的顺序的情况下，将所述每个数据在各列样本总体对应的分位点值中出现的极值进行缩放。
[0093]
本技术实施例所提供的企业风险预测装置可执行本技术任意实施例所提供的企业风险预测方法，具备执行方法相应的功能模块和有益效果。
[0094]
图4为本技术实施例提供的一种电子设备的结构示意图。图4示出了适于用来实现本技术实施方式的示例性电子设备12的框图。图4显示的电子设备12仅仅是一个示例，不应对本技术实施例的功能和使用范围带来任何限制。
[0095]
如图4所示，电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于：一个或者多个处理器或者处理单元16，系统存储器28，连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
[0096]
总线18表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(isa)总线，微通道体系结构(mac)总线，增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。
[0097]
电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。
[0098]
系统存储器28可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(ram)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示，通常称为“硬盘驱动器”)。尽管图4中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如cd-rom,dvd-rom或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本技术各实施例的功能。
[0099]
具有一组(至少一个)程序模块42的程序/实用工具40，可以存储在例如存储器28中，这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本技术所描述的实施例中的功能和/或方法。
[0100]
电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信，还可与一个或者多个使得用户能与该电子设备12交互的设备通信，和/或与使得该电
子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口22进行。并且，电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(lan)，广域网(wan)和/或公共网络，例如因特网)通信。如图所示，网络适配器20通过总线18与电子设备12的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备12使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0101]
处理单元16通过运行存储在系统存储器28中的程序，从而执行各种功能应用以及数据处理，例如实现本技术实施例所提供的企业风险预测方法。
[0102]
本技术实施例中还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本技术实施例所提供的企业风险预测方法。
[0103]
本技术实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0104]
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0105]
计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于无线、电线、光缆、rf等等，或者上述的任意合适的组合。
[0106]
可以以一种或多种程序设计语言或其组合来编写用于执行本技术操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++，还包括常规的过程式程序设计语言—诸如”c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0107]
此外，本技术还提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现如上所述的企业风险预测方法。
[0108]
本技术实施例的技术方案中，所涉及的用户个人及企业信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。
[0109]
注意，上述仅为本技术的较佳实施例及所运用技术原理。本领域技术人员会理解，本技术不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本技术的保护范围。因此，虽然通过以上实施例对本技术进行了较为详细的说明，但是本技术不仅仅限于以上实施例，在不脱离本技术构思的情况下，还可以包括更多其他等效实施例，而本技术的范围由所附的权利要求范围决定。

技术特征：
1.一种企业风险预测方法，其特征在于，包括：利用时间序列模型对各企业的历史违约金额时间序列数据进行过滤，得到各企业的残差序列，并组成残差序列矩阵；利用所述残差序列矩阵拟合相关度模型，其中，所述相关度模型用于反映多维数据间的概率相依结构；根据所述拟合好的相关度模型和所述时间序列模型对所述各企业未来的违约金额进行预测。2.根据权利要求1所述的方法，其特征在于，所述相关度模型为copula模型。3.根据权利要求1所述的方法，其特征在于，还包括：将所述残差序列矩阵中的各列数据替换为其所在列的经验分布概率值，得到经转化的残差序列矩阵；将所述经转化的残差序列矩阵中的数据划分为用于拟合所述相关度模型的训练集，和用于对所述相关度模型的预测效果进行假设检验的测试集。4.根据权利要求3所述的方法，其特征在于，所述利用所述残差序列矩阵拟合相关度模型，包括：将所述训练集输入预先构造的相关度模型，并依据极大似然法拟合相关度模型。5.根据权利要求3所述的方法，其特征在于，所述根据所述拟合好的相关度模型和所述时间序列模型对所述各企业未来的违约金额进行预测，包括：根据所述拟合好的相关度模型和所述时间序列模型对所述测试集中的每一个数据进行多次预测，得到与所述测试集的每个违约总额对应的多个违约预测总额；将所述多个违约预测总额取平均值，作为所述各企业未来的违约预测总额的目标值。6.根据权利要求5所述的方法，其特征在于，还包括：根据所述测试集的每个违约总额和与之对应的多个违约预测总额计算均方误差，其中，所述均方误差的结果作为精准度，用于评判所述相关度模型的预测效果。7.根据权利要求5所述的方法，其特征在于，还包括：根据所述多个违约预测总额计算风险控制线，其中，所述风险控制线是根据风险分位点值确定，用于表示潜在风险上限。8.根据权利要求7所述的方法，其特征在于，还包括：根据所述风险控制线和测试集，构造如下假设检验中的至少一种，以对所述相关度模型的预测效果进行假设检验：lruc、lrind、lrcc。9.根据权利要求3所述的方法，其特征在于，所述将所述残差序列矩阵中的各列数据替换为其所在列的经验分布概率值，得到经转化的残差序列矩阵，包括：将所述残差序列矩阵中的各列数据按照大小顺序进行排序，排序后得到各列的样本总体；将经排序的各列数据中的每个数据，转化为其在各列样本总体中对应的分位点值，其中，所述分位点值的取值范围为0至1；根据所述每个数据对应的分位点值得到所述经转换的残差序列矩阵。10.根据权利要求9所述的方法，其特征在于，其中，所述将所述残差序列矩阵中的各列数据，按样本分位点值进行转换，得到经转换的残差序列矩阵，还包括：
在不改变所述排序的顺序的情况下，将所述每个数据在各列样本总体对应的分位点值中出现的极值进行缩放。11.一种企业风险预测装置，其特征在于，包括：过滤模块，用于利用时间序列模型对各企业的历史违约金额时间序列数据进行过滤，得到各企业的残差序列，并组成残差序列矩阵；模型拟合模块，用于利用所述残差序列矩阵拟合相关度模型，其中，所述相关度模型用于反映多维数据间的概率相依结构；预测模块，用于根据所述拟合好的相关度模型和所述时间序列模型对所述各企业未来的违约金额进行预测。12.根据权利要求11所述的装置，其特征在于，所述相关度模型为copula模型。13.一种电子设备，其特征在于，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-10中任一所述的企业风险预测方法。14.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-10中任一所述的企业风险预测方法。15.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序在被处理器执行时实现根据权利要求1-10中任一项所述的企业风险预测方法。

技术总结
本申请公开了一种企业风险预测方法、装置、电子设备、介质和程序产品，涉及数据分析技术领域。所述方法包括：利用时间序列模型对各企业的历史违约金额时间序列数据进行过滤，得到各企业的残差序列，并组成残差序列矩阵；利用所述残差序列矩阵拟合相关度模型，其中，所述相关度模型用于反映多维数据间的概率相依结构；根据所述拟合好的相关度模型和所述时间序列模型对所述各企业未来的违约金额进行预测。本申请的技术方案可以实现对企业违约金额风险的精准预测，从而达到防范经营风险的目的。的。的。

技术研发人员：陈鹏
受保护的技术使用者：中国建设银行股份有限公司
技术研发日：2021.12.29
技术公布日：2022/3/8

专利

最新回复(0)