1.本发明涉及计算机、互联网和人工智能技术领域,具体地涉及一种上市企业财务风险预警方法和系统。
背景技术:
2.如何从上市企业公开的财务指标数据中及时分析研判出潜在的重大财务风险,提前预警以避免投资损失,是上市企业债权和权益投资人风险识别能力的重要体现。
3.传统的财务风险识别和预警主要依靠业务专家和财务专家进行全面的尽职调查,具有效率低、门槛高的缺点。随着大数据和人工智能技术的发展,将机器学习技术应用于财务风险预警可以大大降低预警的门槛,提升预警的效率。但当前机器学习技术应用主要着眼于监督学习,即通过历史发生的正负样本学习判断规律,难以防范新型风险;另外仅依靠监督机器学习模型判断,忽略行业和财务专家长期积累的经验,其预警准确率不高。
4.现有预警方法的缺点:
5.1.人工预警效率低、门槛高。
6.2.使用监督机器学习方法预警,难以防范新型财务风险。
7.3.应用单一的监督机器学习方法预警的准确率不高。
技术实现要素:
8.针对现有技术存在的问题,本发明的目的在于提供一种上市企业财务风险预警方法和系统,综合应用风险分和最大异常分二维分布进行决策的方法,提供了防范未知风险的能力,提升了整体预警结果的准确性,并且能够自动化处理、计算大量的数据并进行建模工作,有效提高预警系统运行的效率。
9.为实现上述目的,本发明提供一种上市企业财务风险预警方法,所述方法包括如下步骤:
10.步骤s1.采集需要的数据;
11.步骤s2.计算重要财务比率指标集合和历史样本风险标签值;
12.其次,计算风险分和最大异常分;
13.最后,根据计算得出的风险分和最大异常分进行决策预警。
14.进一步,在步骤s1中,采集待预测上市企业的近三期财务年报基础数据;采集历史样本的财务年报基础数据,利用滑动窗口法,根据历史样本在观察期内三期财务年报基础数据及对应表现期内风险表现数据集合,构成历史风险样本标签值。历史样本风险标签值,我们的定义方法为:在企业近三期的经营过程中,如果出现了严重的财务问题,我们定义为异常风险样本,标签值设置为1;如果未出现财务问题,我们将它定义为正常无风险样本,标签值设为0。
15.进一步,在步骤s2中,通过步骤s1所得基础数据,计算待预测企业近三期预设的重要财务比率指标集合,计算历史样本三期预设的重要财务比率指标集合以及计算历史样本
风险标签值。
16.进一步,所述预设的重要财务比例指标包括资金流动性比率、资金收益性比率、现金流质量比率、短期偿债能力比率和/或长期偿债能力比率,其中
17.资金流动性比率具体包括流动比率、速动比率、应收账款周转率、库存周转率、存货周转率、流动资产周转率、总资产周转率、现金周转率;
18.资金收益性比率具体包括销售利润率、总资产收益率、净资产收益率;
19.现金流质量比率具体包括经营性活动现金流/总资产、经营性活动现金流入值/经营性活动现金流出值、筹资活动现金流/总负债;
20.短期偿债能力比率具体包括流动比率、速动比率、流动负债比率;
21.长期偿债能力比率具体包括产权比率、资产负债率、获息倍数。
22.进一步,计算风险分包括以下步骤:
23.步骤s3.时间序列特征衍生计算,具体为对步骤s2得到的待预测企业和历史样本的重要财务比率指标集合,自动进行时间序列特征衍生计算,得到待预测企业时间序列衍生特征向量数据,以及历史样本时间序列衍生特征向量数据;
24.步骤s4.lightgbm风险分计算,具体为将步骤s3获得的待预测企业时间序列衍生特征向量数据和历史样本时间序列衍生特征向量数据,输入预设的lightgbm模型,得到待预测企业风险概率值和历史样本风险概率值,并按照预设的风险分数转换方法计算得到待预测企业的风险分和历史样本风险分;
25.其中,预设的lightgbm模型构建过程如下:
26.首先,收集历史样本建模数据,包括步骤s2得到的历史样本风险标签值,和步骤s3得到的历史样本时间序列衍生特征向量数据;
27.其次,配置模型训练超参数,将历史样本建模数据输入lightgbm模型进行训练,得到预设lightgbm模型。
28.进一步,计算最大异常分包括以下步骤:
29.步骤s5.将步骤s2获得的待预测企业和历史样本的重要财务比率指标集合,按照不同行业和不同预测日,划分为不同群组;
30.步骤s6.计算待预测企业和历史样本的观察期内三期异常分;设定重要财务比率指标集合中包括n种比率指标,同期同行业企业共有m家;第m家企业的第i个财务比率指标为x
im
,则异常分的计算子步骤如下:
31.s601.求各个财务比率指标的行业均值:
[0032][0033]
s602.计算各企业财务比率指标和其行业均值之间的距离
[0034][0035]
s603.计算s602中距离的行业均值ai:
[0036]
[0037]
s604.计算某企业(设上标为p)财务比率指标的行业偏离度ri:
[0038][0039]
s605.计算异常分;将某企业的n个财务比率指标的行业偏离度进行从大到小排序,选择最大的5个,从大到小依次为r1,r2,r3,r4,r5,则异常分s的计算公式为:
[0040]
s=r1+0.25*(r2+r3+r4+r5);
[0041]
步骤s7.计算最大异常分;取步骤s6中待预测企业和历史样本的观察期内三期异常分中的最大值,得到最大异常分。
[0042]
进一步,在根据计算得出的风险分和最大异常分进行决策预警阶段包括步骤s8.决策预警;具体为将步骤s4获得的待预测企业和历史样本的风险分,和步骤s7获得的待预测企业和历史样本的最大异常分,画在风险分-最大异常分二维分布图上;由决策专家系统结合历史样本的风险分-最大异常分分布信息和相应的历史样本风险标签值,以及待预测企业的风险分-最大异常分的分布情况进行统筹决策,输出最终的决策预警结果。
[0043]
另一方面,本发明提出一种上市企业财务风险预警系统,包括数据采集模块、指标和风险标签构建模块、时间序列特征衍生计算模块、lightgbm模型计算模块、lightgbm模型训练模块、数据分组模块、最大异常分计算模块和决策预警模块,所述系统用于实现根据本发明所述的上市企业财务风险预警方法。
[0044]
进一步,所述数据采集模块用于采集历史样本数据;所述指标和风险标签构建模块用于专家配置重要财务比率指标及其计算方法;输入财务年报基础数据,输出重要财务比率指标集合;同时根据历史样本的风险表现数据计算其风险标签值。
[0045]
进一步,所述时间序列特征衍生计算模块用于配置时间序列特征衍生所需的算子,包括滑动窗口长度和特征衍生相关运算函数;输入重要财务比率指标集合,输出各类衍生的时间序列特征向量;
[0046]
所述lightgbm模型计算模块用于输入时间序列衍生特征,调用lightgbm模型训练模块中预设的lightgbm模型,计算得到概率值,并通过预设的分数转换方法得到风险分;
[0047]
所述lightgbm模型训练模块用于配置lightgbm模型训练的各类超参数,包括树的深度、树的颗树和学习率;利用时间序列特征衍生计算模块获得的历史样本的时间序列衍生特征向量数据,和指标和风险标签构建模块获得的历史样本风险标签值数据,进行模型离线训练,得到预设的lightgbm模型;
[0048]
所述数据分组模块,按照不同行业和不同预测日,将获得的待预测企业和历史样本的重要财务比率指标集合,划分为不同群组;
[0049]
所述最大异常分计算模块用于根据同行业企业的重要财务比率指标数据,按照预警方法的步骤s7和步骤s8,计算得到待预测企业的最大异常分;
[0050]
所述决策预警模块用于展示历史样本和待预测企业的风险分-最大异常分的二维分布图,由决策专家系统结合历史样本的风险分-最大异常分分布信息和相应的历史样本风险标签值信息进行决策,输出预警判断结果。
[0051]
本发明的有益效果有:
[0052]
大量的数据处理、计算和建模工作是自动化的,预警系统中,专家经验与自动化的
数据处理、计算和建模工作相结合,保证了预警系统运行的高效率。
[0053]
设计了定量计算企业财务比率指标异常分的详细计算方法,专家系统进行重要财务指标选择,提升了决策预警结果的业务可解释性。
[0054]
同时利用风险分和最大异常分两个维度的结果进行最终的决策预警,综合应用风险分和最大异常分二维分布进行决策的方法,相比较仅利用历史数据建立的监督模型结果,提供了防范未知风险的能力,提升了整体预警结果的准确性。
附图说明
[0055]
图1为根据本发明的上市企业财务风险预警方法和系统的优选实施例的流程图;
[0056]
图2为根据本发明的优选实施例的预设的lightgbm模型构建过程示意图;
[0057]
图3为根据本发明的优选实施例的异常分的计算步骤示意图;
[0058]
图4为根据本发明的优选实施例的系统模块结构示意图;
[0059]
图5为根据本发明的优选实施例的表现期和观察期示意图;
[0060]
图6位决策数据二维图。
具体实施方式
[0061]
下面将结合附图,对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0062]
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
[0063]
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
[0064]
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
[0065]
根据附图1-5,本发明提出一种上市企业财务风险预警方法和系统,实施流程如图1所示,其中具体方法包括如下步骤:
[0066]
步骤s1.数据采集。采集待预测上市企业的近三期财务年报基础数据;采集历史样本的财务年报基础数据,利用滑动窗口法,构建历史样本在观察期内三期财务年报基础数据及对应表现期内风险表现数据集合,构成历史风险样本标签值。观察期和表现期如图5所示,观察期包括了预测日前三期的财务年报发布日。
[0067]
历史样本风险标签值,我们的定义方法为:在企业近三期的经营过程中,如果出现
了严重的财务问题,我们定义为异常风险样本,标签值设置为1;如果未出现财务问题,我们将它定义为正常无风险样本,标签值设为0。比较严重的财务类型有以下4种情况:
[0068]
a)因为自身原因导致筹资失败,未能融到经验资金;
[0069]
b)经验出现大幅亏损,导致无法正常还本付息;
[0070]
c)资金链断裂,出现较大的经营危机;
[0071]
d)被监管机构调查出财务造假。
[0072]
例如a企业历史上有2015-2019年5年的年报数据和2018-2020年的风险表现,则可以构建如下三条历史样本观察期内财务年报基础数据及对应表现期内风险表现数据集合:(2015年报,2016年报,2017年报,无风险),(2016年报,2017年报,2018年报,无风险),(2017年报,2018年报,2019年报,无风险)。
[0073]
步骤s2.计算重要财务比率指标集合和历史样本风险标签值。通过步骤s1所得基础数据,计算待预测企业近三期预设的重要财务比率指标集合,计算历史样本三期预设的重要财务比率指标集合。计算历史样本风险标签值。
[0074]
预设的重要财务比例指标和相应的计算方法由专家根据经验进行构建,至少包括:1.资金流动性比率:流动比率、速动比率、应收账款周转率、库存周转率、存货周转率、流动资产周转率、总资产周转率、现金周转率等。2.资金收益性比率:销售利润率、总资产收益率、净资产收益率等。3.现金流质量比率:经营性活动现金流/总资产、经营性活动现金流入值/经营性活动现金流出值、筹资活动现金流/总负债4.短期偿债能力比率:流动比率、速动比率、流动负债比率5.长期偿债能力比率:产权比率、资产负债率、获息倍数等。
[0075]
步骤s3.时间序列特征衍生计算。对步骤s2得到的待预测企业和历史样本的重要财务比率指标集合,自动进行时间序列特征衍生计算,得到待预测企业时间序列衍生特征向量数据,以及历史样本时间序列衍生特征向量数据。
[0076]
时间序列特征衍生计算方法:具体是使用滑动窗口法,截取第n,n-1和n-2期连续三期年报的财务比率指标进行特征衍生运算;特征衍生运算函数包括:求和、最大值、最小值、均值、标准差、符号函数求和、第n期-第n-2期的跨期差,以及一阶差分的符号函数求和。
[0077]
步骤s4.lightgbm风险分计算。将步骤s3待预测企业时间序列衍生特征向量数据和历史样本时间序列衍生特征向量数据,输入预设的lightgbm模型,得到待预测企业风险概率值和历史样本风险概率值,并按照预设的风险分数转换方法计算得到待预测企业的风险分和历史样本风险分。
[0078]
预设的lightgbm模型构建过程,见图2:
[0079]
收集历史样本建模数据。包括步骤s2得到的历史样本风险标签值,和步骤s3历史样本时间序列衍生特征向量数据。
[0080]
配置模型训练超参数,将历史样本建模数据输入lightgbm模型进行训练,得到预设lightgbm模型。
[0081]
预设的风险分数转换方法:
[0082]
设p1为样本风险概率值,a1、b1为预设的系数值,则样本风险分score1与样本风险概率值p1的关系为:
[0083]
score1=a1-b1
×
ln(p1/(1-p1))。
[0084]
步骤s5.将步骤s2获得的待预测企业和历史样本的重要财务比率指标集合,按照
不同行业和不同预测日,划分为不同群组。
[0085]
步骤s6.计算待预测企业和历史样本的观察期内三期异常分。
[0086]
该步骤将计算某企业的某个预测日的观察期三期异常分。如图3所示,以观察期三期异常分中的某一期计算过程为例,假设重要财务比率指标集合中包括n种比率指标,假设同期同行业企业共有m家。第m家企业的第i个财务比率指标为xim,则异常分的计算步骤如图3所示,各步骤如下:
[0087]
s601.求各个财务比率指标的行业均值:
[0088][0089]
s602.计算各企业财务比率指标和其行业均值之间的距离
[0090][0091]
s603.计算s602中距离的行业均值ai:
[0092][0093]
s604.计算某企业(设上标为p)财务比率指标的行业偏离度ri:
[0094][0095]
s605.计算异常分。将某企业的n个财务比率指标的行业偏离度进行从大到小排序,选择最大的5个,不妨假设从大到小依次为r1,r2,r3,r4,r5,则异常分s的计算公式为:
[0096]
s=r1+0.25*(r2+r3+r4+r5)
[0097]
步骤s7.计算最大异常分。取步骤s6中待预测企业和历史样本的观察期内三期异常分中的最大值,得到最大异常分。
[0098]
步骤s8.决策预警。将步骤s4待预测企业和历史样本的风险分,和步骤s7待预测企业和历史样本的最大异常分,画在风险分-最大异常分二维分布图上。由决策专家结合历史样本的风险分-最大异常分分布信息和相应的历史样本风险标签值,以及待预测企业的风险分-最大异常分的分布情况进行统筹决策,输出最终的决策预警结果。
[0099]
对应于上述上市企业财务风险预警方法,本发明还提出一种上市企业财务风险预警系统,图4是其模块结构示意图,包括数据采集模块1、指标和风险标签构建模块2、时间序列特征衍生计算模块3、lightgbm模型计算模块4、lightgbm模型训练模块5、数据分组模块6、最大异常分计算模块7、决策预警模块8。
[0100]
其中,所述数据采集模块1用于采集历史样本数据。
[0101]
所述指标和风险标签构建模块2用于专家配置重要财务比率指标及其计算方法。输入财务年报基础数据,输出重要财务比率指标集合。同时根据历史样本的风险表现数据计算其风险标签值。
[0102]
所述时间序列特征衍生计算模块3用于配置时间序列特征衍生所需的算子,包括滑动窗口长度、特征衍生相关运算函数等。输入重要财务比率指标集合,输出各类衍生的时间序列特征向量。
[0103]
所述lightgbm模型计算模块4用于输入时间序列衍生特征,调用lightgbm模型训练模块中预设的lightgbm模型,计算得到概率值,并通过预设的分数转换方法得到风险分。
[0104]
所述lightgbm模型训练模块5用于配置lightgbm模型训练的各类超参数,包括树的深度、树的颗树、学习率等等。利用时间序列特征衍生计算模块3获得的历史样本的时间序列衍生特征向量数据,和指标和风险标签构建模块2获得的历史样本风险标签值数据,进行模型离线训练,得到预设的lightgbm模型。
[0105]
所述数据分组模块6,按照不同行业和不同预测日,将获得的待预测企业和历史样本的重要财务比率指标集合,划分为不同群组。
[0106]
所述最大异常分计算模块7用于根据同行业企业的重要财务比率指标数据,按照预警方法的步骤s7和步骤s8,计算得到待预测企业的最大异常分。
[0107]
所述决策预警模块8展示历史样本和待预测企业的风险分-最大异常分的二维分布图,由决策专家结合历史样本的风险分-最大异常分分布信息和相应的历史样本风险标签值信息进行决策,输出预警判断结果。
[0108]
在本发明的预警系统中,专家经验与自动化的数据处理、计算和建模工作相结合,同时利用风险分和最大异常分两个维度的结果进行最终的决策预警,设计了定量计算企业财务比率指标异常分的详细计算方法;使得大量的数据处理、计算和建模工作是自动化的,保证了预警系统运行的高效率;专家进行重要财务指标选择,提升了决策预警结果的业务可解释性;综合应用风险分和最大异常分二维分布进行决策的方法,相比较仅利用历史数据建立的监督模型结果,提供了防范未知风险的能力,提升了整体预警结果的准确性。
[0109]
本发明中,利用lightgbm算法,用来解决监督学习问题:给定由历史数据组成的数据集(包括数据特征(x)和预先定义的标签(y)),通过lightgbm算法进行训练,可以得到一个预测模型。在利用lightgbm模型进行预测时,输入数据是待预测样本的特征(x),输出是待预测样本标签的概率值。lightgbm模块,其产品代码通常会集成lightgbm核心代码。
[0110]
模型训练模型和模型计算模型:通常是两个模块:首先利用历史数据(x和y),通过模型训练模块得到lightgbm模型;然后将这个模型部署到模型计算模块中,那么待预测的样本数据以后只要经过模型计算模块,就可以通过计算得到相应的预测概率值。训练好的lightgbm模型根据需要,也可以实时或者定期进行更新迭代,保持良好的预测性能。
[0111]
滑动窗口法:是一种通用的构建时间序列样本的方法。在本发明中,利用的是过去三期年报的财务数据,来预测下个年报发布日前是否会发生风险。因此观察期是固定的三期报告时间窗口,表现期是从预测日到下次年报发布的时间窗口,数据样本的形式就是(年报3,年报2,年报1,是否发生风险)。当企业有长期的公开年报数据时,通过在时间轴上滑动窗口,可以构建连续的多条数据样本,例如a企业历史上有2015-2019年5年的年报数据和2018-2020年的风险表现,则可以通过滑动观察期和表现期的窗口构建三条历史样本数据:(2015年报,2016年报,2017年报,无风险),(2016年报,2017年报,2018年报,无风险),(2017年报,2018年报,2019年报,无风险)。
[0112]
决策专家系统:这是一种由专家进行决策的系统,在本发明中,最终判断企业是否有风险,是需要专家根据决策系统展示的数据信息,结合数据和专家自身的经验进行综合判断。本发明申请中,决策专家系统展示的数据信息包括两大类:1.历史样本风险分、最大异常分、风险标签(历史上是否发生了风险);2.待预测样本的风险分、最大异常分。如图6所
示,二维图上可以展示上述所有信息:一个样本是一个点,点的横坐标是风险分,纵坐标是最大异常分,点1表示该历史样本是发生风险的,点2表示待预测样本,其他点表示该历史样本未发生风险,点2即要由决策专家进行判断是否将发生风险。判断的具体形式可以是人工判断、根据经验设定规则判断、在二维图上设置决策曲线判断等。判断后决策结果将发送至相应系统。
[0113]
显然,本领域的技术人员应该明白,上述的本发明实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
技术特征:
1.一种上市企业财务风险预警方法,其特征在于,所述方法包括如下步骤:步骤s1.采集需要的数据;步骤s2.计算重要财务比率指标集合和历史样本风险标签值;其次,计算风险分和最大异常分;最后,根据计算得出的风险分和最大异常分进行决策预警。2.根据权利要求1所述的上市企业财务风险预警方法,其特征在于,在步骤s1中,采集待预测上市企业的近三期财务年报基础数据;采集历史样本的财务年报基础数据,利用滑动窗口法,根据历史样本在观察期内三期财务年报基础数据及对应表现期内风险表现数据集合,构成历史风险样本标签值;历史样本风险标签值,定义方法为:在企业近三期的经营过程中,如果出现了严重的财务问题,定义为异常风险样本,标签值设置为1;如果未出现财务问题,定义为正常无风险样本,标签值设为0。3.根据权利要求2所述的上市企业财务风险预警方法,其特征在于,在步骤s2中,通过步骤s1所得基础数据,计算待预测企业近三期预设的重要财务比率指标集合,计算历史样本三期预设的重要财务比率指标集合以及计算历史样本风险标签值。4.根据权利要求3所述的上市企业财务风险预警方法,其特征在于,所述预设的重要财务比例指标包括资金流动性比率、资金收益性比率、现金流质量比率,以及短期偿债能力比率和/或长期偿债能力比率,其中资金流动性比率具体包括流动比率、速动比率、应收账款周转率、库存周转率、存货周转率、流动资产周转率、总资产周转率、现金周转率;资金收益性比率具体包括销售利润率、总资产收益率、净资产收益率;现金流质量比率具体包括经营性活动现金流/总资产、经营性活动现金流入值/经营性活动现金流出值、筹资活动现金流/总负债;短期偿债能力比率具体包括流动比率、速动比率、流动负债比率;长期偿债能力比率具体包括产权比率、资产负债率、获息倍数。5.根据权利要求3或4所述的上市企业财务风险预警方法,其特征在于,计算风险分包括以下步骤:步骤s3.时间序列特征衍生计算,具体为对步骤s2得到的待预测企业和历史样本的重要财务比率指标集合,自动进行时间序列特征衍生计算,得到待预测企业时间序列衍生特征向量数据,以及历史样本时间序列衍生特征向量数据;步骤s4.lightgbm风险分计算,具体为将步骤s3获得的待预测企业时间序列衍生特征向量数据和历史样本时间序列衍生特征向量数据,输入预设的lightgbm模型,得到待预测企业风险概率值和历史样本风险概率值,并按照预设的风险分数转换方法计算得到待预测企业的风险分和历史样本风险分;其中,预设的lightgbm模型构建过程如下:首先,收集历史样本建模数据,包括步骤s2得到的历史样本风险标签值,和步骤s3得到的历史样本时间序列衍生特征向量数据;其次,配置模型训练超参数,将历史样本建模数据输入lightgbm模型进行训练,得到预设lightgbm模型。6.根据权利要求5所述的上市企业财务风险预警方法,其特征在于,计算最大异常分包
括以下步骤:步骤s5.将步骤s2获得的待预测企业和历史样本的重要财务比率指标集合,按照不同行业和不同预测日,划分为不同群组;步骤s6.计算待预测企业和历史样本的观察期内三期异常分;设定重要财务比率指标集合中包括n种比率指标,同期同行业企业共有m家;第m家企业的第i个财务比率指标为x
im
,则异常分的计算子步骤如下:s601.求各个财务比率指标的行业均值:s602.计算各企业财务比率指标和其行业均值之间的距离s602.计算各企业财务比率指标和其行业均值之间的距离s603.计算s602中距离的行业均值a
i
:s604.计算某企业财务比率指标的行业偏离度r
i
,设上标为p:s605.计算异常分;将某企业的n个财务比率指标的行业偏离度进行从大到小排序,选择最大的5个,从大到小依次为r1,r2,r3,r4,r5,则异常分s的计算公式为:s=r1+0.25*(r2+r3+r4+r5);步骤s7.计算最大异常分;取步骤s6中待预测企业和历史样本的观察期内三期异常分中的最大值,得到最大异常分。7.根据权利要求6所述的上市企业财务风险预警方法,其特征在于,在根据计算得出的风险分和最大异常分进行决策预警阶段包括步骤s8.决策预警;具体为将步骤s4获得的待预测企业和历史样本的风险分,和步骤s7获得的待预测企业和历史样本的最大异常分,画在风险分-最大异常分二维分布图上;由决策专家系统结合历史样本的风险分-最大异常分分布信息和相应的历史样本风险标签值,以及待预测企业的风险分-最大异常分的分布情况进行统筹决策,输出最终的决策预警结果。8.一种上市企业财务风险预警系统,其特征在于,包括数据采集模块、指标和风险标签构建模块、时间序列特征衍生计算模块、lightgbm模型计算模块、lightgbm模型训练模块、数据分组模块、最大异常分计算模块和决策预警模块,所述系统用于实现根据权利要求1-7任一项所述的上市企业财务风险预警方法。9.根据权利要求8所述的上市企业财务风险预警系统,其特征在于,所述数据采集模块用于采集历史样本数据;所述指标和风险标签构建模块用于专家配置重要财务比率指标及其计算方法;输入财务年报基础数据,输出重要财务比率指标集合;同时根据历史样本的风险表现数据计算其风险标签值。10.根据权利要求9所述的上市企业财务风险预警系统,其特征在于,
所述时间序列特征衍生计算模块用于配置时间序列特征衍生所需的算子,包括滑动窗口长度和特征衍生相关运算函数;输入重要财务比率指标集合,输出各类衍生的时间序列特征向量;所述lightgbm模型计算模块用于输入时间序列衍生特征,调用lightgbm模型训练模块中预设的lightgbm模型,计算得到概率值,并通过预设的分数转换方法得到风险分;所述lightgbm模型训练模块用于配置lightgbm模型训练的各类超参数,包括树的深度、树的颗树和学习率;利用时间序列特征衍生计算模块获得的历史样本的时间序列衍生特征向量数据,和指标和风险标签构建模块获得的历史样本风险标签值数据,进行模型离线训练,得到预设的lightgbm模型;所述数据分组模块,按照不同行业和不同预测日,将获得的待预测企业和历史样本的重要财务比率指标集合,划分为不同群组;所述最大异常分计算模块用于根据同行业企业的重要财务比率指标数据,按照预警方法的步骤s7和步骤s8,计算得到待预测企业的最大异常分;所述决策预警模块用于展示历史样本和待预测企业的风险分-最大异常分的二维分布图,由决策专家系统结合历史样本的风险分-最大异常分分布信息和相应的历史样本风险标签值信息进行决策,输出预警判断结果。
技术总结
本发明公开了一种上市企业财务风险预警方法和系统,所述方法包括如下步骤:采集需要的数据;计算重要财务比率指标集合和历史样本风险标签值;计算风险分和最大异常分;根据计算得出的风险分和最大异常分进行决策预警。所述系统包括数据采集模块、指标和风险标签构建模块、时间序列特征衍生计算模块、LightGBM模型计算模块、LightGBM模型训练模块、数据分组模块、最大异常分计算模块和决策预警模块,根据本发明的技术方案能够综合应用风险分和最大异常分二维分布进行决策的方法,提供了防范未知风险的能力,提升整体预警结果的准确性。提升整体预警结果的准确性。提升整体预警结果的准确性。
技术研发人员:史博 管胜 陈树华
受保护的技术使用者:北京顶象技术有限公司
技术研发日:2021.12.02
技术公布日:2022/3/8