1.本发明涉及岩土工程勘察技术领域,具体涉及一种基于机器学习算法的地基承载力特征值预测方法。
技术背景
2.地基承载力是指在保证地基稳定和建筑物不产生过大沉降的条件下地基的承载能力,地基承载力特征值是选择地基持力层的最重要标准,合理的地基承载力特征值可以节省造价、方便施工,具有重要的工程意义。
3.现场原位压板试验被认为是确定地基承载力最可靠的方法,但压板试验的尺寸效应对地基承载力影响较大。《建筑地基基础设计规范》中确定地基承载力的方法之一是根据土的抗剪强度指标,存在取样扰动的影响难以确保土体抗剪强度指标的合理性,具有一定的离散性和经验性。目前还可以根据杆长修正后的标贯击数、动探击数和静探指标,采用经验公式计算和经验值查表的方法确定地区的地基承载力,只能作为一种辅助手段。
技术实现要素:
4.针对现有技术中存在的问题,本发明提供了一种基于机器学习算法的地基承载力特征值预测方法,能够快速且准确地实现地基承载力特征值的预测。
5.为实现上述技术目的,本发明的技术方案是:一种基于机器学习算法的地基承载力特征值预测方法,具体包括以下步骤:
6.步骤1:获取某地若干地基土的物理力学参数信息组,每组物理力学参数信息包括:地基承载力特征值fa、含水率、比重、湿密度、干密度、孔隙比、饱和度、液限、塑限、塑性指数、液性指数、压缩系数、压缩模量、粘聚力和内摩擦角;
7.步骤2:基于spss软件的多元回归分析功能对地基土的每组物理力学参数信息进行相关性分析,将共线性统计的容差小于0.05的参数作为与地基承载力特征值相关的物理力学参数并建立数据库;
8.步骤3:基于不同的机器学习算法分别建立地基承载力特征值的回归模型,将数据库中的物理力学参数作为输入,并给出每个回归模型的超参数,以获取的地基承载力特征值fa作为标签,预测的地基承载力特征值作为输出,训练回归模型,直至回归模型的迭代次数大于1万次或预测的准确率达到99.9%以上,依据损失函数均方误差mse分别计算训练完毕的地基承载力特征值回归模型的决定系数r2,将决定系数r2最高的训练完毕的回归模型作为最佳的地基承载力特征值回归模型;
9.步骤4:获取该地的地基土物理力学参数信息,输入到最佳的地基承载力特征值回归模型中,预测出该地基土的地基承载力特征值。
10.进一步地,步骤1中所述物理力学参数信息组存储格式为csv utf-8。
11.进一步地,步骤2中与地基承载力特征值相关的物理力学参数为:含水率、湿密度、干密度、孔隙比、液限、粘聚力和内摩擦角。
12.进一步地,步骤3中所述机器学习算法包括:指数多项式回归算法、支持向量机算法、随机森林算法和前馈神经网络算法。
13.进一步地,所述指数多项式回归算法的超参数为转换项的数量,指数多项式回归算法用于预测地基承载力特征值的过程为:
[0014][0015]
其中,xt表示与地基承载力特征值相关的物理力学参数组合成新的变换变量,e表示指数矩阵,c表示与地基承载力特征值相关的物理力学参数的数量。
[0016]
进一步地,所述支持向量机算法的超参数为核系数c值和正则化参数γ值,支持向量机算法用于预测地基承载力特征值的过程为:
[0017][0018]
其中,ω表示与地基承载力特征值相关的物理力学参数的权向量,x表示相关的物理力学参数,b表示偏置量。
[0019]
进一步地,所述随机森林算法的超参数为决策树的数量和特征数的数量,随机森林算法用于预测地基承载力特征值的过程为:
[0020][0021]
其中,xi为地基承载力特征值相关的物理力学参数,d1、d2分别为随机森林算法随机选择的两组与地基承载力特征值相关的物理力学参数的数据集,c1为d1的样本输出均值,c2为d2的样本输出均值。
[0022]
进一步地,所述前馈神经网络算法的超参数为隐藏层的层数和隐藏神经元的个数,前馈神经网络算法用于预测地基承载力特征值的过程为:
[0023][0024]
其中,l为总层数;n
l
为第l层节点数;为第l-1层第j个节点到第l层第i个节点的连接权值;为第l层第j个节点的输出值;为第l层第i个节点的阈值。
[0025]
进一步地,所述损失函数均方误差mse的函数表达式为:
[0026][0027]
其中,n表示地基承载力特征值回归模型输入的物理力学参数的组数,i为n的索引。10.根据权利要求1所述的地基承载力特征值预测方法,其特征在于,所述决定系数r2的函数表达式为:
[0028][0029]
其中,rss为回归平方和,表示机器学习算法中预测的地基承载力特征值的差异
程度,tss为总离差平方和,表示机器学习算法中地基承载力特征值fa的差异程度。
[0030]
与现有技术相比,本发明具有如下有益效果:
[0031]
(1)本发明基于spss软件的多元回归分析功能,选取与地基承载力特征值相关的物理力学参数,建立数据库作为机器学习回归模型的输入,简化了地基承载力特征值回归模型的训练过程,同时也避免大量的土工试验。
[0032]
(2)本发明基于4种不同的机器学习算法构建地基承载力特征值回归模型,通过比较4种机器学习算法的决定系数r2,将决定系数r2最高的训练完毕的回归模型作为最佳的地基承载力特征值回归模型,提高了地基承载力特征值的预测准确性,具有广泛的适用性。
附图说明
[0033]
图1为本发明基于机器学习算法的地基承载力特征值预测方法的流程图;
[0034]
图2为实施例中基于4种不同的机器学习算法分别构建地基承载力特征值回归模型的决定系数r2;
[0035]
图3为实施例中基于训练完毕的前馈神经网络算法回归模型对地基承载力特征值的预测值和实际值对比图。
具体实施方式
[0036]
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本发明进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
[0037]
如图1为本发明基于机器学习算法的地基承载力特征值预测方法的流程图,该地基承载力特征值预测方法具体包括以下步骤:
[0038]
步骤1:通过查阅大量的岩土工程勘查报告,获取某地若干地基土的物理力学参数信息组,将物理学参数信息组存储格式为csv utf-8。本发明中每组物理力学参数信息包括:地基承载力特征值fa、含水率、比重、湿密度、干密度、孔隙比、饱和度、液限、塑限、塑性指数、液性指数、压缩系数、压缩模量、粘聚力和内摩擦角。
[0039]
步骤2:步骤1中获取的物理力学参数信息较多,为了简化后续地基承载力特征值回归模型的训练过程,同时也避免大量的土工试验,需要将那些对于地基承载力特征值影响不大的参数舍去,提高地基承载力特征值回归模型的精度,本发明中基于spss软件的多元回归分析功能对地基土的每组物理力学参数信息进行相关性分析,共线性统计中参数的容差小于0.05则认为该参数对地基承载力特征值具有显著相关性,将其作为与地基承载力特征值相关的物理力学参数并建立数据库;通过该方法选出的相关的物理力学参数为:含水率、湿密度、干密度、孔隙比、液限、粘聚力和内摩擦角。
[0040]
步骤3:基于不同的机器学习算法分别建立地基承载力特征值的回归模型,将数据库中的物理力学参数作为输入,并给出每个回归模型的超参数,以获取的地基承载力特征值fa作为标签,预测的地基承载力特征值作为输出,训练回归模型,超参数的初始设置为一个范围,在计算过程中机器学习算法通过不断调节该范围内的超参数组合来获得最佳的地基承载力特征值的回归模型,直至每个地基承载力特征值回归模型的迭代次数大于1万次或地基承载力特征值预测准确率达到99.9%以上,依据损失函数均方误差mse分别计算
训练好的地基承载力特征值回归模型的决定系数r2,将决定系数r2最高的训练好的回归模型作为最佳的地基承载力特征值回归模型;本发明中损失函数均方误差mse的函数表达式为:
[0041][0042]
其中,n表示地基承载力特征值回归模型输入的物理力学参数的组数,i为n的索引。
[0043]
均方误差损失函数mse越接近0,说明地基承载力特征值回归模型的错误预测的概率越小,该模型的拟合效果越好。决定系数r2表示为回归值与实际值拟合程度的度量,决定系数r2越接近1,说明地基承载力特征值回归模型的拟合效果越好,决定系数r2的函数表达式为:
[0044][0045]
其中,rss为回归平方和,表示机器学习算法中预测的地基承载力特征值的差异程度,tss为总离差平方和,表示机器学习算法中地基承载力特征值fa的差异程度。
[0046]
本发明中采用的机器学习算法包括:指数多项式回归算法、支持向量机算法、随机森林算法和前馈神经网络算法;
[0047]
指数多项式回归算法的超参数为转换项的数量,指数多项式回归算法用于预测地基承载力特征值的过程为:
[0048][0049]
其中,xt表示与地基承载力特征值相关的物理力学参数组合成新的变换变量,e表示指数矩阵,c表示与地基承载力特征值相关的物理力学参数的数量。
[0050]
支持向量机算法的超参数为核系数c值和正则化参数γ值,支持向量机算法用于预测地基承载力特征值的过程为:
[0051][0052]
其中,ω表示与地基承载力特征值相关的物理力学参数的权向量,x表示相关的物理力学参数,b表示偏置量。
[0053]
随机森林算法的超参数为决策树的数量和特征数的数量,随机森林算法用于预测地基承载力特征值的过程为:
[0054][0055]
其中,xi为地基承载力特征值相关的物理力学参数,d1、d2分别为随机森林算法随机选择的两组与地基承载力特征值相关的物理力学参数的数据集,c1为d1的样本输出均值,c2为d2的样本输出均值。
[0056]
前馈神经网络算法的超参数为隐藏层的层数和隐藏神经元的个数,前馈神经网络
算法用于预测地基承载力特征值的过程为:
[0057][0058]
其中,l为总层数;n
l
为第l层节点数;为第l-1层第j个节点到第l层第i个节点的连接权值;为第l层第j个节点的输出值;为第l层第i个节点的阈值。
[0059]
本发明地基承载力特征值预测方法采用4种不同的机器学习算法构建地基承载力特征值回归模型,通过比较不同地基承载力特征值回归模型的决定系数r2,将决定系数r2最高的训练好的回归模型作为最佳的地基承载力特征值回归模型,可根据该地区的物理力学参数特性,针对性的选择合适的地基承载力特征值回归模型,提高了地基承载力特征值预测的准确性,该地基承载力特征值预测方法适用范围广。
[0060]
步骤4:获取该地的地基土物理力学参数信息,输入到最佳的地基承载力特征值回归模型中,输出该地基土的地基承载力特征值的预测值。
[0061]
实施例
[0062]
本实施例以南京地区的岩土体为例,
[0063]
(1)获取地基土的物理力学参数信息组,每组物理力学参数信息包括:地基承载力特征值fa、含水率、比重、湿密度、干密度、孔隙比、饱和度、液限、塑限、塑性指数、液性指数、压缩系数、压缩模量、粘聚力和内摩擦角,将物理力学参数信息组存储格式为csv utf-8;
[0064]
(2)基于spss软件的多元回归分析功能对地基土的物理力学参数信息进行相关性分析,共线性统计中参数的容差小于0.05则认为该参数对地基承载力特征值具有显著相关性,选取出与地基承载力特征值相关的物理力学参数并建立数据库,选取的物理力学参数为:含水率、湿密度、干密度、孔隙比、液限、粘聚力和内摩擦角;
[0065]
(3)基于指数多项式回归算法、支持向量机算法、随机森林算法和前馈神经网络算法分别建立地基承载力特征值的回归模型,将数据库中的物理力学参数作为输入,以获取的地基承载力特征值fa作为标签,预测的地基承载力特征值作为输出,训练地基承载力特征值的回归模型,直至回归模型的迭代次数大于1万次或预测的准确率达到99.9%以上,依据损失函数均方误差mse分别计算训练完毕的地基承载力特征值回归模型的决定系数r2,将决定系数r2最高的训练完毕的回归模型作为最佳的地基承载力特征值回归模型。如图2所示,该实施例中基于前馈神经网络算法构建的地基承载力特征值回归模型的决定系数r2最高,训练集的决定系数r2为1.000,测试集的决定系数r2为0.998,因此采用训练完毕的前馈神经网络算法回归模型作为最佳地基承载力特征值回归模型;
[0066]
(4)获取南京地区新的地基土物理力学参数信息,输入到训练完毕的前馈神经网络算法回归模型中,预测出该地基土的地基承载力特征值。图3表明,基于前馈神经网络的地基承载力特征值回归模型的预测值与实际值吻合度极高,该预测模型的最小预测误差仅为0.2%,最大预测误差为10.3%,能很好地应用于地基承载力特征值fa的预测。
[0067]
基于机器学习算法的地基承载力特征值预测系统不再那么复杂,只需通过室内试验获取土样的基本物理力学参数,即可快速且准确地获取地基承载力特征值,具有广泛的适用性。
[0068]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管
参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
技术特征:
1.一种基于机器学习算法的地基承载力特征值预测方法,其特征在于,具体包括以下步骤:步骤1:获取某地若干地基土的物理力学参数信息组,每组物理力学参数信息包括:地基承载力特征值f
a
、含水率、比重、湿密度、干密度、孔隙比、饱和度、液限、塑限、塑性指数、液性指数、压缩系数、压缩模量、粘聚力和内摩擦角;步骤2:基于spss软件的多元回归分析功能对地基土的每组物理力学参数信息进行相关性分析,将共线性统计的容差小于0.05的参数作为与地基承载力特征值相关的物理力学参数并建立数据库;步骤3:基于不同的机器学习算法分别建立地基承载力特征值的回归模型,将数据库中的物理力学参数作为输入,并给出每个回归模型的超参数,以获取的地基承载力特征值f
a
作为标签,预测的地基承载力特征值作为输出,训练回归模型,直至回归模型的迭代次数大于1万次或预测的准确率达到99.9%以上,依据损失函数均方误差mse分别计算训练完毕的地基承载力特征值回归模型的决定系数r2,将决定系数r2最高的训练完毕的回归模型作为最佳的地基承载力特征值回归模型;步骤4:获取该地的地基土物理力学参数信息,输入到最佳的地基承载力特征值回归模型中,预测出该地基土的地基承载力特征值。2.根据权利要求1所述基于机器学习算法的地基承载力特征值预测方法,其特征在于,步骤1中所述物理力学参数信息组存储格式为csv utf-8。3.根据权利要求1所述基于机器学习算法的地基承载力特征值预测方法,其特征在于,步骤2中与地基承载力特征值相关的物理力学参数为:含水率、湿密度、干密度、孔隙比、液限、粘聚力和内摩擦角。4.根据权利要求1所述基于机器学习算法的地基承载力特征值预测方法,其特征在于,步骤3中所述机器学习算法包括:指数多项式回归算法、支持向量机算法、随机森林算法和前馈神经网络算法。5.根据权利要求4所述基于机器学习算法的地基承载力特征值预测方法,其特征在于,所述指数多项式回归算法的超参数为转换项的数量,指数多项式回归算法用于预测地基承载力特征值的过程为:其中,xt表示与地基承载力特征值相关的物理力学参数组合成新的变换变量,e表示指数矩阵,c表示与地基承载力特征值相关的物理力学参数的数量。6.根据权利要求4所述基于机器学习算法的地基承载力特征值预测方法,其特征在于,所述支持向量机算法的超参数为核系数c值和正则化参数γ值,支持向量机算法用于预测地基承载力特征值的过程为:其中,ω表示与地基承载力特征值相关的物理力学参数的权向量,x表示相关的物理力学参数,b表示偏置量。7.根据权利要求4所述基于机器学习算法的地基承载力特征值预测方法,其特征在于,
所述随机森林算法的超参数为决策树的数量和特征数的数量,随机森林算法用于预测地基承载力特征值的过程为:其中,x
i
为地基承载力特征值相关的物理力学参数,d1、d2分别为随机森林算法随机选择的两组与地基承载力特征值相关的物理力学参数的数据集,c1为d1的样本输出均值,c2为d2的样本输出均值。8.根据权利要求4所述基于机器学习算法的地基承载力特征值预测方法,其特征在于,所述前馈神经网络算法的超参数为隐藏层的层数和隐藏神经元的个数,前馈神经网络算法用于预测地基承载力特征值的过程为:其中,l为总层数;n
l
为第l层节点数;为第l-1层第j个节点到第l层第i个节点的连接权值;为第l层第j个节点的输出值;为第l层第i个节点的阈值。9.根据权利要求1所述基于机器学习算法的地基承载力特征值预测方法,其特征在于,所述损失函数均方误差mse的函数表达式为:其中,n表示地基承载力特征值回归模型输入的物理力学参数的组数,i为n的索引。10.根据权利要求1所述的地基承载力特征值预测方法,其特征在于,所述决定系数r2的函数表达式为:其中,rss为回归平方和,表示机器学习算法中预测的地基承载力特征值的差异程度,tss为总离差平方和,表示机器学习算法中地基承载力特征值f
a
的差异程度。
技术总结
本发明公开了一种基于机器学习算法的地基承载力特征值预测方法,该方法首先基于SPSS软件的多元回归分析功能创建了与地基承载力特征值相关的物理力学参数的数据库;然后基于不同的机器学习算法分别建立了地基承载力特征值的回归模型,通过比较不同机器学习算法回归模型的决定系数R2并选择最佳的回归模型;最后将新的参数信息输入到最佳的机器学习算法回归模型,可以快速、准确地获取地基承载力特征值。与现有的地基承载力特征值获取手段(原位测试、理论公式计算和经验法)相比,基于机器学习算法的计算系统不再那么复杂,只需通过室内试验获取土样的基本物理力学参数,具有广泛的适用性。的适用性。的适用性。
技术研发人员:刘昂 华宇 林文丽 张迁 张尔康 何家兴 丁志涛
受保护的技术使用者:南京工业大学
技术研发日:2021.12.06
技术公布日:2022/3/8