一种基于Apriori的海洋环境噪声与水文气象关联关系挖掘方法与流程

专利查询1月前  29


一种基于apriori的海洋环境噪声与水文气象关联关系挖掘方法
技术领域
1.本发明属于海洋环境噪声与水文气象的数据挖掘领域,涉及到一种基于apriori的海洋环境噪声与风速、温度等水文气象关联关系挖掘的方法,能直接应用于海洋环境噪声污染控制。


背景技术:

2.海洋环境噪声污染危害巨大且难以治理,愈来愈受到各国家和组织的重视。其影响因素主要包括行船、风、降雨、水文、海洋生物等。这些因素是不同频段海洋环境噪声的主要来源,噪声源的时空分布差异造成了环境噪声级的迥然不同。海洋环境噪声污染由于看不见摸不着长期以来被人们忽略,但其对海洋生物活动以及人类水下声通讯有着及其严重的影响。因此,有必要针对典型海域系统性开展海洋环境噪声与风速、温度等水文气象关联关系挖掘方法研究,为海洋环境噪声污染控制提供支撑。
3.以往对海洋环境噪声与水文气象关联关系的研究多通过不同水文气象要素(例如风、水温等)对海洋环境噪声影响机理研究的基础上结合实测数据利用常规统计、相关分析等方法,获得水文气象对海洋环境噪声的影响频段及影响范围。这种方法需有较强的领域知识,其次在研究某单一水文气象要素对海洋环境噪声的影响时不易剔除其它因素的影响,另外常规统计、相关分析等方法只能给出水文气象要素影响特定频段海洋环境噪声谱级的粗略范围,影响了海洋环境噪声谱级预测的准确性。
4.数据挖掘是从海量的、随机的、不确定的数据中提取隐藏在其中的潜在有价值知识的一种技术,其中关联规则挖掘是数据挖掘的一个主要内容,关联规则挖掘的目的是发现数据项之间的关联关系。apriori算法是关联规则挖掘中经典的算法,其基本思想是使用逐层迭代搜索的方法,根据用户设置的最小支持度来发现频繁集,然后由频繁集生成关联规则。apriori算法思路较简单,易于实现,能够很好的用于发现隐藏在大量海洋环境数据中的知识。
5.怎样基于apriori算法对海洋环境噪声与水文气象关联关系进行挖掘,是本发明要解决的核心问题。本发明利用获取的大量海洋环境噪声和水文气象数据,基于apriori算法找出支持度大于用户设置的最小支持度的频繁项集,然后从频繁项集中发现置信度大于用户设置的最小置信度的关联规则,最后挖掘出海洋环境噪声与水文气象要素间的关联关系。


技术实现要素:

6.本发明的目的是基于apriori的海洋环境噪声与水文气象关联关系挖掘方法,挖掘出影响海洋环境噪声谱级变化的关联关系,以解决上述背景技术中提出的问题。
7.本发明的技术方案是:
8.1.连续获取大量的海洋环境噪声数据,并同步获取风速、温度等水文气象数据,将
采集到的海洋环境噪声时域信号按照一定的时间规则截为多段,对预处理后的海洋环境噪声信号进行fft分析,频率分辨率为1hz,通过计算得到海洋环境噪声谱级。
9.2.利用模糊c均值聚类方法对海洋环境噪声谱级、风速以及温度数据进行分级化表征,即将数据划分成若干区间,落于某个区间的数据统一以一个特定的符号来代替,例如风速在0.1-3.3m/s之间,将其分成3个区间,分别用fs_1(风速_低)、fs_2(风速_中)、fs_3(风速_高)表示这3个区间。然后根据海洋环境数据的分级化表征结果得到海洋环境事务集合t(海洋环境数据库中的任一条记录我们称为事务)。
10.3.对由步骤2得到的海洋环境事务集t进行映射,映射的方法是看每条海洋环境事务项中是否包含项集中的元素,如果包含对应的元素,则标记为1,否则为0,这样就可以得到由所有海洋环境数据项组成的0-1矩阵。
11.4.基于apriori算法对由步骤3得到的海洋环境数据的0-1矩阵进行关联关系挖掘,挖掘出海洋环境噪声与水文气象的关联规则。
12.5.根据用户设置的最小支持度与最小置信度阈值对得到的关联规则进行筛选和分析,发现海洋环境噪声与水文气象间的强关联关系。
13.本发明的效果和益处是:本发明利用连续观测的海洋环境数据,通过apriori算法对海洋环境噪声与水文气象进行关联关系挖掘,能够根据特定目的挖掘出某个水文气象要素对海洋环境噪声谱级变化的影响,并且给出水文气象要素影响特定频段海洋环境噪声谱级的置信度,提高了海洋环境噪声谱级预测的准确性。
附图说明
14.图1为海洋环境噪声与水文气象关联关系的流程图。
15.图2发现海洋环境事务集中的频繁项集示意图。
具体实施方式
16.下面结合技术方案和附图1详细叙述本发明的具体实施方式。
17.1.连续获取大量的海洋环境噪声信号并同步获取风速、温度等水文气象数据,对海洋环境噪声信号进行预处理,剔除存在明显干扰的噪声信号。然后,将预处理后的海洋环境噪声时域信号按照一定的时间规则截为多段,对每段数据进行加窗滑动fft处理,通过计算得到海洋环境噪声功率谱,作为该时间段的海洋环境噪声谱级。设第1段数据在ti时刻的海洋环境噪声信号p
l
(ti),对p
l
(ti)做傅立叶变换,公式为
18.p
lk
=p
l
(fk)=fft(p
l
(ti))
ꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
19.其中fk=kfs/n,k=1,2,

,n,fs为采样频率,每段的n为数据点数。
20.2.利用海洋环境噪声谱级、风速及温度数据集,使用模糊c均值聚类方法分别对它们进行分级化表征,具体做法是将数据划分成3个区间,落于某个区间的数据统一以一个特定的符号来代替,则海洋环境噪声谱级被描述成pinpu_1(频谱_低)、pinpu_2(频谱_中)、pinpu_3(频谱_高)三个等级,风速被描述为fs_1(风速_低)、fs_2(风速_中)、fs_3(风速_高)三个等级,温度被描述成wendu_1(温度_低)、wendu_2(温度_中)、wendu_3(温度_高)三个等级,最大风速被描述成zdfs_1(最大风速_低)、zdfs_2(最大风速_中)、zdfs_3(最大风速_高)三个等级。根据海洋环境数据的分级化表征结果得到海洋环境数据库中的事务列表
(海洋环境数据库中的任一条记录我们称为事务),如表1所示,每条事务用t代表。
21.表1 海洋环境事务集列表示
22.事务序号海洋环境事务项列表t1fs_1,zdfs_2,fx_1,wendu_1,pinpu_1t2fs_1,zdfs_1,fx_1,wendu_1,pinpu_1t3fs_1,zdfs_1,fx_1,wendu_1,pinpu_1t4fs_1,zdfs_1,fx_1,wendu_1,pinpu_1t5fs_2,zdfs_2,fx_1,wendu_1,pinpu_1t6fs_1,zdfs_2,fx_1,wendu_1,pinpu_1t7fs_1,zdfs_1,fx_2,wendu_3,pinpu_1t8fs_2,zdfs_2,fx_2,wendu_1,pinpu_1t9fs_1,zdfs_2,fx_1,wendu_1,pinpu_1......t72fs_3,zdfs_3,fx_1,wendu_3,pinpu_1......
23.3.数据的离散化是关联规则挖掘前的一个重要环节,若数据集中的值是连续的,则挖掘前应进行离散化,海洋环境数据主要是连续型数据,需要进行数据的离散化,首先对海洋环境数据库中的事务集t进行映射,映射的方法是看每条海洋环境事务中是否包含项集中的元素,如果包含对应的元素,则标记为1,否则为0,这样就可以得到由所有海洋环境事务项组成的0-1矩阵。
24.4.根据用户设置的最小支持度与最小置信度阈值,利用apriori关联规则挖掘方法将离散化后的海洋环境噪声谱级与水文气象数据进行关联关系挖掘,如图2所示,其具体流程如下:
25.(1)设置最小支持度min_sup=0.2,最小置信度min_conf=0.5,支持度和置信度主要用于考察海洋环境噪声与水文气象之间关联关系程度。这里支持度的计算公式为:
[0026][0027]
公式(2)表示数据集a在海洋环境事务集合中出现的概率。置信度的计算公式为:
[0028][0029]
公式(3)表示在数据集a出现的条件下数据集b出现的条件概率。这里a={a1,a2,a3,...,an},b={b1,b2,b3,...,bn}是海洋环境噪声与水文气象的要素集合。
[0030]
(2)扫描全部的海洋环境与水文气象数据,产生候选1项集c1并获得每个候选项的计数,由于最小支持度设为0.2,在候选集c1中删除fx_3、wendu_3项目,可以确定频繁1项集的集合l1,它由大于等于最小支持度的候选1项集组成。
[0031]
(3)为发现频繁2项集的集合l2,算法使用l1的元素两两相互组合产生候选2项集的集合c2,然后再根据最小支持度得到l2。
[0032]
(4)l2的元素相互组合产生候选3项集的集合c3,然后再根据最小支持度得到l3。
[0033]
(5)算法使用l3的元素相互组合产生候选4-项集的集合c4。l3∞l3={{fs_2,zdfs_2,wendu_1,pinpu_3}},根据apriori算法的性质,因为它的子集{zdfs_2,wendu_1,pinpu_3}不是频繁的,所有这个项集被删除。这样c4为空集,因此算法终止并找到了所有的
频繁项集。对于频繁集l3,所生成的所有非空子集为{fs_2},{zdfs_2},{wendu_1},{pinpu_3},{fs_2,zdfs_2},{fs_2,wendu_1},{fs_2,pinpu_3},{zdfs_2,wendu_1},{zdfs_2,pinpu_3},{wendu_1,pinpu_3}。
[0034]
(6)根据步骤(5)得到的海洋环境数据的频繁项集,计算其每个非空子集的置信度,找到满足最小置信度阈值的关联规则,即这里a为规则前件,b为规则后件,得到强关联规则及其置信度,如表2所示。
[0035]
表2 海洋环境噪声与水文气象的关联规则及置信度
[0036]
规则前件规则后件置信度{fs_2,pinpu_3}zdfs_294.11%{fs_2,wendu_1}zdfs_293.75%{zdfs_2,pinpu_3}fs_288.89%{zdfs_2,wendu_1}fs_275%{fs_2,zdfs_3}pinpu_372.73%{fs_2,zdfs_3}wendu_168.18%fs_2{zdfs_2,pinpu_3}66.67%fs_2{zdfs_2,wendu_1}62.5%zdfs_2{fs_2,pinpu_3}50%
[0037]
根据表2的关联规则结果可知,fs_2和zdfs_3对pinpu_3的影响较大,即风速在1.5-2.1之间(fs_2),最大风速在2.9-4.9之间(zdfs_3),海洋环境噪声的谱级在71.6117-76.0281的范围内,即pinpu_3等级发生的概率为72.73%,上述阈值可通过风速的变化范围来预测海洋环境噪声谱级。

技术特征:
1.一种基于apriori的海洋环境噪声与水文气象关联关系挖掘方法,其特征在于包括如下步骤:(1)连续获取大量的海洋环境噪声数据,并同步获取风速、温度等水文气象数据,将采集到的海洋环境噪声时域信号按照一定的时间规则截为多段,对预处理后的海洋环境噪声信号进行fft分析,通过计算得到海洋环境噪声谱级;(2)利用模糊c均值聚类方法对海洋环境噪声谱级、风速以及温度数据进行分级化表征,即将数据划分成若干区间,落于某个区间的数据统一以一个特定的符号来代替,然后根据海洋环境数据的分级化表征结果得到海洋环境事务集合t;(3)对由步骤2得到的海洋环境事务集t进行映射,映射的方法是看每条海洋环境事务项中是否包含项集中的元素,如果包含对应的元素,则标记为1,否则为0,这样就可以得到由所有海洋环境数据项组成的0-1矩阵;(4)基于apriori算法对由步骤3得到的海洋环境数据的0-1矩阵进行关联关系挖掘,挖掘出海洋环境噪声与水文气象的关联规则;(5)根据用户设置的最小支持度与最小置信度阈值对得到的关联规则进行筛选和分析,发现海洋环境噪声与水文气象间的强关联关系。

技术总结
一种基于Apriori的海洋环境噪声与水文气象关联关系挖掘方法,属于海洋环境噪声与水文气象的数据挖掘领域。其特征为首先获取海洋环境噪声与水文气象数据并进行预处理,将预处理后的海洋环境噪声进行FFT分析,得到环境噪声谱级。然后对环境噪声谱级、风速和温度分级化表征,得到海洋环境事务集T。对海洋环境事务集T离散化后采用Apriori算法进行关联规则挖掘,发现海洋环境噪声与水文气象间的强关联关系。本发明的效果和益处是:通过Apriori算法对海洋环境噪声与水文气象进行关联关系挖掘,能够根据特定目的挖掘出某个水文气象要素对海洋环境噪声谱级变化的影响,并给出水文气象要素影响特定频段海洋环境噪声谱级的置信度,提高了海洋环境噪声谱级预测的准确性。了海洋环境噪声谱级预测的准确性。了海洋环境噪声谱级预测的准确性。


技术研发人员:曹琳 彭圆 车树伟 张学刚 牟林 胡文帅 张钊辉 胡晨
受保护的技术使用者:中国船舶集团有限公司
技术研发日:2020.09.07
技术公布日:2022/3/7

最新回复(0)