1.本技术涉及数据挖掘技术领域,更为具体来说,本技术涉及一种基于停靠点聚类的企业车队识别方法和装置。
背景技术:
2.货车作为陆运主力,其承担了很大一部分货物运输量,现有的技术方案中,在实现高效的货物运输时,主要通过用户主动联系的方式进行货物运输,例如车主确定运输路线后,首先需要联系该路线上的企业,通过打电话的方式逐一询问有无需要运输的货物,同时当货主想将获取运输到某一地点,需要提前联系运输到该地点的车辆,如果车主或货主其中一方联系不到对方,就会导致货物无法运输,从而降低了货物运输效率。
3.公开号为cn113222492的专利申请公开了一种车辆行驶线路类型的判别方法,所述方法包括:获取待判别车辆在预设时间段内的历史行驶轨迹点;根据所述历史行驶轨迹点计算所述待判别车辆的poi历史停靠点;预处理所述计算的待判别车辆的poi历史停靠点,生成目标poi停靠点序列;将所述目标poi停靠点序列进行等级划分,生成多级poi停靠点序列;基于所述多级poi停靠点序列判别所述待判别车辆对应的行驶路线类型。然而,该专利申请不能给出有效的车辆和企业的关联数据进而不能识别企业车队运营的类型,影响车辆运输效率。
技术实现要素:
4.基于上述技术问题,本发明旨在基于两次dbscan聚类模型来提升数据挖掘的效率,特别是得到企业停车场数据,基于所述企业停车场数据计算企业车队的系数,将所述企业车队的系数大于等于预设阈值的企业下车辆作为企业车队运营,从而实现数据挖掘的细致度与精准度,以适应各种相关应用场景。
5.本发明第一方面提供了一种基于停靠点聚类的企业车队识别方法,包括:
6.获取车辆停靠数据及车辆与企业的关联数据;
7.对所述车辆停靠数据及车辆与企业的关联数据进行筛选和分组,得到符合预设条件的待聚类停靠点;
8.将所述待聚类停靠点输入到训练好的dbscan聚类模型,得到车辆常驻地;
9.对所述车辆常驻地进行过滤和关联,得到每个企业下的车辆常驻地,并将所述每个企业下的车辆常驻地输入到训练好的dbscan聚类模型,得到企业停车场数据;
10.基于所述企业停车场数据计算企业车队的系数;
11.将所述企业车队的系数大于等于预设阈值的企业下车辆作为企业车队运营,否则,作为非企业车队运营。
12.具体地,所述车辆停靠数据包括车辆id、停靠日期、停靠起始时间、停靠结束时间、停靠时长、停靠点经度和停靠点纬度;所述车辆和企业的关联数据包括车辆id和企业id的对应关系。
13.优选地,所述方法还包括:对所述待聚类停靠点输入到训练好的dbscan聚类模型,若没有得到类簇,则取车辆的停靠点中停靠时长最长且停靠时长大于预设天数的停靠点作为车辆常驻地。
14.进一步地,将所述待聚类停靠点输入到训练好的dbscan聚类模型,得到车辆常驻地,包括:
15.将所述待聚类停靠点输入到训练好的dbscan聚类模型;
16.将基于模型得到类簇中的停靠次数、停靠天数和/或停靠总时长进行降序存储;
17.将降序排列中靠前的预设数目的停靠点作为车辆常驻地。
18.进一步地,所述对所述车辆停靠数据及车辆与企业的关联数据进行筛选和分组,得到符合预设条件的待聚类停靠点,包括:
19.选取具有预设范围的停靠时长的停靠点;
20.将选取的停靠点通过车辆id进行分组;
21.分析并确定符合预设条件的待聚类停靠点。
22.进一步地,所述对所述车辆常驻地进行过滤和关联,得到每个企业下的车辆常驻地,包括:
23.过滤所述车辆常驻地得到目标车辆的车辆常驻地;
24.选取所述目标车辆的车辆常驻地中分位数大于预设数值的车辆常驻地;
25.将车辆id和企业id进行关联,得到每个企业下的车辆常驻地。
26.再进一步地,所述基于所述企业停车场数据计算企业车队的系数,包括:
27.将车辆和企业的关联数据和企业停车场数据进行关联,将关联上的车辆数记为n,其中,n为自然数;
28.通过企业id将数据进行聚合,获取企业关联上的车辆中停在企业停车场的个数并将其记为m,其中,m为自然数;
29.用m除以n作为企业车队系数。
30.本发明第二方面提供了一种基于停靠点聚类的企业车队识别装置,所述装置包括:
31.获取模块,用于获取车辆停靠数据及车辆与企业的关联数据;
32.停靠点筛选模块,用于对所述车辆停靠数据及车辆与企业的关联数据进行筛选和分组,得到符合预设条件的待聚类停靠点;
33.第一聚类模块,用于将所述待聚类停靠点输入到训练好的dbscan聚类模型,得到车辆常驻地;
34.第二聚类模块,用于对所述车辆常驻地进行过滤和关联,得到每个企业下的车辆常驻地,并将所述每个企业下的车辆常驻地输入到训练好的dbscan聚类模型,得到企业停车场数据;
35.车队系数计算模块,用于基于所述企业停车场数据计算企业车队的系数;
36.识别模块,用于将所述企业车队的系数大于等于预设阈值的企业下车辆作为企业车队运营,否则,作为非企业车队运营。
37.本发明第三方面提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以下步骤:
38.获取车辆停靠数据及车辆与企业的关联数据;
39.对所述车辆停靠数据及车辆与企业的关联数据进行筛选和分组,得到符合预设条件的待聚类停靠点;
40.将所述待聚类停靠点输入到训练好的dbscan聚类模型,得到车辆常驻地;
41.对所述车辆常驻地进行过滤和关联,得到每个企业下的车辆常驻地,并将所述每个企业下的车辆常驻地输入到训练好的dbscan聚类模型,得到企业停车场数据;
42.基于所述企业停车场数据计算企业车队的系数;
43.将所述企业车队的系数大于等于预设阈值的企业下车辆作为企业车队运营,否则,作为非企业车队运营。
44.本发明第四方面提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
45.获取车辆停靠数据及车辆与企业的关联数据;
46.对所述车辆停靠数据及车辆与企业的关联数据进行筛选和分组,得到符合预设条件的待聚类停靠点;
47.将所述待聚类停靠点输入到训练好的dbscan聚类模型,得到车辆常驻地;
48.对所述车辆常驻地进行过滤和关联,得到每个企业下的车辆常驻地,并将所述每个企业下的车辆常驻地输入到训练好的dbscan聚类模型,得到企业停车场数据;
49.基于所述企业停车场数据计算企业车队的系数;
50.将所述企业车队的系数大于等于预设阈值的企业下车辆作为企业车队运营,否则,作为非企业车队运营。
51.本技术的有益效果为:本技术对车辆停靠数据及车辆与企业的关联数据进行筛选和分组,得到符合预设条件的待聚类停靠点,将待聚类停靠点输入到训练好的dbscan聚类模型,得到车辆常驻地,提升了数据挖掘的效率;又通过二次dbscan聚类得到企业停车场数据,基于企业停车场数据计算企业车队的系数,将所述企业车队的系数大于等于预设阈值的企业下车辆作为企业车队运营,进而提升了数据挖掘细致度和精准度,能够在相关应用场景下快速找到相应企业车队的运营情况,提升了车辆运输效率,也便于车辆调度、统计和相关应用。
附图说明
52.构成说明书的一部分的附图描述了本技术的实施例,并且连同描述一起用于解释本技术的原理。
53.参照附图,根据下面的详细描述,可以更加清楚地理解本技术,其中:
54.图1示出了本技术示例性实施例中的基于停靠点聚类的企业车队识别方法步骤示意图;
55.图2示出了本技术示例性实施例的基于停靠点聚类的企业车队识别装置结构示意图;
56.图3示出了本技术示例性实施例所提供的一种电子设备的结构示意图;
57.图4示出了本技术示例性实施例所提供的一种存储介质的示意图。
具体实施方式
58.以下,将参照附图来描述本技术的实施例。但是应该理解的是,这些描述只是示例性的,而并非要限制本技术的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本技术的概念。对于本领域技术人员来说显而易见的是,本技术可以无需一个或多个这些细节而得以实施。在其他的例子中,为了避免与本技术发生混淆,对于本领域公知的一些技术特征未进行描述。
59.应予以注意的是,这里所使用的术语仅是为了描述具体实施例,而非意图限制根据本技术的示例性实施例。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式。此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或附加一个或多个其他特征、整体、步骤、操作、元件、组件和/或它们的组合。
60.现在,将参照附图更详细地描述根据本技术的示例性实施例。然而,这些示例性实施例可以多种不同的形式来实施,并且不应当被解释为只限于这里所阐述的实施例。附图并非是按比例绘制的,其中为了清楚表达的目的,可能放大了某些细节,并且可能省略了某些细节。图中所示出的各种区域、层的形状以及它们之间的相对大小、位置关系仅是示例性的,实际中可能由于制造公差或技术限制而有所偏差,并且本领域技术人员根据实际所需可以另外设计具有不同形状、大小、相对位置的区域/层。
61.下面结合说明书附图1-4给出几个实施例来描述根据本技术的示例性实施方式。需要注意的是,下述应用场景仅是为了便于理解本技术的精神和原理而示出,本技术的实施方式在此方面不受任何限制。相反,本技术的实施方式可以应用于适用的任何场景。
62.实施例1:
63.本实施例实施了一种基于停靠点聚类的企业车队识别方法,如图1所示,包括:
64.s1、获取车辆停靠数据及车辆与企业的关联数据;
65.s2、对车辆停靠数据及车辆与企业的关联数据进行筛选和分组,得到符合预设条件的待聚类停靠点;
66.s3、将待聚类停靠点输入到训练好的dbscan聚类模型,得到车辆常驻地;
67.s4、对所述车辆常驻地进行过滤和关联,得到每个企业下的车辆常驻地,并将所述每个企业下的车辆常驻地输入到训练好的dbscan聚类模型,得到企业停车场数据;
68.s5、基于企业停车场数据计算企业车队的系数;
69.s6、将所述企业车队的系数大于等于预设阈值的企业下车辆作为企业车队运营,否则,作为非企业车队运营。
70.这里需要说明的是,dbscan(density-based spatial clustering of applications with noise)是一个出现得比较早(1996年),比较有代表性的基于密度的聚类算法。算法的主要目标是相比基于划分的聚类方法和层次聚类方法,需要更少的领域知识来确定输入参数;发现任意形状的聚簇;在大规模数据库上更好的效率。dbscan能够将足够高密度的区域划分成簇,并能在具有噪声的空间数据库中发现任意形状的簇。
71.具体地,车辆停靠数据包括车辆id、停靠日期、停靠起始时间、停靠结束时间、停靠时长、停靠点经度和停靠点纬度;车辆和企业的关联数据包括车辆id和企业id的对应关系。
72.优选地,方法还包括:对待聚类停靠点输入到训练好的dbscan聚类模型,若没有得
到类簇,则取车辆的停靠点中停靠时长最长且停靠时长大于预设天数的停靠点作为车辆常驻地。
73.进一步地,将待聚类停靠点输入到训练好的dbscan聚类模型,得到车辆常驻地,包括:将待聚类停靠点输入到训练好的dbscan聚类模型;将基于模型得到类簇中的停靠次数、停靠天数和/或停靠总时长进行降序存储;将降序排列中靠前的预设数目的停靠点作为车辆常驻地。
74.进一步地,对车辆停靠数据及车辆与企业的关联数据进行筛选和分组,得到符合预设条件的待聚类停靠点,包括:选取具有预设范围的停靠时长的停靠点;将选取的停靠点通过车辆id进行分组;分析并确定符合预设条件的待聚类停靠点。
75.进一步地,对车辆常驻地进行过滤和关联,得到每个企业下的车辆常驻地,包括:过滤车辆常驻地得到目标车辆的车辆常驻地;选取目标车辆的车辆常驻地中分位数大于预设数值的车辆常驻地;将车辆id和企业id进行关联,得到每个企业下的车辆常驻地。
76.再进一步地,基于企业停车场数据计算企业车队的系数,包括:将车辆和企业的关联数据和企业停车场数据进行关联,将关联上的车辆数记为n,其中,n为自然数;通过企业id将数据进行聚合,获取企业关联上的车辆中停在企业停车场的个数并将其记为m,其中,m为自然数;用m除以n作为企业车队系数。
77.本技术对车辆停靠数据及车辆与企业的关联数据进行筛选和分组,得到符合预设条件的待聚类停靠点,将待聚类停靠点输入到训练好的dbscan聚类模型,得到车辆常驻地,提升了数据挖掘的效率;又通过二次dbscan聚类得到企业停车场数据,基于企业停车场数据计算企业车队的系数,将所述企业车队的系数大于等于预设阈值的企业下车辆作为企业车队运营,进而提升了数据挖掘细致度和精准度,能够在相关应用场景下快速找到相应企业车队的运营情况,便于车辆调度、统计和相关应用。
78.实施例2:
79.本实施例实施了一种基于停靠点聚类的企业车队识别方法,包括:获取车辆停靠数据及车辆与企业的关联数据;对车辆停靠数据及车辆与企业的关联数据进行筛选和分组,得到符合预设条件的待聚类停靠点;将待聚类停靠点输入到训练好的dbscan聚类模型,得到车辆常驻地;对车辆常驻地进行过滤和关联,得到每个企业下的车辆常驻地,并将所述每个企业下的车辆常驻地输入到训练好的dbscan聚类模型,得到企业停车场数据;基于企业停车场数据计算企业车队的系数;将所述企业车队的系数大于等于预设阈值的企业下车辆作为企业车队运营,否则,作为非企业车队运营。步骤的具体说明如下。
80.第一步,获取车辆停靠数据及车辆与企业的关联数据。
81.在具体的实施过程中,获取车辆停靠数据及车辆与企业的关联数据可以在相关软件中收集,也可以人工采集,车辆停靠数据包括车辆id、停靠日期、停靠起始时间、停靠结束时间、停靠时长、停靠点经度和停靠点纬度等;车辆和企业的关联数据包括车辆id和企业id的对应关系。
82.第二步,对车辆停靠数据及车辆与企业的关联数据进行筛选和分组,得到符合预设条件的待聚类停靠点。
83.对车辆停靠数据及车辆与企业的关联数据进行筛选和分组,得到符合预设条件的待聚类停靠点,包括:选取具有预设范围的停靠时长的停靠点;将选取的停靠点通过车辆id
进行分组;分析并确定符合预设条件的待聚类停靠点。例如在一种可能的具体实施方式中,通过停靠点的停靠时长》=30分钟过滤停靠点,将不同的停靠点通过车辆id进行分组,通过分析设置参与聚类停靠点的最小个数100,如果车辆的聚类停靠点个数小于100,则用剩余的点补足100个,若近10天车辆一直未运营上线,则也把最后停靠位置点添加到聚类停靠点当中。
84.第三步,将待聚类停靠点输入到训练好的dbscan聚类模型,得到车辆常驻地。
85.dbscan(density-based spatial clustering of applications with noise)是一个出现得比较早(1996年),比较有代表性的基于密度的聚类算法。算法的主要目标是相比基于划分的聚类方法和层次聚类方法,需要更少的领域知识来确定输入参数;发现任意形状的聚簇;在大规模数据库上更好的效率。dbscan能够将足够高密度的区域划分成簇,并能在具有噪声的空间数据库中发现任意形状的簇。
86.将待聚类停靠点输入到训练好的dbscan聚类模型,得到车辆常驻地,包括:将待聚类停靠点输入到训练好的dbscan聚类模型;将基于模型得到类簇中的停靠次数、停靠天数和/或停靠总时长进行降序存储;将降序排列中靠前的预设数目的停靠点作为车辆常驻地。在一种可能的具体实施方式中,对待聚类停靠点输入到训练好的dbscan聚类模型,若没有得到类簇,则取车辆的停靠点中停靠时长最长且停靠时长大于预设天数的停靠点作为车辆常驻地。dbscan聚类模型需要预先训练好,通过dbscan进行聚类,调整参数,并通过人工抽样验证,确定模型最优参数,那么每辆车聚类的类簇就是车辆的常驻地。但若出现特殊情况,如果某辆车没有形成类簇,则使用此车辆停靠时长最长(比如:10天)的点,当做车辆常驻地。
87.第四步,对车辆常驻地进行过滤和关联,得到每个企业下的车辆常驻地,并将所述每个企业下的车辆常驻地输入到训练好的dbscan聚类模型,得到企业停车场数据。
88.在一种具体的实施方式中,所述对所述车辆常驻地进行过滤和关联,得到每个企业下的车辆常驻地,包括:过滤所述车辆常驻地得到目标车辆的车辆常驻地;选取所述目标车辆的车辆常驻地中分位数大于预设数值的车辆常驻地;将车辆id和企业id进行关联,得到每个企业下的车辆常驻地。例如:过滤车辆常驻地的停靠点的个数大于3个,比如某车有5个车辆常驻地,分别为100,50,30,2,2个点,那么保留的常驻地是100,50,30这三个常驻地。然后大于等于75分位数,则5个常驻地会保留100,50两个常驻地的点,之后车辆id和企业id进行关联,就会形成一个企业关联多辆车的情况,再输入企业下车辆的常驻地,进行聚合,优化办法类似于车辆常驻地的得到方式。企业下聚合的类簇,比如有1000,800,300,100,30这几个,通过大于300进行过滤,那么,最后留下来的企业停车场就是1000,800这两个了。
89.第五步,基于企业停车场数据计算企业车队的系数。
90.基于企业停车场数据计算企业车队的系数,包括:将车辆和企业的关联数据和企业停车场数据进行关联,将关联上的车辆数记为n,其中,n为自然数;通过企业id将数据进行聚合,获取企业关联上的车辆中停在企业停车场的个数并将其记为m,其中,m为自然数;用m除以n作为企业车队系数。在一种具体的实施方式中,一个企业关联了很多车,比如关联了30辆车,但是有一部分是企业的车,比如25,会停到企业的停车场,一部分不是企业的车,另外5辆,不会停到企业的停车场,那么企业车队系数r=25/30,若保留两位小数,r=0.83。
91.第六步,将所述企业车队的系数大于等于预设阈值的企业下车辆作为企业车队运
营,否则,作为非企业车队运营。
92.具体地,设大于0.7的企业下车辆作为企业车队运营,那么上述例子中的r=0.83就满足条件,属于企业车队运营;若r=0.69,则属于非企业车队运营。
93.本技术对车辆停靠数据及车辆与企业的关联数据进行筛选和分组,得到符合预设条件的待聚类停靠点,将待聚类停靠点输入到训练好的dbscan聚类模型,得到车辆常驻地,提升了数据挖掘的效率;又通过二次dbscan聚类得到企业停车场数据,基于企业停车场数据计算企业车队的系数,将所述企业车队的系数大于等于预设阈值的企业下车辆作为企业车队运营,进而提升了数据挖掘细致度和精准度,能够在相关应用场景下快速找到相应企业车队的运营情况,便于车辆调度、统计和相关应用。
94.实施例3:
95.本实施例提供了一种基于停靠点聚类的企业车队识别装置,如图2所示,所述装置包括:
96.获取模块301,用于获取车辆停靠数据及车辆与企业的关联数据;
97.停靠点筛选模块302,用于对所述车辆停靠数据及车辆与企业的关联数据进行筛选和分组,得到符合预设条件的待聚类停靠点;
98.第一聚类模块303,用于将所述待聚类停靠点输入到训练好的dbscan聚类模型,得到车辆常驻地;
99.第二聚类模块304,用于对所述车辆常驻地进行过滤和关联,得到每个企业下的车辆常驻地,并将所述每个企业下的车辆常驻地输入到训练好的dbscan聚类模型,得到企业停车场数据;
100.车队系数计算模块305,用于基于所述企业停车场数据计算企业车队的系数;
101.识别模块306,用于将所述企业车队的系数大于等于预设阈值的企业下车辆作为企业车队运营,否则,作为非企业车队运营。
102.下面请参考图3,其示出了本技术的一些实施方式所提供的一种电子设备的示意图。如图3所示,所述电子设备2包括:处理器200,存储器201,总线202和通信接口203,所述处理器200、通信接口203和存储器201通过总线202连接;所述存储器201中存储有可在所述处理器200上运行的计算机程序,所述处理器200运行所述计算机程序时执行本技术前述任一实施方式所提供的基于停靠点聚类的企业车队识别方法,所述电子设备可以是具有触敏显示器的电子设备。
103.其中,存储器201可能包含高速随机存取存储器(ram:random access memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口203(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网、广域网、本地网、城域网等。
104.总线202可以是isa总线、pci总线或eisa总线等。所述总线可以分为地址总线、数据总线、控制总线等。其中,存储器201用于存储程序,所述处理器200在接收到执行指令后,执行所述程序,前述本技术实施例任一实施方式揭示的所述基于停靠点聚类的企业车队识别方法可以应用于处理器200中,或者由处理器200实现。
105.处理器200可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器200中的硬件的集成逻辑电路或者软件形式的指令完成。上
述的处理器200可以是通用处理器,包括中央处理器(central processing unit,简称cpu)、网络处理器(network processor,简称np)等;还可以是数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本技术实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本技术实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器201,处理器200读取存储器201中的信息,结合其硬件完成上述方法的步骤。
106.本技术实施例提供的电子设备与本技术实施例提供的基于停靠点聚类的企业车队识别方法出于相同的发明构思,具有与其采用、运行或实现的方法相同的有益效果。
107.本技术实施方式还提供一种与前述实施方式所提供的基于停靠点聚类的企业车队识别方法对应的计算机可读存储介质,请参考图4,图4示出的计算机可读存储介质为光盘30,其上存储有计算机程序(即程序产品),所述计算机程序在被处理器运行时,会执行前述任意实施方式所提供的基于停靠点聚类的企业车队识别方法。
108.另外,所述计算机可读存储介质的例子还可以包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他光学、磁性存储介质,在此不再一一赘述。
109.本技术的上述实施例提供的计算机可读存储介质与本技术实施例提供的空分复用光网络中量子密钥分发信道分配方法出于相同的发明构思,具有与其存储的应用程序所采用、运行或实现的方法相同的有益效果。
110.本技术实施方式还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现前述任意实施方式所提供的基于停靠点聚类的企业车队识别方法的步骤,所述方法的步骤包括:获取车辆停靠数据及车辆与企业的关联数据;对车辆停靠数据及车辆与企业的关联数据进行筛选和分组,得到符合预设条件的待聚类停靠点;将待聚类停靠点输入到训练好的dbscan聚类模型,得到车辆常驻地;对所述车辆常驻地进行过滤和关联,得到每个企业下的车辆常驻地,并将所述每个企业下的车辆常驻地输入到训练好的dbscan聚类模型,得到企业停车场数据;基于企业停车场数据计算企业车队的系数;将所述企业车队的系数大于等于预设阈值的企业下车辆作为企业车队运营,否则,作为非企业车队运营。
111.需要说明的是:在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备有固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本技术也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本技术的内容,并且上面对特定语言所做的描述是为了披露本技术的最佳实施方式。在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本技术的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
112.类似地,应当理解,为了精简本技术并帮助理解各个发明方面中的一个或多个,在上面对本技术的示例性实施例的描述中,本技术的各个特征有时被一起分组到单个实施例、图或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本技术要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本技术的单独实施例。
113.本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
114.本技术的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本技术实施例的虚拟机的创建装置中的一些或者全部部件的一些或者全部功能。本技术还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。实现本技术的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
115.以上所述,仅为本技术较佳的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以所述权利要求的保护范围为准。
技术特征:
1.一种基于停靠点聚类的企业车队识别方法,其特征在于,包括:获取车辆停靠数据及车辆与企业的关联数据;对所述车辆停靠数据及车辆与企业的关联数据进行筛选和分组,得到符合预设条件的待聚类停靠点;将所述待聚类停靠点输入到训练好的dbscan聚类模型,得到车辆常驻地;对所述车辆常驻地进行过滤和关联,得到每个企业下的车辆常驻地,并将所述每个企业下的车辆常驻地输入到训练好的dbscan聚类模型,得到企业停车场数据;基于所述企业停车场数据计算企业车队的系数;将所述企业车队的系数大于等于预设阈值的企业下车辆作为企业车队运营,否则,作为非企业车队运营。2.根据权利要求1所述的基于停靠点聚类的企业车队识别方法,其特征在于,所述车辆停靠数据包括车辆id、停靠日期、停靠起始时间、停靠结束时间、停靠时长、停靠点经度和停靠点纬度;所述车辆和企业的关联数据包括车辆id和企业id的对应关系。3.根据权利要求2所述的基于停靠点聚类的企业车队识别方法,其特征在于,所述方法还包括:对所述待聚类停靠点输入到训练好的dbscan聚类模型,若没有得到类簇,则取车辆的停靠点中停靠时长最长且停靠时长大于预设天数的停靠点作为车辆常驻地。4.根据权利要求3所述的基于停靠点聚类的企业车队识别方法,其特征在于,将所述待聚类停靠点输入到训练好的dbscan聚类模型,得到车辆常驻地,包括:将所述待聚类停靠点输入到训练好的dbscan聚类模型;将基于模型得到类簇中的停靠次数、停靠天数和/或停靠总时长进行降序存储;将降序排列中靠前的预设数目的停靠点作为车辆常驻地。5.根据权利要求3所述的基于停靠点聚类的企业车队识别方法,其特征在于,所述对所述车辆停靠数据及车辆与企业的关联数据进行筛选和分组,得到符合预设条件的待聚类停靠点,包括:选取具有预设范围的停靠时长的停靠点;将选取的停靠点通过车辆id进行分组;分析并确定符合预设条件的待聚类停靠点。6.根据权利要求3所述的基于停靠点聚类的企业车队识别方法,其特征在于,所述对所述车辆常驻地进行过滤和关联,得到每个企业下的车辆常驻地,包括:过滤所述车辆常驻地得到目标车辆的车辆常驻地;选取所述目标车辆的车辆常驻地中分位数大于预设数值的车辆常驻地;将车辆id和企业id进行关联,得到每个企业下的车辆常驻地。7.根据权利要求3所述的基于停靠点聚类的企业车队识别方法,其特征在于,所述基于所述企业停车场数据计算企业车队的系数,包括:将车辆和企业的关联数据和企业停车场数据进行关联,将关联上的车辆数记为n,其中,n为自然数;通过企业id将数据进行聚合,获取企业关联上的车辆中停在企业停车场的个数并将其记为m,其中,m为自然数;用m除以n作为企业车队系数。
8.一种基于停靠点聚类的企业车队识别装置,其特征在于,所述装置包括:获取模块,用于获取车辆停靠数据及车辆与企业的关联数据;停靠点筛选模块,用于对所述车辆停靠数据及车辆与企业的关联数据进行筛选和分组,得到符合预设条件的待聚类停靠点;第一聚类模块,用于将所述待聚类停靠点输入到训练好的dbscan聚类模型,得到车辆常驻地;第二聚类模块,用于对所述车辆常驻地进行过滤和关联,得到每个企业下的车辆常驻地,并将所述每个企业下的车辆常驻地输入到训练好的dbscan聚类模型,得到企业停车场数据;车队系数计算模块,用于基于所述企业停车场数据计算企业车队的系数;识别模块,用于将所述企业车队的系数大于等于预设阈值的企业下车辆作为企业车队运营,否则,作为非企业车队运营。9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-7任一所述方法的步骤。10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-7任一所述方法的步骤。
技术总结
本申请涉及一种基于停靠点聚类的企业车队识别方法和装置。所述方法包括:获取车辆停靠数据及车辆与企业的关联数据;对车辆停靠数据及车辆与企业的关联数据进行筛选和分组,得到符合预设条件的待聚类停靠点;将待聚类停靠点输入到训练好的DBSCAN聚类模型,得到车辆常驻地;对车辆常驻地进行过滤和关联,得到每个企业下的车辆常驻地,并将每个企业下的车辆常驻地输入到训练好的DBSCAN聚类模型,得到企业停车场数据;基于企业停车场数据计算企业车队的系数;将企业车队的系数大于等于预设阈值的企业下车辆作为企业车队运营,否则,作为非企业车队运营。所述方法提升了数据挖掘细致度和精准度,提升了车辆运输效率,也便于车辆调度、统计和相关应用。统计和相关应用。统计和相关应用。
技术研发人员:杨俊京 赵岩 夏曙东 蔡抒扬 孙智彬 张志平
受保护的技术使用者:北京中交兴路信息科技有限公司
技术研发日:2021.12.03
技术公布日:2022/3/8