企业挖掘方法及装置与流程

专利查询6月前  45



1.本公开涉及数据处理技术领域,具体涉及到一种企业挖掘方法及装置。


背景技术:

2.在企业挖掘时,通常需要人工把所有信息浏览一遍,便可以对企业有个大致的印象,采用这种方式花费的时间长,而且还抓不到重点。


技术实现要素:

3.本公开的主要目的在于提供一种企业挖掘方法及装置。
4.为了实现上述目的,根据本公开的第一方面,提供了一种企业挖掘方法,包括:在获取到企业的信息后,利用数据提取规则提取企业的目标数据,并基于目标数据为企业生成对应的标签;在接收到页面发送的标签查询请求后,将符合标签的企业相关信息发送至页面。
5.可选地,方法还包括:按照预设的指标体系,定义标签的口径;基于定义的口径,建立数据提取规则。
6.可选地,在获取到企业的信息后,基于数据提取规则提取企业的目标数据包括:利用数据提取规则,基于预设的基本属性指标,提取企业的信息中的基本属性信息,并为企业的基本属性信息进行打标;利用数据提取规则,基于预设的企业评价指标,提取企业的信息中的企业评价信息,并为企业评价信息进行打标;和/或,利用数据提取规则,基于预设的企业评价指标,提取企业的信息中的具体行为信息,并为具体行为信息进行打标。
7.可选地,在接收到页面发送的标签查询请求后,将符合标签的企业相关发送至页面包括:在接收到通过页面选定的标签后,从数据库中检索与选定的标签相符的企业相关信息发送至页面;和/或,在接收到通过页面输入的关键字后,从数据库中检索与所述关键字相符的企业相关信息发送至页面。
8.可选地,方法还包括:接收页面的企业定制条件,其中,所述定制条件选定的标签确定;每隔预设的时间向页面推送符合定制条件的企业的相关信息。
9.根据本公开的第二方面,提供了一种企业挖掘装置,包括:标签单元,被配置成在获取到企业的信息后,利用数据提取规则提取企业的目标数据,并基于目标数据为企业生成对应的标签;确定单元,被配置成在接收到页面发送的标签查询请求后,将符合标签的企业相关信息发送至页面。
10.装置还包括:定义单元,被配置成按照预设的指标体系,定义标签的口径;规则建立单元,被配置成基于定义的口径,建立数据提取规则。
11.可选地,在获取到企业的信息后,基于数据提取规则提取企业的目标数据包括:利用数据提取规则,基于预设的基本属性指标,提取企业的信息中的基本属性信息,并为企业的基本属性信息进行打标;利用数据提取规则,基于预设的企业评价指标,提取企业的信息中的企业评价信息,并为企业评价信息进行打标;和/或,利用数据提取规则,基于预设的企
业评价指标,提取企业的信息中的具体行为信息,并为具体行为信息进行打标。
12.根据本公开的第三方面,提供了一种计算机可读存储介质,存储有计算机指令,所述计算机指令用于使所述计算机执行第一方面任意一项实现方式所述的企业挖掘方法。
13.根据本公开的第四方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行第一方面任意一项实现方式所述的企业挖掘方法。
14.在本公开实施例企业挖掘方法及装置中,首先在获取到企业的信息后,利用数据提取规则提取企业的目标数据,并基于目标数据为企业生成对应的标签;而后在接收到页面发送的标签查询请求后,将符合标签的企业相关信息发送至页面。通过建立企业的标签,进而通过查询标签的方式,实现企业挖掘,能够快速的确定企业的特征,精准地了解企业,进而解决了相关技术中,企业挖掘时间长,效率低的问题。
附图说明
15.为了更清楚地说明本公开具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
16.图1是根据本公开实施例的企业挖掘方法流程图;
17.图2是根据本公开实施例的企业挖掘方法的一个应用场景图;
18.图3是根据本公开实施例的企业挖掘方法的另一个应用场景图;
19.图4是根据本公开实施例的企业挖掘方法的又一个应用场景图;
20.图5是根据本公开实施例的电子设备的示意图。
具体实施方式
21.为了使本技术领域的人员更好地理解本公开方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。
22.需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
23.需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
24.根据本公开实施例,提供了一种企业挖掘方法,如图1所示,该方法包括如下的步
骤101至步骤102:
25.步骤101:在获取到企业的信息后,利用数据提取规则提取企业的目标数据,并基于目标数据为企业生成对应的标签。
26.在本实施例中,可以从网站或者其他任一渠道上获取企业的信息,企业的信息可以包括有营业执照信息、股东及出资信息、人员信息、分支机构信息、变更信息、财务信息等等。基于获取的信息可以基于预设的数据提取规则对数据进行提取,而后对提取的数据进行打标作为企业的标签,一个企业可以对应有多个标签。
27.企业的各种标签就如同企业的另一种身份。标签就是通过对企业的各个指标进行分类定位并加以细分,借以来区分企业的不同特性。
28.作为本实施例一种可选的实现方式,方法还包括:按照预设的指标体系,定义标签的口径;基于定义的口径,建立数据提取规则。
29.在本可选的实现方式中,在对提取的数据打标之前,需要对每个标签定义口径,而后可基于定义的口径,建立数据提取规则,该提取规则可用于数据的提取。预设的指标体系可以包括多级指标,每级指标中均包括至少一种类型的指标作为企业的标签。指标可以包括企业的基本属性指标、企业评价指标、具体行为指标、企业所属行业指标、企业所属地区指标、企业的业务/运营指标。
30.基本属性指标可以包括但是不限于:企业类型指标(例如,作为一级指标的国有企业指标、集体企业指标、有限责任指标、股份有限公司指标等等)、企业年龄指标(例如,作为一级指标的[3个月内)指标、[3月,6月)指标等等)、注册资本指标(例如,作为一级指标的0元指标、0-10万指标等等)。
[0031]
企业评价指标可以包括综合评价指标(例如,作为一级指标的信用等级指标等等)、分项评价指标(例如,作为一级指标的创新资质指标、合法合规指标、经营状况指标、财务状况指标、规模体量指标、行为偏好指标等等)。
[0032]
具体行为指标可以包括最新知识产权指标(例如,作为一级指标的最新专利指标、最新商标指标等等)、发展扩张指标(例如,最新新设分支指标、最新投资子公司指标)、经营变动指标(例如,最新招投标指标、企业变更指标)、合规信息指标(例如,最新涉诉指标、最新法院公告指标、最新企业失信指标、最新法律文书指标)。
[0033]
企业的业务/运营指标可以包括股权特征指标(例如,作为一级指标的大股东全资指标、大股东绝对控股指标、大股东相对控股指标、股权分数指标等等)、运营特征指标、发展/规模指标、业务特征指标、知名度指标、风险信息指标等等。
[0034]
可以理解的是,每一个一级指标下可以按需包括二级指标、三级指标等等。在按照提取规则进行数据提取后,可以设置自动判断条件,进行条件判定,从而确定企业信息对应的标签类型。
[0035]
本可选的实现方式,针对大量的企业信息,采用本条规则可以有目的性、方向性的对数据进行提取。
[0036]
作为本实施例一种可选的实现方式,基于数据提取规则提取企业的目标数据包括:利用数据提取规则,基于预设的基本属性指标,提取企业的信息中的基本属性信息,并为企业的基本属性信息进行打标;利用数据提取规则,基于预设的企业评价指标,提取企业的信息中的企业评价信息,并为企业评价信息进行打标;和/或,利用数据提取规则,基于预
设的企业评价指标,提取企业的信息中的具体行为信息,并为具体行为信息进行打标。
[0037]
在本可选的实现方式中,在获取到信息后,可以基于建立的数据提取规则进行目标数据的提取。例如,预先定义“业务扩张”标签的口径为近半年开设多家分支或成立多家子公司,或者近半年有大量招聘,或者近半年参与多起招投标等,可根据该口径形成数据库提取规则,在获取到(大量)的企业信息后,可以基于该提取规则进行数据提取,而后将提取的数据符合上述条件的企业打上“业务扩张”标签即可。该标签可作为该企业的标签存储至数据库中。
[0038]
步骤102:在接收到页面发送的标签查询请求后,将符合标签的企业相关信息发送至页面。
[0039]
在本实施例中,页面可以是查询页面,用户通过该页面可以实现企业信息的查询。通过查询可以实现企业的精准定位。
[0040]
作为本实施例一种可选的实现方式,在接收到通过页面选定的标签后,从数据库中检索与选定的标签相符的企业相关信息发送至页面;和/或,在接收到通过页面输入的关键字后,从数据库中检索与所述关键字相符的企业相关信息发送至页面。
[0041]
在本可选的实现方式中,参考图2,可以通过选定的方式先确定目标标签,而后基于目标标签确定符合目标标签的企业,选的标签的数量可以是一个或多个,当标签为多个时,旨在确定同时符合多个目标标签的企业。
[0042]
当现有的标签无法满足需求时,可以通过关键字搜索的方式确定,可以是首先确定某一个标签,而后在某一个标签下输入关键字,例如,参考图3,在经营范围的标签下,输入“知识产权”,服务端可以首先确定经营范围标签下的所有企业数据,而后基于输入的关键字,确定该企业数据下满足知识产权信息的企业,并将该企业的信息发送至页面。
[0043]
也可以直接输入关键字,服务端直接基于该关键字进行搜索。
[0044]
该方式弥补了通过标签实现企业挖掘存在遗漏的情形,通过关键字搜索的方式,可以精准的挖掘企业。
[0045]
作为本实施例一种可选的实现方式,方法还包括接收页面的企业定制条件,其中,所述定制条件选定的标签确定;每隔预设的时间向页面推送符合定制条件的企业的相关信息。
[0046]
在本可选的实现方式中,可以实现企业挖掘的自定义,通过设置定制条件,可实时挖掘满足定制条件的企业,可以通过选定标签作为定制的标签,例如企业类型的标签为国有企业标签的定制条件。服务端基于该定制条件定期推送企业名单,实现企业的自动获取功能。
[0047]
在推送页面可以设置企业的各个排序条件,对推送的企业进行不同条件的排序,参考图4。
[0048]
本实施例通过建立标签体系,通过几个简短的标签便可对这个企业进行定位,不仅大大节约了时间,还能更全面的了解企业的主要特征。
[0049]
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0050]
根据本公开实施例,还提供了一种用于实施上述企业挖掘方法的装置,该装置包
括:包括:标签单元,被配置成在获取到企业的信息后,利用数据提取规则提取企业的目标数据,并基于目标数据为企业生成对应的标签;确定单元,被配置成在接收到页面发送的标签查询请求后,将符合标签的企业相关信息发送至页面。
[0051]
作为本实施例一种可选的实现方式,装置还包括:定义单元,被配置成按照预设的指标体系,定义标签的口径;规则建立单元,被配置成基于定义的口径,建立数据提取规则。
[0052]
作为本实施例一种可选的实现方式,在获取到企业的信息后,基于数据提取规则提取企业的目标数据包括:利用数据提取规则,基于预设的基本属性指标,提取企业的信息中的基本属性信息,并为企业的基本属性信息进行打标;利用数据提取规则,基于预设的企业评价指标,提取企业的信息中的企业评价信息,并为企业评价信息进行打标;和/或,利用数据提取规则,基于预设的企业评价指标,提取企业的信息中的具体行为信息,并为具体行为信息进行打标。
[0053]
本公开实施例提供了一种电子设备,如图5所示,该电子设备包括一个或多个处理器51以及存储器52,图5中以一个处理器51为例。
[0054]
该控制器还可以包括:输入装置53和输出装置54。
[0055]
处理器51、存储器52、输入装置53和输出装置54可以通过总线或者其他方式连接,图5中以通过总线连接为例。
[0056]
处理器51可以为中央处理器(centralprocessingunit,cpu)。处理器51还可以为其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0057]
存储器52作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本公开实施例中的控制方法对应的程序指令/模块。处理器51通过运行存储在存储器52中的非暂态软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例的企业挖掘方法。
[0058]
存储器52可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据服务器操作的处理装置的使用所创建的数据等。此外,存储器52可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器52可选包括相对于处理器51远程设置的存储器,这些远程存储器可以通过网络连接至网络连接装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0059]
输入装置53可接收输入的数字或字符信息,以及产生与服务器的处理装置的用户设置以及功能控制有关的键信号输入。输出装置54可包括显示屏等显示设备。
[0060]
一个或者多个模块存储在存储器52中,当被一个或者多个处理器51执行时,执行如图1所示的方法。
[0061]
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的程序可存储于一计算机可读取存储介质中,该
程序在执行时,可包括如上述各电机控制方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)、随机存储记忆体(randomaccessmemory,ram)、快闪存储器(flashmemory)、硬盘(harddiskdrive,缩写:hdd)或固态硬盘(solid-statedrive,ssd)等;存储介质还可以包括上述种类的存储器的组合。
[0062]
虽然结合附图描述了本公开的实施方式,但是本领域技术人员可以在不脱离本公开的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

技术特征:
1.一种企业挖掘方法,其特征在于,包括:在获取到企业的信息后,利用数据提取规则提取企业的目标数据,并基于目标数据为企业生成对应的标签;在接收到页面发送的标签查询请求后,将符合标签的企业相关信息发送至页面。2.根据权利要求1所述的企业挖掘方法,其特征在于,所述方法还包括:按照预设的指标体系,定义标签的口径;基于定义的口径,建立数据提取规则。3.根据权利要求2所述的企业挖掘方法,其特征在于,在获取到企业的信息后,基于数据提取规则提取企业的目标数据包括:利用数据提取规则,基于预设的基本属性指标,提取企业的信息中的基本属性信息,并为企业的基本属性信息进行打标;利用数据提取规则,基于预设的企业评价指标,提取企业的信息中的企业评价信息,并为企业评价信息进行打标;和/或,利用数据提取规则,基于预设的企业评价指标,提取企业的信息中的具体行为信息,并为具体行为信息进行打标。4.根据权利要求1所述的企业挖掘方法,其特征在于,在接收到页面发送的标签查询请求后,将符合标签的企业相关发送至页面包括:在接收到通过页面选定的标签后,从数据库中检索与选定的标签相符的企业相关信息发送至页面;和/或,在接收到通过页面输入的关键字后,从数据库中检索与所述关键字相符的企业相关信息发送至页面。5.根据权利要求1所述的企业挖掘方法,其特征在于,方法还包括:接收页面的企业定制条件,其中,所述定制条件选定的标签确定;每隔预设的时间向页面推送符合定制条件的企业的相关信息。6.一种企业挖掘装置,其特征在于,包括:标签单元,被配置成在获取到企业的信息后,利用数据提取规则提取企业的目标数据,并基于目标数据为企业生成对应的标签;确定单元,被配置成在接收到页面发送的标签查询请求后,将符合标签的企业相关信息发送至页面。7.根据权利要求6所述的企业挖掘装置,其特征在于,所述装置还包括:定义单元,被配置成按照预设的指标体系,定义标签的口径;规则建立单元,被配置成基于定义的口径,建立数据提取规则。8.根据权利要求6所述的企业挖掘装置,其特征在于,在获取到企业的信息后,基于数据提取规则提取企业的目标数据包括:利用数据提取规则,基于预设的基本属性指标,提取企业的信息中的基本属性信息,并为企业的基本属性信息进行打标;利用数据提取规则,基于预设的企业评价指标,提取企业的信息中的企业评价信息,并为企业评价信息进行打标;和/或,利用数据提取规则,基于预设的企业评价指标,提取企业的信息中的具体行为
信息,并为具体行为信息进行打标。9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1-6任意一项所述的企业挖掘方法。10.一种电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行权利要求1-6任意一项所述的企业挖掘方法。

技术总结
本公开公开了一种企业挖掘方法及装置,其中方法首先在获取到企业的信息后,利用数据提取规则提取企业的目标数据,并基于目标数据为企业生成对应的标签;而后在接收到页面发送的标签查询请求后,将符合标签的企业相关信息发送至页面。通过建立企业的标签,进而通过查询标签的方式,实现企业挖掘,能够快速的确定企业的特征,精准地了解企业,进而解决了相关技术中,企业挖掘时间长,效率低的问题。效率低的问题。效率低的问题。


技术研发人员:宋仲伟 张庆 高欣
受保护的技术使用者:量子数聚(北京)科技有限公司
技术研发日:2021.11.15
技术公布日:2022/3/8

最新回复(0)