webpack文件敏感信息探测方法、装置、计算机设备和存储介质与流程

专利查询5月前  55



1.本技术涉及网络安全技术领域,特别是涉及一种webpack文件敏感信息探测方法、装置、计算机设备和计算机可读存储介质。


背景技术:

2.如今很多网页其实可以看做是功能丰富的应用,它们拥有着复杂的javascript代码和一大堆依赖包。为了简化开发的复杂度,webpack技术应运而生。webpack是开源的前端打包工具,可以看做是模块打包机,webpack通过分析项目结构,找到javascript模块以及其它的一些浏览器不能直接运行的拓展语言(scss,typescript等),并将其打包为合适的格式以供浏览器使用。在前后端分离的项目中通常使用webpack打包,经常会出现将敏感信息(例如:账号密码、或者未开放的网络地址)一同打包,若在webpack打包的代码上线的时候没有把这些敏感信息及时清理,这将会导致资产的暴露,进一步导致暴露的资产出现被攻击的风险。
3.现有技术中,在代码上线前通过人工探测webpack文件敏感信息,然而,人工探测费时费力,且人工操作还会带来不可避免的失误,存在webpack文件敏感信息探测效率低的问题。


技术实现要素:

4.基于此,有必要针对上述技术问题,提供一种webpack文件敏感信息探测方法、装置、计算机设备和计算机可读存储介质,以解决相关技术中存在的webpack文件敏感信息探测效率低的问题。
5.第一个方面,本技术实施例了一种webpack文件敏感信息探测方法,用于探测webpack打包的javascript文件中的敏感信息,所述方法包括以下步骤:
6.根据web页面中的javascript链接,获取所述web页面对应的初始javascript文件;
7.从所述初始javascript文件中筛选出所述webpack打包的javascript文件,即为webpack文件;
8.从所述webpack文件中提取敏感信息;所述敏感信息包括网络地址以及包含云存储密钥字段的相关字段。
9.在其中一些实施例中,根据web页面中的javascript链接,获取所述web页面对应的初始javascript文件,包括以下步骤:
10.获取所述web页面中的javascript链接;
11.对获取到的所述javascript链接进行去错;
12.对经过去错后,保留下的所述javascript链接进行访问,获取所述web页面对应的初始javascript文件。
13.在其中一些实施例中,所述对经过去错后,保留下的所述javascript链接进行访问,获取所述web页面对应的初始javascript文件,包括以下步骤:
14.对经过去错后的所述javascript链接进行去重;
15.对经过去重后保留下来的所述javascript链接进行访问,获取所述web页面对应的初始javascript文件。
16.在其中一些实施例中,所述获取所述web页面中的javascript链接,包括:
17.利用selenium无头浏览器访问所述web页面,获取所述web页面中的javascript链接。
18.在其中一些实施例中,所述从所述初始javascript文件中筛选出所述webpack打包的javascript文件,包括以下步骤:
19.从所述初始javascript文件中筛选出文件内容中包含webpackjsonp的javascript文件。
20.在其中一些实施例中,所述从所述webpack文件中提取敏感信息,包括以下步骤:
21.利用正则表达式从所述webpack文件中提取所述敏感信息。
22.在其中一些实施例中,所述方法还包括:
23.对提取出的所述敏感信息中的所述网络地址进行存活检测,判断所述网络地址是否存活;
24.若所述网络地址为非存活状态,则将所述网络地址从所述敏感信息中剔除。
25.第二个方面,在本实施例中提供了一种webpack文件敏感信息探测装置,用于探测webpack打包的javascript文件中的敏感信息,所述装置包括:获取模块、筛选模块和提取模块:
26.所述获取模块,用于根据web页面中的javascript链接,获取所述web页面对应的初始javascript文件;
27.所述筛选模块,用于从所述初始javascript文件中筛选出所述webpack打包的javascript文件,即为webpack文件;
28.所述提取模块,用于从所述webpack文件中提取敏感信息;所述敏感信息包括网络地址以及包含云存储密钥字段的相关字段。
29.第三个方面,在本实施例中提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一个方面所述方法的步骤。
30.第四个方面,在本实施例中提供了计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一个方面所述的方法的步骤。
31.上述webpack文件敏感信息探测方法、装置、计算机设备和计算机可读存储介质,通过根据web页面中的javascript链接,获取web页面对应的初始javascript文件;从初始javascript文件中筛选出webpack打包的javascript文件,即为webpack文件;从webpack文件中提取敏感信息;敏感信息包括网络地址以及包含云存储密钥字段的相关字段。本技术通过从当前web页面对应的javascript文件中筛选出webpack打包的javascript文件,并从中提取敏感信息,实现了webpack文件敏感信息探测完全自动化,有效提高webpack文件敏感信息探测效率。
附图说明
32.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
33.图1是根据本技术实施例提供的webpack文件敏感信息探测方法的应用场景图;
34.图2是根据本技术实施例提供的webpack文件敏感信息探测方法的流程图;
35.图3是根据本技术实施例提供的webpack文件敏感信息探测装置的结构示意图;
36.图4是根据本技术实施例提供的计算机设备的结构示意图。
具体实施方式
37.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。基于本技术提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。
38.显而易见地,下面描述中的附图仅仅是本技术的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本技术应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本技术公开的内容相关的本领域的普通技术人员而言,在本技术揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本技术公开的内容不充分。
39.在本技术中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本技术所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
40.除非另作定义,本技术所涉及的技术术语或者科学术语应当为本技术所属技术领域内具有一般技能的人士所理解的通常意义。本技术所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本技术所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本技术所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本技术所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本技术所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
41.图1为本技术一个实施例提供的webpack文件敏感信息探测方法的应用场景图。如图1所示,服务器101与移动终端102之间均可以通过网络进行数据传输。其中,移动终端102用于获取需要访问的web页面的链接,并将需要访问的web页面的链接传输至服务器101。服
务器101在获取到需要访问的web页面的链接之后,对web页面进行访问之后,根据web页面中的javascript链接,获取web页面对应的初始javascript文件;从初始javascript文件中筛选出webpack打包的javascript文件,即为webpack文件;从webpack文件中提取敏感信息;敏感信息包括网络地址以及包含云存储密钥字段的相关字段。服务器101可以由独立的服务器或者是多个服务器组成的服务器集群来实现,移动终端102可以为任意一种带输入功能的显示屏。
42.本实施例提供了一种webpack文件敏感信息探测方法,可用于探测webpack打包的javascript文件中的敏感信息,如图2所示,该方法包括以下步骤:
43.步骤s210,根据web页面中的javascript链接,获取web页面对应的初始javascript文件。
44.具体地,为了实现webpack文件敏感信息探测,web页面可以是提前指定的web页面,也可以是随机登录的web页面。web页面中有很多链接,其中javascript链接是以.js为后缀的网络链接,根据web页面中的javascript链接,对javascript链接进行访问,若javascript链接可以被访问,即可跳转至当前javascript链接对应的javascript文件对应的内容,可以将javascript文件下载到本地,或者复制javascript文件对应的内容,从而可以获取web页面对应的初始javascript文件。
45.步骤s220,从初始javascript文件中筛选出webpack打包的javascript文件,即为webpack文件。
46.具体地,webpack文件具有webpack文件相应的特征,可以根据webpack文件相应的特征从初始javascript文件中筛选出webpack打包的javascript文件。例如,webpack文件的内容通常包含webpackjsonp字段,可以从初始javascript文件中筛选出文件内容包含webpackjsonp字段的文件,即可获取到webpack文件。
47.步骤s230,从webpack文件中提取敏感信息;敏感信息包括网络地址以及包含云存储密钥字段的相关字段。
48.具体地,在前后端分离的项目中使用webpack打包时,webpack文件通常会将敏感信息一起打包,所以需要从webpack文件中将敏感信息提取出来,以便后续对敏感信息进行检测,检测敏感信息是否存在信息泄露。敏感信息包括网络地址以及包含云存储密钥字段的相关字段,网络地址的表现形式包括url和ip,云存储密钥字段为提前从各个云存储厂商那里采集到的,包括accesskey、oss、akia、aida等字段。作为其中一种实施方式,云存储密钥字段可以定期更新,从而不断适应新的网络环境。对于敏感信息的提取,可以根据正则表达式对网络地址和云存储密钥字段进行匹配,实现从webpack文件中提取敏感信息。也可以根据tf-idf算法从webpack文件中挖掘网络地址和云存储密钥字段实现敏感信息提取。此外,在提取到敏感信息之后,可以将敏感信息进行整合,例如进行去重等操作,输出webpack文件的风险评估报告,给相关技术人员进行参考。
49.现有技术中,在代码上线前通过人工探测webpack文件敏感信息,然而,人工探测费时费力,且人工操作还会带来不可避免的失误,存在webpack文件敏感信息探测效率低的问题。本技术通过根据web页面中的javascript链接,获取web页面对应的初始javascript文件;从初始javascript文件中筛选出webpack打包的javascript文件,即为webpack文件;从webpack文件中提取敏感信息;敏感信息包括网络地址以及包含云存储密钥字段的相关
字段。本技术通过从当前web页面对应的javascript文件中筛选出webpack打包的javascript文件,并从中提取敏感信息,实现了webpack文件敏感信息探测完全自动化,有效提高webpack文件敏感信息探测效率。
50.在其中一个实施例中,上述步骤s210,根据web页面中的javascript链接,获取web页面对应的初始javascript文件,具体包括以下步骤:
51.步骤s211,获取web页面中的javascript链接。
52.步骤s212,对获取到的javascript链接进行去错。
53.步骤s213,对经过去错后,保留下的javascript链接进行访问,获取web页面对应的初始javascript文件。
54.具体地,可以对web页面进行扫描匹配,从而获取web页面中的javascript链接。获取到的javascript链接可能出现不能访问的情况,例如javascript链接不完整或者javascript链接失效等,对javascript链接进行去错,剔除那些不能访问的javascript链接,保留能够访问的javascript链接进行访问,从而获取web页面对应的初始javascript文件,可有效提高初始javascript文件的获取效率。
55.进一步地,在其中一个实施例中,上述步骤s213,对经过去错后,保留下的javascript链接进行访问,获取web页面对应的初始javascript文件,包括以下步骤:
56.对经过去错后的javascript链接进行去重;
57.对经过去重后保留下来的javascript链接进行访问,获取web页面对应的初始javascript文件。
58.具体地,从当前web页面中获取到的javascript链接难免会出现重复的情况,对于相同的javascript链接,对应的初始javascript文件是相同的,对于相同的初始javascript文件提取的敏感信息必定也是相同的,所以相同的初始javascript文件不需要重复获取。在本实施例中对web页面中经过去错后的javascript链接进行去重,对经过去重后保留下来的javascript链接进行访问,获取web页面对应的初始javascript文件,可进一步有效提高初始javascript文件的获取效率。
59.在其中一个实施例中,上述步骤s211,获取web页面中的javascript链接,包括以下步骤:
60.利用selenium无头浏览器访问web页面,获取web页面中的javascript链接。
61.具体地,selenium无头浏览器可以模拟真实的浏览器使用场景,无需用户界面即可运行,相比于利用真实的浏览器访问web界面,利用selenium无头浏览器可实现更快速地访问web页面,从而可以以更快的速度获取web页面中的javascript链接,从而提高webpack文件敏感信息探测效率。
62.作为其中一种实施方式,上述步骤s220,从初始javascript文件中筛选出webpack打包的javascript文件,包括以下步骤:
63.从初始javascript文件中筛选出文件内容中包含webpackjsonp的javascript文件。
64.具体地,webpack打包的javascript文件的内容包含webpackjsonp,通过此特征可有效从初始javascript文件中筛选出webpack打包的javascript文件。
65.作为其中一种实施方式,上述步骤s230,从webpack文件中提取敏感信息包括以下
步骤:
66.利用正则表达式从webpack文件中提取敏感信息。
67.具体地,利用正则表达式提取webpack文件中的网络地址,网络地址通常包括ip和url,利用正则表达式提取webpack文件中所有的url,所用的正则表达式的形式如下:r’https://.*|http://.*’,对于webpack文件中所有的ip的提取,所用的正则表达式的形式如下:r’(([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\\.){3}([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])’。利用正则表达式提取webpack文件中的云存储字段的相关字段,例如,利用正则表达式提取accesskeyid的相关字段,所用的正则表达式的形式如下:r'.*accesskeyid.*’.*’,通过以上方式可有效实现敏感信息的提取。
[0068]
在其中一个实施例中,本技术提供的webpack文件敏感信息探测方法,还包括以下步骤:
[0069]
对提取出的敏感信息中的网络地址进行存活检测,判断网络地址是否存活;
[0070]
若网络地址为非存活状态,则将网络地址从敏感信息中剔除。
[0071]
具体地,从webpack文件中提取的网络地址可能是非存活状态,这样的网络地址不存在信息泄露的可能,所以可以将非存活的网络地址从敏感信息的队伍里剔除。为了验证网络地址是否为存活状态,可以对的网络地址发起网络请求,包括提取到的所有url和ip,并验证返回状态码,若返回的状态码不为200,即证明当前网络地址为非存活状态,若当前网络地址为非存活状态,此说明当前网络地址不可能存在信息泄露,则将当前网络地址从敏感信息中剔除,有效减少后续对敏感信息的处理操作。
[0072]
作为其中一种实施方式,在从webpack文件中提取到敏感信息之后,进一步对敏感信息进行验证,判断是否存在信息泄露,若存在信息泄露,则指示相关技术人员对webpack文件进行整改,从而保证webpack文件的信息安全。
[0073]
本实施例还提供了一种webpack文件敏感信息探测方法,该方法包括以下步骤:
[0074]
步骤s310,利用selenium无头浏览器访问web页面,获取web页面中的javascript链接。
[0075]
步骤s320,对获取到的javascript链接进行去错和去重,对经过去错和去重后,保留下的javascript链接进行访问,获取web页面对应的初始javascript文件。
[0076]
步骤s330,从初始javascript文件中筛选出webpack打包的javascript文件,即为webpack文件。
[0077]
步骤s340,利用正则表达式从webpack文件中提取敏感信息;敏感信息包括网络地址以及包含云存储密钥字段的相关字段。
[0078]
步骤s350,对提取出的敏感信息中的网络地址进行存活检测,判断网络地址是否存活;若网络地址为非存活状态,则将网络地址从敏感信息中剔除。
[0079]
步骤s360,根据提取出的敏感信息输出webpack文件的风险评估报告。
[0080]
图3是根据本发明实施例中webpack文件敏感信息探测装置的示意图,如图3所示,提供了一种webpack文件敏感信息探测装置30,该装置包括获取模块31、筛选模块32和提取模块33:
[0081]
获取模块31,用于根据web页面中的javascript链接,获取web页面对应的初始javascript文件;
[0082]
筛选模块32,用于从初始javascript文件中筛选出webpack打包的javascript文件,即为webpack文件;
[0083]
提取模块33,用于从webpack文件中提取敏感信息;敏感信息包括网络地址以及包含云存储密钥字段的相关字段。
[0084]
上述webpack文件敏感信息探测装置30,通过根据web页面中的javascript链接,获取web页面对应的初始javascript文件;从初始javascript文件中筛选出webpack打包的javascript文件,即为webpack文件;从webpack文件中提取敏感信息;敏感信息包括网络地址以及包含云存储密钥字段的相关字段。本技术通过从当前web页面对应的javascript文件中筛选出webpack打包的javascript文件,并从中提取敏感信息,实现了webpack文件敏感信息探测完全自动化,有效提高webpack文件敏感信息探测效率。
[0085]
在其中一个实施例中,获取模块31还用于获取web页面中的javascript链接;
[0086]
对获取到的javascript链接进行去错;
[0087]
对经过去错后,保留下的javascript链接进行访问,获取web页面对应的初始javascript文件。
[0088]
在其中一个实施例中,获取模块31还用于对经过去错后的javascript链接进行去重;
[0089]
对经过去重后保留下来的javascript链接进行访问,获取web页面对应的初始javascript文件。
[0090]
在其中一个实施例中,获取模块31还用于利用selenium无头浏览器访问web页面,获取web页面中的javascript链接。
[0091]
在其中一个实施例中,筛选模块32还用于从初始javascript文件中筛选出文件内容中包含webpackjsonp的javascript文件。
[0092]
在其中一个实施例中,提取模块33还用于利用正则表达式从webpack文件中提取敏感信息。
[0093]
在其中一个实施例中,webpack文件敏感信息探测装置30还包括验证模块,用于对提取出的敏感信息中的网络地址进行存活检测,判断网络地址是否存活;
[0094]
若网络地址为非存活状态,则将网络地址从敏感信息中剔除。
[0095]
需要说明地是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件实现,也可以通过硬件来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0096]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储预设配置信息集合。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现上述webpack文件敏感信息探测方法。
[0097]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种webpack文件敏感信息探测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
[0098]
本领域技术人员可以理解,图4中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0099]
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
[0100]
根据web页面中的javascript链接,获取web页面对应的初始javascript文件;
[0101]
从初始javascript文件中筛选出webpack打包的javascript文件,即为webpack文件;
[0102]
从webpack文件中提取敏感信息;敏感信息包括网络地址以及包含云存储密钥字段的相关字段。
[0103]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
[0104]
获取web页面中的javascript链接;
[0105]
对获取到的javascript链接进行去错;
[0106]
对经过去错后,保留下的javascript链接进行访问,获取web页面对应的初始javascript文件。
[0107]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
[0108]
对经过去错后的javascript链接进行去重;
[0109]
对经过去重后保留下来的javascript链接进行访问,获取web页面对应的初始javascript文件。
[0110]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
[0111]
利用selenium无头浏览器访问web页面,获取web页面中的javascript链接。
[0112]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
[0113]
从初始javascript文件中筛选出文件内容中包含webpackjsonp的javascript文件。
[0114]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
[0115]
利用正则表达式从webpack文件中提取敏感信息。
[0116]
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
[0117]
对提取出的敏感信息中的网络地址进行存活检测,判断网络地址是否存活;
[0118]
若网络地址为非存活状态,则将网络地址从敏感信息中剔除。
[0119]
上述存储介质,通过根据web页面中的javascript链接,获取web页面对应的初始
javascript文件;从初始javascript文件中筛选出webpack打包的javascript文件,即为webpack文件;从webpack文件中提取敏感信息;敏感信息包括网络地址以及包含云存储密钥字段的相关字段。本技术通过从当前web页面对应的javascript文件中筛选出webpack打包的javascript文件,并从中提取敏感信息,实现了webpack文件敏感信息探测完全自动化,有效提高webpack文件敏感信息探测效率。
[0120]
应该明白的是,这里描述的具体实施例只是用来解释这个应用,而不是用来对它进行限定。根据本技术提供的实施例,本领域普通技术人员在不进行创造性劳动的情况下得到的所有其它实施例,均属本技术保护范围。
[0121]
显然,附图只是本技术的一些例子或实施例,对本领域的普通技术人员来说,也可以根据这些附图将本技术适用于其他类似情况,但无需付出创造性劳动。另外,可以理解的是,尽管在此开发过程中所做的工作可能是复杂和漫长的,但是,对于本领域的普通技术人员来说,根据本技术披露的技术内容进行的某些设计、制造或生产等更改仅是常规的技术手段,不应被视为本技术公开的内容不足。
[0122]“实施例”一词在本技术中指的是结合实施例描述的具体特征、结构或特性可以包括在本技术的至少一个实施例中。该短语出现在说明书中的各个位置并不一定意味着相同的实施例,也不意味着与其它实施例相互排斥而具有独立性或可供选择。本领域的普通技术人员能够清楚或隐含地理解的是,本技术中描述的实施例在没有冲突的情况下,可以与其它实施例结合。
[0123]
以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对专利保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术的保护范围应以所附权利要求为准。

技术特征:
1.一种webpack文件敏感信息探测方法,用于探测webpack打包的javascript文件中的敏感信息,其特征在于,所述方法包括以下步骤:根据web页面中的javascript链接,获取所述web页面对应的初始javascript文件;从所述初始javascript文件中筛选出所述webpack打包的javascript文件,即为webpack文件;从所述webpack文件中提取敏感信息;所述敏感信息包括网络地址以及包含云存储密钥字段的相关字段。2.根据权利要求1所述的webpack文件敏感信息探测方法,其特征在于,根据web页面中的javascript链接,获取所述web页面对应的初始javascript文件,包括以下步骤:获取所述web页面中的javascript链接;对获取到的所述javascript链接进行去错;对经过去错后,保留下的所述javascript链接进行访问,获取所述web页面对应的初始javascript文件。3.根据权利要求2所述的webpack文件敏感信息探测方法,其特征在于,所述对经过去错后,保留下的所述javascript链接进行访问,获取所述web页面对应的初始javascript文件,包括以下步骤:对经过去错后的所述javascript链接进行去重;对经过去重后保留下来的所述javascript链接进行访问,获取所述web页面对应的初始javascript文件。4.根据权利要求2所述的webpack文件敏感信息探测方法,其特征在于,所述获取所述web页面中的javascript链接,包括:利用selenium无头浏览器访问所述web页面,获取所述web页面中的javascript链接。5.根据权利要求1至4任一项所述的webpack文件敏感信息探测方法,其特征在于,所述从所述初始javascript文件中筛选出所述webpack打包的javascript文件,包括以下步骤:从所述初始javascript文件中筛选出文件内容中包含webpackjsonp的javascript文件。6.根据权利要求1至4任一项所述的webpack文件敏感信息探测方法,其特征在于,所述从所述webpack文件中提取敏感信息,包括以下步骤:利用正则表达式从所述webpack文件中提取所述敏感信息。7.根据权利要求1至4任一项所述的webpack文件敏感信息探测方法,其特征在于,所述方法还包括:对提取出的所述敏感信息中的所述网络地址进行存活检测,判断所述网络地址是否存活;若所述网络地址为非存活状态,则将所述网络地址从所述敏感信息中剔除。8.一种webpack文件敏感信息探测装置,用于探测webpack打包的javascript文件中的敏感信息,其特征在于,所述装置包括:获取模块、筛选模块和提取模块:所述获取模块,用于根据web页面中的javascript链接,获取所述web页面对应的初始javascript文件;所述筛选模块,用于从所述初始javascript文件中筛选出所述webpack打包的
javascript文件,即为webpack文件;所述提取模块,用于从所述webpack文件中提取敏感信息;所述敏感信息包括网络地址以及包含云存储密钥字段的相关字段。9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。

技术总结
本申请涉及webpack文件敏感信息探测方法、装置、计算机设备和计算机可读存储介质,通过根据web页面中的JavaScript链接,获取web页面对应的初始JavaScript文件;从初始JavaScript文件中筛选出webpack打包的JavaScript文件,即为webpack文件;从webpack文件中提取敏感信息;敏感信息包括网络地址以及包含云存储密钥字段的相关字段。本申请通过从当前web页面对应的JavaScript文件中筛选出webpack打包的JavaScript文件,并从中提取敏感信息,实现了webpack文件敏感信息探测完全自动化,有效提高webpack文件敏感信息探测效率。率。率。


技术研发人员:张江湖 范渊 刘博
受保护的技术使用者:杭州安恒信息技术股份有限公司
技术研发日:2021.12.03
技术公布日:2022/3/8

最新回复(0)