1.本技术涉及一种身份识别方法,尤其涉及一种蓝牙通信的身份识别方法、系统、计算机及存储介质,属于蓝牙通信的身份识别技术领域。
背景技术:
2.蓝牙主从设备遵循蓝牙协议进行加密通信,蓝牙芯片在数据流处理的设计方面的特点造成了当主设备在变换操作时蓝牙芯片需要消耗时间重新构建写入新的指令的数据包,进而导致数据包在通信传输过程中的时间间隔序列存在微小时差突变。变换操作后蓝牙设备发送的第一个数据包与之前的数据包的时间间隔会瞬间拉大,最后逐渐恢复。因此,与操作相对应的数据包序列之间的时间间隔、数据包数量和数据包间隔不平稳的持续时间是不同的。这些特征数据包组合之间存在大量的非有效数据包即白噪声,反复执行相同操作或操作切换时不同用户的白噪声不同。目前,如果想要对用户进行身份判定,需要通过长时间采集用户的行为习惯与行为特征对用户进行刻画,并且只有当用户进行一系列长时间的操作才能实现对用户身份的识别。
3.但是,当前还没有只通过对单一或几个操作之间的白噪声的分析实现对蓝牙通信的用户的身份识别的方法。
技术实现要素:
4.在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
5.鉴于此,为解决现有技术中存在的用户画像所需时间长、难度大、效率低的技术问题,本发明提供一种蓝牙通信的身份识别方法、系统、计算机及存储介质。
6.方案一:本发明提供了一种蓝牙通信的身份识别方法,通过加密通信的数据流量特征与当前设备的使用者的对应,根据行为习惯对用户进行画像,进而判定执行当前操作行为的用户身份;具体包括以下步骤:
7.步骤一、收集白噪声及白噪声相连的平滑操作的时钟抖动数据,并对收集到的数据进行组合与长度均一化处理,获得与原特征一致且长度一致的白噪声和与白噪声相连的平滑操作的时钟抖动数据流量;
8.步骤二、分别以白噪声抖动数据的数据包的数量与数据包两两之间的时间间隔作为白噪声数据流量特征,对于与白噪声相连的平滑操作的抖动数据的数据包的数量和数据包两两时间间隔作为与白噪声相连的平滑操作的数据流量特征,利用核函数通过非线性特征映射函数与线性主成分分析分别对处理后的两类时钟抖动数据流量的细节特征进行挖掘与分类;
9.步骤三、利用步骤二中优化的线性主成分分析方法对需进行身份判别的未知用户
数据流量特征进行判别预测,从而实现身份识别。
10.优选的,步骤一收集白噪声及白噪声相连的平滑操作的时钟抖动数据,并对收集到的数据进行组合与长度均一化处理的具体方法,包括以下步骤:
11.步骤一一、记录数据包到达时间和主设备向从设备每秒发送的字节量,并对破碎数据和丢包情况进行平滑处理;
12.步骤一二、根据蓝牙设备特性,将流量数据的时间抖动区分为操作时时对应流量数据和不对应操作的白噪声;
13.步骤一二、将对应的连续的数据包时间间隔的时钟抖动进行组合,进而获得不对应操作的白噪声数据流量以及与白噪声相连的平滑操作的数据流量;
14.步骤一三、将白噪声时钟抖动数据流量和与白噪声相连的平滑操作的时钟抖动数据流量分别组合在一起;
15.步骤一四、对白噪声时钟抖动数据流量和与白噪声相连的平滑操作的时钟抖动数据流量进行傅里叶变换,将离散点转换至频域,在频域上均匀采样20个点,对采样点进行傅里叶逆变换,得到数据长度相等且原始特征不变的时钟抖动数据;
16.步骤一五、分别获得与原特征一致而又长度一致的白噪声和与白噪声相连的平滑操作的时钟抖动数据流量。
17.优选的,步骤二所述对处理后的数据流量的细节特征进行挖掘与分析的具体方法是:
18.步骤二一、利用核函数通过非线性特征映射函数将由样本库用户流量数据特征构成的训练集映射到高维空间,可用函数为径向基函数(rbf)与sigmoid函数,rbf公式为:其中x
t
为球形核的中心,x为属性向量,s为超参数;sigmoid函数公式为:k(x
t
,x)=tanh(γx
t
x
t
+r),其中γ和r为超参数;
19.步骤二二、以映射到高维空间的训练集为特征矩阵,计算协方差矩阵,根据映射结果选择主成分,通过线性主成分分析将转换后的训练集投影到二维平面,根据线性主成分分析结果起始值,通过迭代收敛对降维的数据集进行非线性回归和分类;
20.步骤二三、通过10倍交叉验证分析两类数据流的由训练集构成的验证集,对步骤二二中的方法进行准确性验证与优化;
21.优选的,步骤三所述对需进行身份判别的未知用户数据流量特征进行判别预测的具体方法是,包括以下步骤:
22.步骤三一、利用步骤二一中的优化参数的核函数通过非线性特征映射函数将需进行身份判别的未知用户流量数据特征构成的测试集映射到高维空间;
23.步骤三二、根据步骤二三中的优化的主成分设置,通过线性主成分分析将转换后的测试集投影到二维平面,进行非线性回归和分类预测,输出分类结果。
24.优选的,步骤一四所述对白噪声时钟抖动数据流量和与白噪声相连的平滑操作的时钟抖动数据流量进行傅里叶变换的具体方法是,通过下述公式实现:
[0025][0026]
其中x(n)为数据流量,n为数据流量的长度。
[0027]
优选的,步骤一四所述采样点进行傅里叶逆变换的具体方法是,通过下述公式实现:
[0028][0029]
方案二、一种蓝牙通信的身份识别系统,包括时钟抖动数据流量处理模块和流量特征机器学习模块;时钟抖动数据流量处理模块用于白噪声及与白噪声相连的平滑操作的时钟抖动数据收集、组合与长度均一化处理;所述流量特征机器学习模块用于对时钟抖动数据流量处理模块输出的时钟抖动数据流量的细节特征进行挖掘与分析,实现对不同用户的身份识别。
[0030]
方案三:一种计算机,包括存储器和处理器,存储器存储有计算机程序,所述的处理器执行所述计算机程序时实现方案一所述一种对蓝牙通信的身份识别方法的步骤。
[0031]
方案四:一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现方案一所述一种对蓝牙通信的身份识别。
[0032]
本发明的有益效果如下:本发明在不暴力破解蓝牙加密通信的情况下,通过对白噪声或白噪声相连的平滑操作的时钟抖动数据长度的均一化处理,利用基于径向基函数的机器学习模型,实现对蓝牙通信的身份识别,无需将密文数据流量特征与用户操作进行对应,并可以从短时间低频率的操作中判断蓝牙通讯当前用户是否为常用用户,并能够进行身份识别。这大大降低了蓝牙加密通信身份识别所需要的设备成本,且仅需更新训练集内容,具有通用性和可推广性,极大的提高了蓝牙通信身份识别的效率,低成本的发明极大地方便了技术研究者对蓝牙通信用户行为与身份的研究。解决现有技术中存在的用户画像所需时间长、难度大、效率低的技术问题。
附图说明
[0033]
此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
[0034]
图1为方法流程示意图;
[0035]
图2为步骤一流程示意图;
[0036]
图3为组合不同用户的白噪声的时钟抖动数据流量示意图;
[0037]
图4为组合不同用户的与白噪声相连的平滑移动的时钟抖动数据流量示意图;
[0038]
图5为不同用户经处理后长度一致的白噪声及的时钟抖动数据流量示意图;
[0039]
图6为不同用户经处理后长度一致的与白噪声相连的平滑移动的时钟抖动数据流量示意图。
具体实施方式
[0040]
为了使本技术实施例中的技术方案及优点更加清楚明白,以下结合附图对本技术的示例性实施例进行进一步详细的说明,显然,所描述的实施例仅是本技术的一部分实施例,而不是所有实施例的穷举。需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。
[0041]
实施例1、参照图1-图6说明本实施方式,一种蓝牙通信的身份识别方法,通过加密
通信的数据流量特征与当前设备的使用者的对应,根据行为习惯对用户进行画像,进而判定执行当前操作行为的用户身份;
[0042]
首先,记录数据包到达时间和主设备向从设备每秒发送的字节量,并对破碎数据和丢包情况进行平滑处理。蓝牙芯片在数据流处理的设计方面的特点导致变换操作后蓝牙设备发送的第一个数据包与之前的数据包的时间间隔会瞬间拉大,而后逐渐恢复。根据该蓝牙设备常发生的连续操作与可发生的操作,将对应的连续的数据包时间间隔的时钟抖动进行组合,进而获得不对应操作的白噪声数据流量以及与白噪声相连的平滑操作的数据流量。
[0043]
而后,将白噪声时钟抖动数据流量和与白噪声相连的平滑操作的时钟抖动数据流量分别组合在一起。对这两种数据进行傅里叶变换,公式为:其中x(n)为数据流量,n为数据流量的长度,转换后将离散点转换到频域。根据奈奎斯特定理,在频域中均匀采样大于时钟抖动个数的采样点。对这些采样点再进行傅里叶逆变换,公式为:分别获得与原特征一致而又长度一致的白噪声和与白噪声相连的平滑操作的时钟抖动数据流量。
[0044]
例如,利用无线电平台捕获蓝牙鼠标与电脑间的蓝牙通信数据,想要对当前用户身份进行识别。由于不同用户使用鼠标的习惯不同,即用户依据本能会在操作鼠标前将鼠标调整至最舒适的状态,而由于人的手型与肌肉力量的不同,将鼠标握至最适状态的姿势不同,导致了操作前的抖动细节特征的不同,即白噪声的时钟抖动数据流量差异。此外,由于用户会在开始操作前调整手部姿势与鼠标位置以便于行动,该过程中调整手部姿势与寻找手臂支点这两个动作并不同时发生,即该过程包含白噪声和紧随其后的平滑移动。提取白噪声及与白噪声相连的平滑移动的时钟抖动数据流量,如图3与图4所示。分别获得了用户集与当前用户的长度一致的白噪声及与白噪声相连的平滑移动的时钟抖动数据流量,如图5和图6所示。
[0045]
针对处理后的时钟抖动数据流量的特征,分别采用能够学习样本相似度特征长度尺度的径向基函数(rbf)和适用于特征复杂差异情况的sigmoid函数作为核函数进行核主成分分析。其中,径向基函数为:rbf:其中x
t
为球形核的中心,x为属性向量,s为超参数;sigmoid函数为:
[0046]
k(x
t
,x)=tanh(yx
t
x
t
+r),其中y和r为超参数。而后利用网格搜索获得使任务性能最佳的核心和参数,通过10倍交叉验证分析两类数据流的测试集,通过比较两种核函数主成分分析对两类数据流的判别误差率,得出基于径向基函数的核主成分分析方法更好地实现了蓝牙通信的身份识别。
[0047]
实施例2、一种蓝牙通信的身份识别系统,包括时钟抖动数据流量处理模块和流量特征机器学习模块;时钟抖动数据流量处理模块用于白噪声及与白噪声相连的平滑操作的
时钟抖动数据收集、组合与长度均一化处理;所述流量特征机器学习模块用于对时钟抖动数据流量处理模块输出的时钟抖动数据流量的细节特征进行挖掘与分析,实现对不同用户的身份识别。
[0048]
本发明的时钟抖动数据流量处理模块和流量特征机器学习模块为顺序层次结构,在蓝牙通讯身份识别过程中依次按顺序构成并执行数据分析与身份判定。
[0049]
具体的,时钟抖动数据流量处理模块主要负责白噪声及与白噪声相连的平滑操作的时钟抖动数据的收集、组合与长度均一化处理。该模块的准备工作为利用无线电平台获得的蓝牙通信过程中的无线通信流量。
[0050]
具体的,由于所获得的时钟抖动的数据维度较高,特征属性较复杂,利用核函数通过非线性特征映射函数将训练集映射到高维空间。而后根据映射结果选择主成分,通过线性主成分分析将转换后的训练集投影到二维平面,进行非线性回归和分类,从而实现对蓝牙通信的身份识别。
[0051]
本发明缩略语和关键术语的含义:
[0052]
蓝牙通讯:采用分散式网络结构以及快跳频和短包技术的支持设备短距离通信的无线电技术;
[0053]
身份识别:在一定场景下,通过加密通信的数据流量特征与当前设备的使用者的对应,根据行为习惯对用户进行画像,进而判定执行当前操作行为的用户身份;
[0054]
时钟抖动细节特征:蓝牙主设备进行非平稳操作时导致的数据包的时间间隔抖动的特征,其包含两个属性,包括数据包之间的时间间隔的大小的抖动,和不稳定时间间隔的数量的抖动;
[0055]
核主成分分析:一种通过一个非线性映射——核函数把原始空间的数据投影到高维特征空间,然后在高维特征空间中进行基于主成分分析的数据处理的非线性数据处理方法。
[0056]
本发明的优势:
[0057]
在不暴力破解蓝牙通讯与不破解密文数据的基础上,不需要当前用户长时间高频率操作,通过分析白噪声以及与白噪声相连的平滑操作的时钟抖动数据流量,利用基于核主成分分析的机器学习方法高效地对蓝牙通讯用户身份进行判定。
[0058]
本发明的关键点:
[0059]
1.利用处理后等长度的白噪声或与白噪声相连的平滑操作的时钟抖动数据对用户进行刻画;
[0060]
2.通过通用的基于核主成分分析数据流量特征机器学习模块,高效地解决了蓝牙通讯的身份识别问题。
[0061]
实施例3、本发明的计算机装置可以是包括有处理器以及存储器等装置,例如包含中央处理器的单片机等。并且,处理器用于执行存储器中存储的计算机程序时实现上述的基于creo软件的可修改由关系驱动的推荐数据的推荐方法的步骤。
[0062]
所称处理器可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、
分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0063]
所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0064]
实施例4、计算机可读存储介质实施例
[0065]
本发明的计算机可读存储介质可以是被计算机装置的处理器所读取的任何形式的存储介质,包括但不限于非易失性存储器、易失性存储器、铁电存储器等,计算机可读存储介质上存储有计算机程序,当计算机装置的处理器读取并执行存储器中所存储的计算机程序时,可以实现上述的基于creo软件的可修改由关系驱动的建模数据的建模方法的步骤。
[0066]
所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
[0067]
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。
技术特征:
1.一种蓝牙通信的身份识别方法,其特征在于,通过加密通信的数据流量特征与当前设备的使用者的对应,根据行为习惯对用户进行画像,进而判定执行当前操作行为的用户身份;具体包括以下步骤:步骤一、收集白噪声及白噪声相连的平滑操作的时钟抖动数据,并对收集到的数据进行组合与长度均一化处理,获得与原特征一致且长度一致的白噪声和与白噪声相连的平滑操作的时钟抖动数据流量;步骤二、分别以白噪声抖动数据的数据包及与白噪声相连的平滑操作的时钟抖动数据包数量和时间间隔作为细节特征,利用核函数通过非线性特征映射函数与线性主成分分析对处理后的两类时钟抖动数据流量的细节特征进行挖掘与分类;步骤三、利用步骤二中优化的线性主成分分析方法对需进行身份判别的未知用户数据流量特征进行判别预测,从而实现身份识别。2.根据权利要求1所述的身份识别方法,其特征在于,步骤一搜书收集白噪声及白噪声相连的平滑操作的时钟抖动数据,并对收集到的数据进行组合与长度均一化处理的具体方法,包括以下步骤:步骤一一、记录数据包到达时间和主设备向从设备每秒发送的字节量,并对破碎数据和丢包情况进行平滑处理;步骤一二、根据蓝牙设备特性,将流量数据的时间抖动区分为操作时时对应流量数据和不对应操作的白噪声;步骤一二、将对应的连续的数据包时间间隔的时钟抖动进行组合,进而获得不对应操作的白噪声数据流量以及与白噪声相连的平滑操作的数据流量;步骤一三、将白噪声时钟抖动数据流量和与白噪声相连的平滑操作的时钟抖动数据流量分别组合在一起;步骤一四、对白噪声时钟抖动数据流量和与白噪声相连的平滑操作的时钟抖动数据流量进行傅里叶变换,将离散点转换至频域,在频域上均匀采样20个点,对采样点进行傅里叶逆变换,得到数据长度相等且原始特征不变的时钟抖动数据;步骤一五、分别获得与原特征一致而又长度一致的白噪声和与白噪声相连的平滑操作的时钟抖动数据流量。3.根据权利要求1所述的身份识别方法,其特征在于,步骤二所述对处理后的数据流量的细节特征进行挖掘与分析的具体方法是:步骤二一、利用核函数通过非线性特征映射函数将由样本库用户流量数据特征构成的训练集映射到高维空间;步骤二二、以映射到高维空间的训练集为特征矩阵,计算协方差矩阵,根据映射结果选择主成分,通过线性主成分分析将转换后的训练集投影到二维平面,根据线性主成分分析结果起始值,通过迭代收敛对降维的数据集进行非线性回归和分类;步骤二三、通过10倍交叉验证分析两类数据流的由部分训练集构成的验证集,对步骤二二中的方法进行准确性验证与优化。4.根据权利要求1所述的身份识别方法,其特征在于,步骤三所述对需进行身份判别的未知用户数据流量特征进行判别预测的具体方法是,包括以下步骤:步骤三一、利用步骤二一中的核函数通过非线性特征映射函数将需进行身份判别的未
知用户流量数据特征构成的测试集映射到高维空间;步骤三二、根据步骤二三中的优化方法,通过线性主成分分析将转换后的测试集投影到二维平面,进行非线性回归和分类预测,输出分类结果。5.根据权利要求2所述的身份识别方法,其特征在于,步骤一四所述对白噪声时钟抖动数据流量和与白噪声相连的平滑操作的时钟抖动数据流量进行傅里叶变换的具体方法是,通过下述公式实现:其中x(n)为数据流量,n为数据流量的长度。6.根据权利要求2所述的身份识别方法,其特征在于,步骤一四所述采样点进行傅里叶逆变换的具体方法是,通过下述公式实现:7.一种蓝牙通信的身份识别系统,其特征在于,包括时钟抖动数据流量处理模块和流量特征机器学习模块;时钟抖动数据流量处理模块用于白噪声及与白噪声相连的平滑操作的时钟抖动数据收集、组合与长度均一化处理;所述流量特征机器学习模块用于对时钟抖动数据流量处理模块输出的时钟抖动数据流量的细节特征进行挖掘与分析,实现对不同用户的身份识别。8.一种计算机,其特征在于,包括存储器和处理器,存储器存储有计算机程序,所述的处理器执行所述计算机程序时实现权利要求1至6任一项所述的身份识别方法的步骤。9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6任一项所述的身份识别方法。
技术总结
本发明提出一种蓝牙通信的身份识别方法、系统、计算机及存储介质,属于蓝牙通信的身份识别技术领域。面对蓝牙主设备向从设备发出的大量的流量,通过流量分析区分操作流量、操作白噪声以及伴随白噪声的平滑操作的数据流量,提取操作白噪声以及与白噪声相连的平滑操作的时钟抖动数据流量并分别进行组合;对组合后的两类时钟抖动数据流量分别进行傅里叶变换,得到数据长度相等且原始特征不变的时钟抖动数据。利用核主成分分析将时钟抖动数据流量投影到二维平面,进行特征深入挖掘,实现对蓝牙通信用户精细特征挖掘和个人识别。解决现有技术中存在的用户画像所需时间长、难度大、效率低的技术问题。低的技术问题。低的技术问题。
技术研发人员:敖世亮 张宏莉 方滨兴 杨大千 肖新光 叶麟
受保护的技术使用者:安天科技集团股份有限公司
技术研发日:2021.12.14
技术公布日:2022/3/8