一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种多属性物理层认证方法、装置、终端及存储介质

2022-11-16 12:29:31 来源:中国专利 TAG:


1.本发明涉及通信安全技术领域,尤其涉及一种多属性物理层认证方法、装置、终端及存储介质。


背景技术:

2.物理层认证的主要原理是利用通信链路和设备的物理层属性如信道状态信息(csi,channel state information)、信号接收强度(rss,received signal strength)、到达角(aoa,angle of arrival)和载波频率偏差(cfo,carrier frequency offset)来作为识别签名进行认证,这些物理层属性与通信设备和相应的物理环境直接相关,因此很难进行模拟和预测。然而,物理层属性可能会被不完全估计或被噪声破坏,导致不可靠的物理层认证。
3.近年来,许多研究开始利用多观测、多属性来增强物理层认证的鲁棒性,由于多观测或多属性为合法收发机提供了额外的可识别性,攻击者模拟所有属性的概率极低,此类方法能够得到较准确的认证效果。目前,存在两类方法用于组合多个物理层属性来进行身份认证,第一种是非参数方法,具体是通过训练样本来建立多属性认证模型;第二种是参数方法,具体是通过设置一种系统表达式的形式来组合多个物理层属性。其中,参数类方法不需要大量的训练样本且具有计算负担小的优点,但是系统表达式的选择会对认证结果产生极大的影响,适应性较差。而非参数方法不需要对于认证模型进行预先设置,具有更强的适应性,但会受属性个数的增加以及属性相关性的影响而需要大量的训练样本,前期准备工作复杂。因此,目前的物理层认证方法存在难以兼顾效果好和复杂度低的问题。


技术实现要素:

4.本发明实施例提供了一种多属性物理层认证方法、装置、终端及存储介质,以解决物理层认证方法难以兼顾效果好和复杂度低的问题。
5.第一方面,本发明实施例提供了一种多属性物理层认证方法,包括:
6.提取接收信号的多个物理层属性作为特征数据集s(t)=(a
ij
)n×m;其中,n为样本数量,m为物理层属性数量,a
ij
表示特征数据集中第i个样本的第j个物理层属性;
7.通过k-means聚类算法对特征数据集进行自下向上的分层,得到l层数据集;
8.对l层数据集自上向下进行加权聚类,将特征数据集分为k个集群;
9.基于k个集群迭代计算样本的平均轮廓系数,并基于平均轮廓系数确定特征数据集的聚类中心数量k;
10.基于特征数据集的聚类中心数量k和k个集群的聚类中心确定特征数据集的聚类中心;
11.基于特征数据集的聚类中心与参考向量的距离判断各个聚类中心对应的用户类型;其中,用户类型包括合法用户和欺骗用户。
12.在一种可能的实现方式中,通过k-means聚类算法对特征数据集进行自下向上的
分层,得到l层数据集,包括:
13.将特征数据集作为第a层数据集,并令a=1;其中,a为计数值;
14.通过k-means聚类算法对第a层数据集进行聚类,得到ma个集群;
15.更新目标函数;目标函数为:
[0016][0017]
其中,ma表示对第a层数据集进行聚类得到的集群数量,n
a,k
表示对第a层数据集进行聚类得到的第k个集群中的样本数量,表示对第a层数据集进行聚类得到的第k个集群中的第q个样本,c
a,k
表示对第a层数据集进行聚类得到的第k个集群的质心;
[0018]
将ma个集群的质心作为第a 1层数据集;
[0019]
将a 1,并跳转至“通过k-means聚类算法对第a层数据集进行聚类,得到ma个集群”这一步骤,直至f小于预设阈值a,或a=l时,得到l层数据集;其中,l为预设最大层数。
[0020]
在一种可能的实现方式中,在通过k-means聚类算法对特征数据集进行自下向上的分层,得到l层数据集之前,方法还包括:
[0021]
通过标准化处理公式对每个样本进行标准化处理,得到标准化矩阵标准化处理公式为:
[0022][0023][0024][0025]
其中,a
ij
表示特征数据集中第i个数据样本的第j个物理层属性,表示标准化处理后的a
ij

[0026]
基于相关系数公式计算各个物理层属性之间的相关系数,得到相关系数矩阵r=(r
ij
)m×m;相关系数公式为:
[0027][0028]
其中,r
ij
表示第i个物理层属性和第j个物理层属性的相关系数,表示a
ti
和a
tj
的协方差;
[0029]
计算相关系数矩阵的特征向量,并基于特征向量得到m个主成分:
[0030][0031]
其中,ym表示第m个主成分,u
nm
表示第m个特征向量中的第n个元素,zn表示标准化矩阵中的第n个向量;
[0032]
基于方差贡献率公式计算各个主成分的方差贡献率;方差贡献率公式为:
[0033][0034]
其中,bj表示第j个主成分的方差贡献率,λk表示第k个主成分的特征值;
[0035]
基于累计方差贡献率公式计算m个主成分的累计方差贡献率,并基于累计方差贡献率确定主成分的选取数量;累计方差贡献率公式为:
[0036][0037]
其中,α
p
表示p个主成分的累计方差贡献率,p表示主成分的选取数量;
[0038]
选取p个方差贡献率最大的主成分,得到去相关后的特征数据集;
[0039]
相应的,通过k-means聚类算法对特征数据集进行自下向上的分层,得到l层数据集,包括:
[0040]
通过k-means聚类算法对去相关后的特征数据集进行自下向上的分层,得到l层数据集。
[0041]
在一种可能的实现方式中,对l层数据集自上向下进行加权聚类,将特征数据集分为k个集群,包括:
[0042]
令b=l;其中,b为计数值;
[0043]
在第b层数据集中随机选取k个数据作为质心;
[0044]
将第b层数据集的每个样本分配到距离该样本最近的质心,得到k个集群,并基于当前的k个集群更新质心;
[0045]
将b-1,并跳转至“将第b层数据集的每个样本分配到距离该样本最近的质心,得到k个集群,并基于当前的k个集群更新质心”这一步骤,直至b=1时,得到最终的k个集群。
[0046]
在一种可能的实现方式中,基于k个集群迭代计算样本的平均轮廓系数,并基于平均轮廓系数确定特征数据集的聚类中心数量k,包括:
[0047]
令c=k;其中,c为计数值;
[0048]
计算c个集群中各样本的类内内聚度和类间分离度;
[0049]
基于各个类内内聚度和各个类间分离度计算各样本的轮廓系数;
[0050]
基于各样本的轮廓系数计算c对应的平均轮廓系数;
[0051]
将c-1,并跳转至“计算c个集群中各样本的类内内聚度和类间分离度”这一步骤,直至c=2时,得到k-1个平均轮廓系数;
[0052]
将最接近1的平均轮廓系数对应的c作为特征数据集的聚类中心数量k。
[0053]
在一种可能的实现方式中,基于特征数据集的聚类中心数量k和k个集群的聚类中
心确定特征数据集的聚类中心,包括:
[0054]
在各个集群的质心中选择两个欧式距离最近的质心,计算该两个质心的均值中心点作为新的质心,并去掉该两个质心,重复此步骤,直至质心数量等于特征数据集的聚类中心数量k,得到特征数据集的聚类中心。
[0055]
在一种可能的实现方式中,基于特征数据集的聚类中心与参考向量的距离判断各个聚类中心对应的用户类型,包括:
[0056]
计算各个聚类中心与参考向量的距离;
[0057]
将距离参考向量最近的聚类中心判定为合法样本,其他聚类中心判定为欺骗样本。
[0058]
第二方面,本发明实施例提供了一种多属性物理层认证装置,包括:
[0059]
特征提取模块,用于提取接收信号的多个物理层属性作为特征数据集s(t)=(a
ij
)n×m;其中,n为样本数量,m为物理层属性数量,a
ij
表示特征数据集中第i个数据样本的第j个物理层属性;
[0060]
聚类分层模块,用于通过k-means聚类算法对特征数据集进行自下向上的分层,得到l层数据集;
[0061]
加权聚类模块,用于对l层数据集自上向下进行加权聚类,将特征数据集分为k个集群;
[0062]
数量确定模块,用于基于k个集群迭代计算样本的平均轮廓系数,并基于平均轮廓系数确定特征数据集的聚类中心数量k;
[0063]
中心选取模块,用于基于特征数据集的聚类中心数量k和k个集群的聚类中心确定特征数据集的聚类中心;
[0064]
用户判断模块,用于基于特征数据集的聚类中心与参考向量的距离判断各个聚类中心对应的用户类型;其中,用户类型包括合法用户和欺骗用户。
[0065]
第三方面,本发明实施例提供了一种终端,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上第一方面或第一方面的任一种可能的实现方式方法的步骤。
[0066]
第四方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如上第一方面或第一方面的任一种可能的实现方式方法的步骤。
[0067]
本发明实施例提供一种多属性物理层认证方法、装置、终端及存储介质,该方法包括:提取接收信号的多个物理层属性作为特征数据集s(t)=(a
ij
)n×m;其中,n为样本数量,m为物理层属性数量,a
ij
表示特征数据集中第i个样本的第j个物理层属性;通过k-means聚类算法对特征数据集进行自下向上的分层,得到l层数据集;对l层数据集自上向下进行加权聚类,将特征数据集分为k个集群;基于k个集群迭代计算样本的平均轮廓系数,并基于平均轮廓系数确定特征数据集的聚类中心数量k;基于特征数据集的聚类中心数量k和k个集群的聚类中心确定特征数据集的聚类中心;基于特征数据集的聚类中心与参考向量的距离判断各个聚类中心对应的用户类型;其中,用户类型包括合法用户和欺骗用户。本发明对特征数据集进行分层聚类,可以在不使用训练样本的前提下找到高质量的聚类中心,从而降低前期准备工作的复杂度;同时本发明还通过轮廓系数在先验知识不足的情况下对聚类中心
的个数进行调整,从而能够提高物理层认证的适应性。
附图说明
[0068]
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0069]
图1是本发明一实施例提供的多属性物理层认证方法的应用场景图;
[0070]
图2是本发明一实施例提供的多属性物理层认证方法的实现流程图;
[0071]
图3是本发明一实施例提供的l层数据集的结构示意图;
[0072]
图4是本发明实施例提供的多属性物理层认证装置的结构示意图;
[0073]
图5是本发明实施例提供的终端的示意图。
具体实施方式
[0074]
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
[0075]
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图通过具体实施例来进行说明。
[0076]
图1为本发明实施例提供的多属性物理层认证方法的应用场景图。如图1所示,alice,bob和eve用于表示不同的实体。alice是合法的发送者,它向预期的接收者bob发送消息,而x个欺骗攻击者(eve1,

,eve
x
)意图伪装成alice,在其他通信时隙发送欺骗信号。
[0077]
在无线通信中,用户的信息极易被攻击者窃取,这主要是由于无线信号传播的开放广播性质、通信的间歇性以及标准化传输方案。欺骗攻击者可以通过将自己的mac地址和其他身份信息伪装成合法发送者来监视或篡改合法用户的私人信息,这会对无线通信的安全性造成极大的威胁,因此一个合适的认证方案来对用户进行认证是至关重要的。
[0078]
目前,无线终端的身份认证主要采用基于密钥的身份认证方案,且现有研究主要关注安全高效的密钥生成、分发和管理。然而,基于密钥的身份认证方案有着自身的局限性,在分散的异构网络中如多接入边缘计算网络和雾计算网络中,密码认证出现了密钥分发和管理困难的问题。这种问题导致了过度的延迟,这对于对延迟敏感的通信来说是无法忍受的,如车辆网络。此外,对于计算能力和电池寿命有限的设备,例如物联网(iot,internet of things),密码认证的计算开销是不可取的。因此,物理层认证(pla,physical layer authentication)因其计算量小、网络开销小、能耗小等优点,而被提出作为基于密钥的身份认证的替代解决方案。
[0079]
基于图1所示的通信模型,本发明采用了一种通用的基于多属性的认证模型,其中接收信号在t时刻的识别签名由m个物理层属性构成,用多维随机变量建模为:
[0080]at
=[a
t1
,

,a
tm
]
t
[0081]
其中,a
tm
表示接收信号在t时刻的第m个物理层属性。
[0082]
在理想模型中,可以假设所有用户都是静态的,以及所有用户基于信道的属性的相关性是相同的。eve
x
可以产生任意波形信号伪装成alice。eve
x
的位置是未知的,但它与alice的距离超过一个波长。此外,bob还可以从接收到的信号中提取各种物理层属性。
[0083]
所提出的物理层认证方案包括以下两个阶段。
[0084]
1)初始化阶段:alice广播一个或多个导频信号请求访问bob。然后,bob从接收到的信号中推断出识别签名作为参考向量ar=[a
r1
,...,a
rm
]
t

[0085]
2)认证阶段:alice发送有用的信号与bob通信,而所有eve
x
都伪装成alice,在alice没有信号的情况下向bob发送欺骗信号。然后,bob估计接收信号的识别签名a
t
,并与ar进行比较,以确认接收信号的合法性。
[0086]at
与ar的相似度用d(a
t
,ar)表示。d(a
t
,ar)越小,表示a
t
与ar越相似,接收到的信号来自alice的概率越大,反之亦然。因此,物理层认证定义为:
[0087][0088]
其中τ表示阈值。h0表示接收到的信号来自合法用户alice,h1表示接收到的信号来自欺骗用户eve。
[0089]
参见图2,其示出了本发明实施例提供的多属性物理层认证方法的实现流程图,详述如下:
[0090]
步骤201,提取接收信号的多个物理层属性作为特征数据集s(t)=(a
ij
)n×m;其中,n为样本数量,m为物理层属性数量,a
ij
表示特征数据集中第i个样本的第j个物理层属性。
[0091]
在本实施例中,用于认证的物理层属性可以包括基于信道的属性和基于puf(physically unclonable function)的属性。具体来说,基于信道的属性对用户的识别能力较强,如csi、rss、aoa等,因此在静态场景中应该尽可能多的选择信道属性。基于puf的属性在时变信道(如cfo和iqi)中是稳定的,在动态情况下是首选。
[0092]
本实施例中可以通过构造一个滑动时间窗筛选得到一段时间内的接收信号,按照一定频率对接收信号进行采样能够得到多个样本,接着提取各个样本的多个物理层属性,最终得到特征数据集s(t)=(a
ij
)n×m。
[0093]
步骤202,通过k-means聚类算法对特征数据集进行自下向上的分层,得到l层数据集。
[0094]
在本实施例中,传统k-means聚类算法的最终聚类结果受到初始质心的影响极大,特征数据集中的样本数量越多,k-means聚类算法通过随机方式在特征数据集中找到高质量初始质心的概率就越低。基于分层聚类的思想,本实施例将一组彼此接近的样本的质心作为一个代表性样本,在此基础上可以将整个特征数据集简化为一个较小的数据集,该较小的数据集由几个具有与原始数据集相似分布的代表性样本组成。从该角度出发,可以构建原始数据集的层次结构。如图3所示,最终得到的层次的数量定义为l,其中第1层是原始的特征数据集,每一个后续的层次由其上一层的一个较小的数据集组成。
[0095]
本实施例通过对原始的特征数据集进行多次分层,在最终得到的第l层数据集中存在高质量初始质心的概率较高,能够在保留了k-means聚类算法聚类速度快的优点同时,解决随机对初始质心进行选择难以确定高质量质心的问题。此外,本实施例中得到的高质量质心有助于加速后续聚类阶段的收敛速度,并且相比于多次聚类,本实施例中的分层步
骤只需执行一次,计算量和用时均少于使用多次聚类思想的算法。因此,与传统的k-means方法相比。本实施例所提供的聚类方法收敛更快。
[0096]
步骤203,对l层数据集自上向下进行加权聚类,将特征数据集分为k个集群。
[0097]
在本实施例中,步骤202得到的分层结果中,相对于其他层数据集来说,第l层数据集中包含有高质量质心的概率最大,因此在进行聚类时将第l层数据集作为聚类起点,采用自上向下的方式逐层进行聚类,能够得到特征数据集的较优的聚类结果。
[0098]
步骤204,基于k个集群迭代计算样本的平均轮廓系数,并基于平均轮廓系数确定特征数据集的聚类中心数量k。
[0099]
在本实施例中,由于本技术的应用场景中不要求先验信息,也不基于提前获取的欺骗攻击者训练集对聚类算法进行训练,因此需要自动确定聚类集的个数。轮廓系数是对聚类效果进行评价的一种评价方式,对于k-means聚类算法,不同的聚类中心数量k会导致不同的聚类效果。平均轮廓系数结合了集群的内聚度和分离度两种因素,可以对不同聚类中心数量k对应的聚类结果进行评价,从而根据样本结构自适应的选取出聚类中心数量k,得到最优的聚类结果。
[0100]
步骤205,基于特征数据集的聚类中心数量k和k个集群的聚类中心确定特征数据集的聚类中心。
[0101]
在本实施例中,步骤203中所得到的k个集群表示了在不确定聚类中心数量k时,能够得到的一个较优的聚类结果,k个集群所对应的k个聚类中心则是在加权聚类过程中选取出的较优的聚类中心。在确定了聚类中心数量k后,如果聚类中心数量k是小于已经得到的聚类中心的数量k时,则可以在k个聚类中心的基础上进行筛选、合并,将聚类中心数量减少到k,从而使最终的聚类结果达到最优。
[0102]
步骤206,基于特征数据集的聚类中心与参考向量的距离判断各个聚类中心对应的用户类型;其中,用户类型包括合法用户和欺骗用户。
[0103]
在本实施例中,由于无线信道的时变和估计误差,即使所有用户都是静态的,接收信号的物理层属性仍可能会发生较大的波动,导致物理层认证结果不可靠。本实施例在对获取到的样本进行聚类后,能够将物理层认证转化为聚类集认证,同时也将样本与参考向量的相似度转化为样本与参考向量的距离。对样本进行聚类的聚类结果能够反映特定用户的统计特征,在聚类前,样本与参考向量的相似度越高则样本对应的用户为合法用户的概率就越高,相应的,聚类后,样本与参考向量的距离越近则样本对应的用户为合法用户的概率就越高。
[0104]
在一种可能的实现方式中,通过k-means聚类算法对特征数据集进行自下向上的分层,得到l层数据集,包括:
[0105]
将特征数据集作为第a层数据集,并令a=1;其中,a为计数值;
[0106]
通过k-means聚类算法对第a层数据集进行聚类,得到ma个集群;
[0107]
更新目标函数;目标函数为:
[0108][0109]
其中,ma表示对第a层数据集进行聚类得到的集群数量,n
a,k
表示对第a层数据集进
行聚类得到的第k个集群中的样本数量,表示对第a层数据集进行聚类得到的第k个集群中的第q个样本,c
a,k
表示对第a层数据集进行聚类得到的第k个集群的质心;
[0110]
将ma个集群的质心作为第a 1层数据集;
[0111]
将a 1,并跳转至“通过k-means聚类算法对第a层数据集进行聚类,得到ma个集群”这一步骤,直至f小于预设阈值a,或a=l时,得到l层数据集;其中,l为预设最大层数。
[0112]
在本实施例中,为了保证对特征数据集进行分层的效果和效率,将分层后每层数据集中各样本间的欧式距离控制在合理范围中,本实施例通过预设最大层数l和目标函数判断是否继续进行分层。其中,欧式距离用于衡量样本a
t
和样本ar间的相似性,欧式距离的计算公式为:
[0113][0114]
其中,a
tl
表示样本a
t
的第l个物理层属性,p表示物理层属性的总数量。在分层至某个阶段时,如果目标函数小于预设阈值a,说明此时最新得到的一层数据集中各数据间的欧式距离过小,不必继续进行分层。
[0115]
此外,在分层过程中,样本还应满足以下约束条件:
[0116][0117]
(2)m
l-1
>m
l
≥k
[0118]
其中,约束(1)表示每一个样本只属于一个集群,约束(2)表示m
l
的设置需要大于聚类中心数量k且小于第l层的样本数量n
l
,防止空集的存在。
[0119]
在一种可能的实现方式中,在通过k-means聚类算法对特征数据集进行自下向上的分层,得到l层数据集之前,方法还包括:
[0120]
通过标准化处理公式对每个样本进行标准化处理,得到标准化矩阵标准化处理公式为:
[0121][0122][0123][0124]
其中,a
ij
表示特征数据集中第i个数据样本的第j个物理层属性,表示标准化处
理后的a
ij

[0125]
基于相关系数公式计算各个物理层属性之间的相关系数,得到相关系数矩阵r=(r
ij
)m×m;相关系数公式为:
[0126][0127]
其中,r
ij
表示第i个物理层属性和第j个物理层属性的相关系数,表示a
ti
和a
tj
的协方差;
[0128]
计算相关系数矩阵的特征向量,并基于特征向量得到m个主成分:
[0129][0130]
其中,ym表示第m个主成分,u
nm
表示第m个特征向量中的第n个元素,zn表示标准化矩阵中的第n个向量;
[0131]
基于方差贡献率公式计算各个主成分的方差贡献率;方差贡献率公式为:
[0132][0133]
其中,bj表示第j个主成分的方差贡献率,λk表示第k个主成分的特征值;
[0134]
基于累计方差贡献率公式计算m个主成分的累计方差贡献率,并基于累计方差贡献率确定主成分的选取数量;累计方差贡献率公式为:
[0135][0136]
其中,α
p
表示p个主成分的累计方差贡献率,p表示主成分的选取数量;
[0137]
选取p个方差贡献率最大的主成分,得到去相关后的特征数据集;
[0138]
相应的,通过k-means聚类算法对特征数据集进行自下向上的分层,得到l层数据集,包括:
[0139]
通过k-means聚类算法对去相关后的特征数据集进行自下向上的分层,得到l层数据集。
[0140]
在本实施例中,对样本进行聚类即是将接收信号中的识别签名自动划分至不同的集群,同集群中的签名可视为来自同一用户的样本,此时识别签名的认证就可以转换为集群的认证。样本聚类需要基于识别签名之间的相似度实现,然而,样本之间的相关性会给聚类算法带来指数级增长的计算复杂度。本实施例中对特征数据集进行主成分分析,可以通过降维的方法来重构属性,将m维相关的识别签名转化为了p维不相关的识别签名,从而可以简化后续的聚类过程。对多维属性降维和去相关,可以去除数据中的噪音和冗余信息,在大大降低了算法复杂度的同时,还可以避免不完全估计导致的区分不明显的问题。
[0141]
在一种可能的实现方式中,对l层数据集自上向下进行加权聚类,将特征数据集分为k个集群,包括:
[0142]
令b=l;其中,b为计数值;
[0143]
在第b层数据集中随机选取k个数据作为质心;
[0144]
将第b层数据集的每个样本分配到距离该样本最近的质心,得到k个集群,并基于当前的k个集群更新质心;
[0145]
将b-1,并跳转至“将第b层数据集的每个样本分配到距离该样本最近的质心,得到k个集群,并基于当前的k个集群更新质心”这一步骤,直至b=1时,得到最终的k个集群。
[0146]
在本实施例中,初始质心的数量k应选取一个较大的值,确保在确定特征数据集的聚类中心数量k之后,k》k,从而能够从最终的k个质心中选取k个高质量的质心,同时初始质心的数量k应该小于或等于第l层数据集中的样本数量。首先在第l层数据集中选取初始的质心,选取到高质量质心的概率最大;接着按照自上向下的方式,逐层将第b层数据集中的样本分配到k个集群,并持续对质心进行调节,可以在聚类过程中对质心进行修正,确保最终得到的k个集群对应于k个最优的质心。
[0147]
将第b层数据集的每个样本分配到距离该样本最近的质心后,可以通过以下公式更新质心:
[0148][0149]
其中,ok表示第k个集群的质心,n

b,k
表示第b层数据集中第k个集群中的样本数量,w
′q表示第b层数据集中第k个集群中的第q个样本;在b》1时,ri表示w
′q所代表的第b-1层数据集中的样本数量,在b=1时,ri=1。
[0150]
在一种可能的实现方式中,基于k个集群迭代计算样本的平均轮廓系数,并基于平均轮廓系数确定特征数据集的聚类中心数量k,包括:
[0151]
令c=k;其中,c为计数值;
[0152]
计算c个集群中各样本的类内内聚度和类间分离度;
[0153]
基于各个类内内聚度和各个类间分离度计算各样本的轮廓系数;
[0154]
基于各样本的轮廓系数计算c对应的平均轮廓系数;
[0155]
将c-1,并跳转至“计算c个集群中各样本的类内内聚度和类间分离度”这一步骤,直至c=2时,得到k-1个平均轮廓系数;
[0156]
将最接近1的平均轮廓系数对应的c作为特征数据集的聚类中心数量k。
[0157]
在本实施例中,类内内聚度的定义如下:
[0158]
设样本ai最终聚类到集群c1,则称ai到c1中其他所有样本的平均距离a(i)为ai的类内内聚度。
[0159]
类间分离度的定义如下:
[0160]
设最终ai聚类到集群c1,且ai到其他集群cm中所有样本的平均距离为b
im
,则称b(i)=min{b
i2
,b
i3
,...,b
ik
}为ai的类间分离度。
[0161]
样本数据的轮廓系数的定义如下:
[0162]
若ai的类内内聚度为a(i),类间分离度为b(i)b(i),则ai的轮廓系数为:
[0163][0164]
其中,s(i)∈[-1,1],s(i)越接近1,则说明ai的聚类越合理。
[0165]
聚类结果的轮廓系数的定义如下:
[0166]
若ai的轮廓系数为s(i),则称所有数据的轮廓系数的均值为聚类结果的轮廓系数。的值越接近1,则说明整个聚类结果越合理。
[0167]
在对数据样本s(t)进行k-means聚类时,基于不同的聚类中心数量k得到的聚类结果都可以计算出对应的轮廓系数通过比较轮廓系数,最终可以确定出使整个聚类结果最合理的k的取值。
[0168]
在一种可能的实现方式中,基于特征数据集的聚类中心数量k和k个集群的聚类中心确定特征数据集的聚类中心,包括:
[0169]
在各个集群的质心中选择两个欧式距离最近的质心,计算该两个质心的均值中心点作为新的质心,并去掉该两个质心,重复此步骤,直至剩余的质心数量等于特征数据集的聚类中心数量k,得到特征数据集的聚类中心。
[0170]
在本实施例中,每执行一次“在各个集群的质心中选择两个欧式距离最近的质心,计算该两个质心的均值中心点作为新的质心,并去掉该两个质心”的步骤,就可以对当前集群中最接近的两个集群进行合并,并且将当前的质心数量减少1。重复执行该步骤就可以将质心数量降低至最优的聚类中心数量k,并且尽可能多的保留下高质量的集群。
[0171]
在一种可能的实现方式中,基于特征数据集的聚类中心与参考向量的距离判断各个聚类中心对应的用户类型,包括:
[0172]
计算各个聚类中心与参考向量的距离;
[0173]
将距离参考向量最近的聚类中心判定为合法样本,其他聚类中心判定为欺骗样本。
[0174]
在本实施例中,聚类中心ok能够反映各用户识别签名的统计特征,基于聚类中心可以对用户进行稳定观察。集群的聚类中心ok可以作为每个集群的代表性识别签名,聚类后就可以通过将聚类中心ok与参考向量a
t
进行比较来进行决策:
[0175]
δk=d(ok,a
t
)
[0176]
将距离合法用户的聚类中心最近的a
t
确定为合法样本,其他聚类中心确定为欺骗样本。此外,欺骗集群可以看作是来自欺骗用户的一组信号,欺骗集群总数则为欺骗用户的数量。
[0177]
在一个具体的实施例中,可以通过计算机程序代码实现本发明提供的多属性物理层认证方法,为了便于理解,表1为本发明提供的多属性物理层认证方法的计算机程序代码的自然语言描述。
[0178]
表1
[0179]
[0180][0181]
本发明实施例提供的一种多属性物理层认证方法包括:提取接收信号的多个物理层属性作为特征数据集s(t)=(a
ij
)n×m;其中,n为样本数量,m为物理层属性数量,a
ij
表示特征数据集中第i个样本的第j个物理层属性;通过k-means聚类算法对特征数据集进行自下向上的分层,得到l层数据集;对l层数据集自上向下进行加权聚类,将特征数据集分为k个集群;基于k个集群迭代计算样本的平均轮廓系数,并基于平均轮廓系数确定特征数据集的聚类中心数量k;基于特征数据集的聚类中心数量k和k个集群的聚类中心确定特征数据集的聚类中心;基于特征数据集的聚类中心与参考向量的距离判断各个聚类中心对应的用户类型;其中,用户类型包括合法用户和欺骗用户。本实施例对特征数据集进行分层聚类,可以在不使用训练样本的前提下找到高质量的聚类中心,从而降低前期准备工作的复杂度;
同时本发明还通过轮廓系数在先验知识不足的情况下对聚类中心的个数进行调整,从而能够提高物理层认证的适应性。
[0182]
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
[0183]
以下为本发明的装置实施例,对于其中未详尽描述的细节,可以参考上述对应的方法实施例。
[0184]
图4示出了本发明实施例提供的多属性物理层认证装置的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
[0185]
如图4所示,一种多属性物理层认证装置4包括:
[0186]
特征提取模块41,用于提取接收信号的多个物理层属性作为特征数据集s(t)=(a
ij
)n×m;其中,n为样本数量,m为物理层属性数量,a
ij
表示特征数据集中第i个数据样本的第j个物理层属性;
[0187]
聚类分层模块42,用于通过k-means聚类算法对特征数据集进行自下向上的分层,得到l层数据集;
[0188]
加权聚类模块43,用于对l层数据集自上向下进行加权聚类,将特征数据集分为k个集群;
[0189]
数量确定模块44,用于基于k个集群迭代计算样本的平均轮廓系数,并基于平均轮廓系数确定特征数据集的聚类中心数量k;
[0190]
中心选取模块45,用于基于特征数据集的聚类中心数量k和k个集群的聚类中心确定特征数据集的聚类中心;
[0191]
用户判断模块46,用于基于特征数据集的聚类中心与参考向量的距离判断各个聚类中心对应的用户类型;其中,用户类型包括合法用户和欺骗用户。
[0192]
在一种可能的实现方式中,聚类分层模块42具体用于:
[0193]
将特征数据集作为第a层数据集,并令a=1;其中,a为计数值;
[0194]
通过k-means聚类算法对第a层数据集进行聚类,得到ma个集群;
[0195]
更新目标函数;目标函数为:
[0196][0197]
其中,ma表示对第a层数据集进行聚类得到的集群数量,n
a,k
表示对第a层数据集进行聚类得到的第k个集群中的样本数量,表示对第a层数据集进行聚类得到的第k个集群中的第q个样本,c
a,k
表示对第a层数据集进行聚类得到的第k个集群的质心;
[0198]
将ma个集群的质心作为第a 1层数据集;
[0199]
将a 1,并跳转至“通过k-means聚类算法对第a层数据集进行聚类,得到ma个集群”这一步骤,直至f小于预设阈值a,或a=l时,得到l层数据集;其中,l为预设最大层数。
[0200]
在一种可能的实现方式中,一种多属性物理层认证装置4还包括标准化模块40;
[0201]
标准化模块40用于:
[0202]
在通过k-means聚类算法对特征数据集进行自下向上的分层,得到l层数据集之前,通过标准化处理公式对每个样本进行标准化处理,得到标准化矩阵标准化处理公式为:
[0203][0204][0205][0206]
其中,a
ij
表示特征数据集中第i个数据样本的第j个物理层属性,表示标准化处理后的a
ij

[0207]
基于相关系数公式计算各个物理层属性之间的相关系数,得到相关系数矩阵r=(r
ij
)m×m;相关系数公式为:
[0208][0209]
其中,r
ij
表示第i个物理层属性和第j个物理层属性的相关系数,表示a
ti
和a
tj
的协方差;
[0210]
计算相关系数矩阵的特征向量,并基于特征向量得到m个主成分:
[0211][0212]
其中,ym表示第m个主成分,u
nm
表示第m个特征向量中的第n个元素,zn表示标准化矩阵中的第n个向量;
[0213]
基于方差贡献率公式计算各个主成分的方差贡献率;方差贡献率公式为:
[0214][0215]
其中,bj表示第j个主成分的方差贡献率,λk表示第k个主成分的特征值;
[0216]
基于累计方差贡献率公式计算m个主成分的累计方差贡献率,并基于累计方差贡献率确定主成分的选取数量;累计方差贡献率公式为:
[0217]
[0218]
其中,α
p
表示p个主成分的累计方差贡献率,p表示主成分的选取数量;
[0219]
选取p个方差贡献率最大的主成分,得到去相关后的特征数据集;
[0220]
相应的,通过k-means聚类算法对特征数据集进行自下向上的分层,得到l层数据集,包括:
[0221]
通过k-means聚类算法对去相关后的特征数据集进行自下向上的分层,得到l层数据集。
[0222]
在一种可能的实现方式中,对l层数据集自上向下进行加权聚类,将特征数据集分为k个集群,包括:
[0223]
令b=l;其中,b为计数值;
[0224]
在第b层数据集中随机选取k个数据作为质心;
[0225]
将第b层数据集的每个样本分配到距离该样本最近的质心,得到k个集群,并基于当前的k个集群更新质心;
[0226]
将b-1,并跳转至“将第b层数据集的每个样本分配到距离该样本最近的质心,得到k个集群,并基于当前的k个集群更新质心”这一步骤,直至b=1时,得到最终的k个集群。
[0227]
在一种可能的实现方式中,数量确定模块44具体用于:
[0228]
令c=k;其中,c为计数值;
[0229]
计算c个集群中各样本的类内内聚度和类间分离度;
[0230]
基于各个类内内聚度和各个类间分离度计算各样本的轮廓系数;
[0231]
基于各样本的轮廓系数计算c对应的平均轮廓系数;
[0232]
将c-1,并跳转至“计算c个集群中各样本的类内内聚度和类间分离度”这一步骤,直至c=2时,得到k-1个平均轮廓系数;
[0233]
将最接近1的平均轮廓系数对应的c作为特征数据集的聚类中心数量k。
[0234]
在一种可能的实现方式中,中心选取模块45具体用于:
[0235]
在各个集群的质心中选择两个欧式距离最近的质心,计算该两个质心的均值中心点作为新的质心,并去掉该两个质心,重复此步骤,直至质心数量等于特征数据集的聚类中心数量k,得到特征数据集的聚类中心。
[0236]
在一种可能的实现方式中,用户判断模块46具体用于:
[0237]
计算各个聚类中心与参考向量的距离;
[0238]
将距离参考向量最近的聚类中心判定为合法样本,其他聚类中心判定为欺骗样本。
[0239]
本发明实施例提供的多属性物理层认证装置,包括:特征提取模块,用于提取接收信号的多个物理层属性作为特征数据集s(t)=(a
ij
)n×m;其中,n为样本数量,m为物理层属性数量,a
ij
表示特征数据集中第i个数据样本的第j个物理层属性;聚类分层模块,用于通过k-means聚类算法对特征数据集进行自下向上的分层,得到l层数据集;加权聚类模块,用于对l层数据集自上向下进行加权聚类,将特征数据集分为k个集群;数量确定模块,用于基于k个集群迭代计算样本的平均轮廓系数,并基于平均轮廓系数确定特征数据集的聚类中心数量k;中心选取模块,用于基于特征数据集的聚类中心数量k和k个集群的聚类中心确定特征数据集的聚类中心;用户判断模块,用于基于特征数据集的聚类中心与参考向量的距离判断各个聚类中心对应的用户类型;其中,用户类型包括合法用户和欺骗用户。本实施例对
特征数据集进行分层聚类,可以在不使用训练样本的前提下找到高质量的聚类中心,从而降低前期准备工作的复杂度;同时本发明还通过轮廓系数在先验知识不足的情况下对聚类中心的个数进行调整,从而能够提高物理层认证的适应性。
[0240]
图5是本发明实施例提供的终端的示意图。如图5所示,该实施例的终端5包括:处理器50、存储器51以及存储在所述存储器51中并可在所述处理器50上运行的计算机程序52。所述处理器50执行所述计算机程序52时实现上述各个多属性物理层认证方法实施例中的步骤,例如图2所示的步骤201至步骤206。或者,所述处理器50执行所述计算机程序52时实现上述各装置实施例中各模块/单元的功能,例如图4所示模块/单元40至46的功能。
[0241]
示例性的,所述计算机程序52可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器51中,并由所述处理器50执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序52在所述终端5中的执行过程。例如,所述计算机程序52可以被分割成图4所示的模块/单元40至43。
[0242]
所述终端5可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端5可包括,但不仅限于,处理器50、存储器51。本领域技术人员可以理解,图5仅仅是终端5的示例,并不构成对终端5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端还可以包括输入输出设备、网络接入设备、总线等。
[0243]
所称处理器50可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0244]
所述存储器51可以是所述终端5的内部存储单元,例如终端5的硬盘或内存。所述存储器51也可以是所述终端5的外部存储设备,例如所述终端5上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,所述存储器51还可以既包括所述终端5的内部存储单元也包括外部存储设备。所述存储器51用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述存储器51还可以用于暂时地存储已经输出或者将要输出的数据。
[0245]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0246]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0247]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0248]
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
[0249]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0250]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0251]
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个多属性物理层认证方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
[0252]
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献