香港马会白小姐论坛免费资料   2 基于岭回归的RVPMCD模式识别方法

  2.1 岭回归

香港马会白小姐论坛免费资料   回归系数 的最小二乘估计为 =(XX)-1XY ,定义岭回归估计:(K) = (XX + KI )-1XY (1)其中, 为岭回归估计,其中I 为单位矩阵,K(0  K  )为岭参数。当自变量之间存在复共线关系时,|XX| 0 ,最小二乘估计求得的回归系数会出现与实际情况很不符合的异常现象,而XX + KI 接近异常的程度会比XX 接近异常的程度小得多,即最小二乘在复共线状态下的偏差部分虽然为零,但它的方差部分却很大,最终致使它的均方误差很大,而岭回归是牺牲无偏性,换取方差部分的大幅度减少,最终降低其均方误差。因此,岭回归估计改变了最小二乘对回归参数估计的不稳定性。

  2.2 RVPMCD模式识别方法

  在机械故障诊断中,提取p 个不同的特征值X =[X1X2Xp] 来描述一个故障类别,由于特征值之间存在的内在关系,因此,在不同的故障类别中,X1 会受到其他特征值的影响而产生不同的变化,在此类问题中,特征值之间可能存在一对一的关系:X1 = f (X2) ;或者一对多的关系:X1 = f (X2X3) 。为了识别系统的故障模式,需建立数学模型。原VPMCD 方法中,为特征值Xi定义的变量预测模型VPMi 为一个线性或者非线性的回归模型,文献[3]中提出了四种数学模型。以p 个特征值为例,对四种模型中任意一个模型采用特征值Xj( j i)对Xi 进行预测,都可以得到:

  Xi = f (Xjb0bjbjjbjk) + e (2)式(2)称为特征值Xi 的变量预测模型VPMi 。其中,特征值Xi 称为被预测变量;Xj( j i) 称为预测变量;e 为预测误差;b0、bj、bjj 和bjk 为模型参数。由于最小二乘回归对于复共线的敏感性,本文采用岭回归来拟合模型参数,岭回归是针对最小二乘在自变量存在复共线关系时估计性能变坏的缺陷,而提出的一种改进的最小二乘估计方法,当自变量的相关性较大时,岭回归通过引入岭参数可以改变最小二乘法中对回归系数估计的不稳定性,进而使得拟合出的参数更加接近实际值。结合了岭回归的RVPMCD分类识别方法步骤如下:

  (1)对于s 类分类问题,每一类样本数分别为n1n2ns 。对所有训练样本提取特征量(本文是对信号的复杂度进行提取)X =[X1X2Xp] ,每一类样本特征量的规模大小分别为n1 pn2 pns p 。

  (2)令模型类型m = 1(L、LI、Q、QI 四种模型分别用数值1、2、3、4 标记)、模型阶次r = 1(0 r p) ,令g = 1 。选择第g 类训练样本的特征量Xi(i = 12p) 作为被预测变量,选择r 个特征量Xj( j i) 作为预测变量。预测变量的组合方式共有Crp - 1 种可能,因此对于特征量Xi 可建立Crp - 1 个变量预测模型。

  (3)对于每一个变量预测模型,特征量Xi 都可以建立ng 个方程,利用这ng 个方程通过岭回归对变量预测模型进行参数估计,然后将预测变量Xj 回代变量预测模型得到特征量Xi 的预测值Xi pred 。分别计算Crp - 1 个变量预测模型的预测误差平方和SSEl = v = 1ng(Xiv - Xiv pred)2,256其中(l = 12Crp - 1) ,v 表示第v 个训练样本。选择SSEl 最小值所对应的变量预测模型作为第g 类训练样本中特征量Xi(i = 12p) 的变量预测模型VPM ki (i =12p) ,保存相应的模型参数和预测变量。

  (4)令g = g + 1 ,循环上述步骤直至g = s 结束。至此,模型类型为m 和阶次为r 的s 个类别的所有特征量都分别建立了变量预测模型VPM gi ,其中g = 12 s表示不同类别,i = 12p 表示不同特征量。然后先后使r = r + 1 、m = m + 1 ,分别循环至r = p - 1 、m = 4 结束。得到各种模型类型和阶次下的VPM 矩阵。将所有训练样本作为测试样本分别对每一个VPM 矩阵进行回代分类测试,选择分类正确率最高的VPM 矩阵所对应的模型类型和阶次作为最佳变量预测模型的类型和阶次。至此,RVPMCD的训练过程结束。

  (5)把剩下的样本作为测试样本,提取其特征值X =[X1X2Xp] 。结合步骤(4)中所确定的最佳预测模型及阶次,对未知状态的测试样本进行分类识别,得到识别率。

  3 基于RVPMCD方法的滚动轴承故障诊断方法

  在滚动轴承故障诊断中,由于制造误差、装配原因、刚度变化、摩擦力、阻尼等多种非线性因素影响,拾取的振动信号一般表现为非线性和非平稳性。若直接从这种非线性信号中提取特征信息,则会影响滚动轴承的诊断效果。因此在故障诊断过程中有必要对拾取的振动信号进行处理。在非平稳信号的分析方法中,时频分析是一种广泛使用的信号处理方法,它能同时提供振动信号在时域和频域的局部化信息。经验模态分解[6] (EmpiricalMode Decomposition,EMD)、局域均值分解(LocalMean Decomposition,LMD)和本征时间尺度分解[8](Intrinsic Time-scale Decomposition,ITD)是三种常用的时频分析方法,但这三种分析方法都有各自的不足,如EMD 的过包络、欠包络、端点效应和频率混淆[9-10];LMD 分解时的信号突变和端点效应[11];与EMD、LMD相比,ITD 在端点效应和计算速度上都有明显优势,且可以避免EMD 方法中的包络误差,但是ITD 没有对算法本身及固有旋转分量的物理意义进行阐述,从而可能导致信号失真。因此,针对ITD 的这些缺陷,提出改进的ITD算法局部特征尺度分解(Local Characteristicscale Decomposition,LCD)算法。该方法不仅保留了ITD方法的优点,而且在阐述算法本身及固有旋转分量物理意义的基础之上改进了算法,关于LCD 算法相对于其他时频分析方法的优越性已在中详细讨论,所以本文不再赘述。

  对拾取的轴承振动信号经过LCD 分解后,接着就要提取信号特征进行故障诊断,特征值作为诊断时的直接参与者,其特征值的好坏将直接影响分类的效果,只有选择合适的特征值才能准确识别机械部件的运行状态。由于原始信号具有非线性特征,需要选择描述系统非线性特性的参数作为特征值,复杂度作为描述非线性特性的参数,它反映了一个时间序列随着序列长度的增加出现新模式的速度,能够定量地描述系统的状态变化情况,并已被应用于肌电信号模式识别、随机共振特征描述等领域。复杂度对系统的状态变化敏感,适宜作为信号特征值而被提取。提取特征之后,用RVPMCD分类方法对滚动轴承的状态进行识别,其具体诊断步骤如下:

  (1)在一定转速下以采样率fs 对滚动轴承的正常以及各类故障状态进行采样,每种状态采集n 组样本。

  (2)对采集的振动信号利用LCD 进行分解,分解得到若干个单分量信号。然后提取包含信号主要信息的前i 个ISC分量的复杂度作为特征值,组成特征值向量,每种状态下得到N i 阶的特征值矩阵。

  (3)每种状态取M 个样本作为训练样本,其余的作为测试样本,通过RVPMCD训练,建立预测模型VPM gi ,其中g = 12 s 代表不同类别,i = 12p 代表不同的特征值。用训练好的数学预测模型对测试样本进行分类,根据RVPMCD 分类器的输出结果来确定滚动轴承的工作状态和故障类型。

  4 实例分析

  本文采用的滚动轴承加速度振动信号数据来自于美国凯斯西储大学(Case Western Reserve University)电气工程实验室的滚动轴承数据[15],选取的滚动轴承型号为6205-2RS,转速是1 772 r/min,采样频率是12 000 Hz,故障直径和故障深度分别是0.018 mm、0.028 mm。本文选取正常、滚动体故障、内圈故障和外圈故障四类状态下的振动信号各100 组数据作为样本。随机抽取其中的60 组数据为训练样本,其余的40 组数据为测试样本。其滚动体故障状态下的滚动轴承振动信号如图1所示。

  首先对所采集的非平稳、非线性滚动轴承振动信号进行LCD 分解,得到振动信号在时域和频域的局部化信息,每个信号可以分解得到若干ISC 分量,选取包含主要状态信息的前四个ISC 分量,接着提取每一个ISC分量的复杂度,组成特征矩阵,然后把训练样本分别通过原VPMCD 和改进RVPMCD 训练,得到预测模型。对于RVPMCD 的建模需要设置K 值,通过对训练样本的交叉寻优,最后确定K = 1 。最后把剩下的40 组测试样本分别代入原VPMCD 和改进RVPMCD 预测模型进行分类,取得了很好的分类效果,原VPMCD 方法和改进RVPMCD方法的识别准确率分别为95%和97.5%,因此改进RVPMCD 方法的识别率提高了2.5 个百分点。给出了改进RVPMCD 方法部分具体识别结果,表2 列出了改进前后两种方法的识别率。

  改进RVPMCD确实比原VPMCD方法有更高的识别率,这是由于改进RVPMCD 避免了自变量之间存在复共线关系对识别结果的影响。因此,对各特征值的线性相关性进行了分析。四类不同的状态中,每类状态都可以得到四组特征值,从四组特征值中选取其中一组作为被预测变量,其余三组作为预测变量,通过相关分析,得到各变量之间的相关系数。对不同类别的不同预测变量进行相关分析时会出现相似的情况,本文在表3 中列举了外圈故障状态下,当被预测变量为x4 时,各预测变量之间的相关系数矩阵。从表3 可以看出,各预测变量与其平方项之间,各预测变量与其所在的交互项之间的相关系数都很高(即自变量间存在复共线关系),例如x2 与x22 的相关系数为0.999 2,x2 与x2 x3 的相关系数为0.876 8。正是这种复共线关系的存在,使最小二乘法进行参数估计时方差部分会很大,最终致使它的回归参数不符合实际,估计性能变坏,进而影响分类精度,而岭回归就是针对最小二乘回归这一弱点提出来的一种改进的估计方法,当自变量间存在复共线关系时,岭回归法通过引入岭参数而改善了最小二乘回归法中对回归参数估计的不稳定性,最终提高回归参数的拟合精度,进而提高分类精度。为了进一步说明改进RVPMCD 方法的有效性,采用K-fold Cross-Validation(K-CV)检验对两种方法进行了验证,K-fold Cross-Validation 检验是较为客观和严格的交叉检验,常用来测试算法的准确性。首先选取所有100 组数据,其RVPMCD 中岭参数不变,取K = 1 ,然后通过5-CV交叉检验,建立预测模型最终实现分类,最后比较两种方法的5-CV 交叉检验总体识别率。表4 中给出了原VPMCD 方法和改进RVPMCD 方法在5-fold 检验下的识别率。

  改进RVPMCD 方法在5-fold 交叉检验下的精度提高了3.75 个百分点,其中,在正常和滚动体故障两种状态下,两种分类器的识别率一样,而在内圈故障和外圈故障条件下,改进RVPMCD 识别率分别提高了4%和11%,表现出了很强的优越性。因此,说明了改进RVPMCD 方法在算法上要优于原方法,适用于滚动轴承故障诊断。

  5 结论 奇彩娱乐官网安全吗?

  本文将岭回归的RVPMCD应用于滚动轴承的故障诊断中,经研究得出以下结论:

  (1)RVPMCD 方法采用岭回归代替最小二乘回归进行参数估计,减小了估计值受自变量复共线关系的影响,能够得到比较真实的模型。

  (2)RVPMCD 中预测模型的建立本质上是参数估计的过程,从而避免了神经网络结构和类型的选择以及支持向量机中核函数和参数的选择。而这些参数、核函数、结构和类型的选择往往都过分依靠经验或先验知识。因此,RVPMCD 模式识别方法受主观因素的影响较少,所得分类结果更客观。