文章快速检索     高级检索
  重庆邮电大学学报(自然科学版)  2020, Vol. 32 Issue (3): 459-468  DOI: 10.3979/j.issn.1673-825X.2020.03.016
0

引用本文 

胡静, 陶洋. 基于RPCA的群稀疏表示人脸识别方法[J]. 重庆邮电大学学报(自然科学版), 2020, 32(3): 459-468.   DOI: 10.3979/j.issn.1673-825X.2020.03.016.
HU Jing, TAO Yang. Group sparse representation face recognition method based on RPCA[J]. Journal of Chongqing University of Posts and Telecommunications (Natural Science Edition), 2020, 32(3): 459-468.   DOI: 10.3979/j.issn.1673-825X.2020.03.016.

基金项目

国家自然科学基金(61801072);重庆市自然科学基金(cstc2018jcyjAX0344)

Foundation item

The National Natural Science Foundation of China (01801072); The Natural Science Foundation Project of CQ CSTC (cstc 2018jcyjAX0344)

作者简介

胡静(1992-),女,辽宁朝阳人,硕士研究生, 主要研究方向为人脸识别,图像处理。E-mail:113511986@qq.com; 陶洋(1964-),男,重庆市人,教授,博士后,硕士生导师,研究方向为无线传感器网络,异构网络,模式识别等。E-mail:taoyang@cqupt.edu.cn

通讯作者

陶洋 taoyang@cqupt.edu.cn.

文章历史

收稿日期: 2018-10-26
修订日期: 2020-05-22
基于RPCA的群稀疏表示人脸识别方法
胡静1, 陶洋2     
重庆邮电大学 通信与信息工程学院,重庆 400065
摘要: 针对训练样本图像和测试样本图像均存在光照、污染、遮挡等情况下的人脸识别问题,提出一种基于鲁棒主成分分析的群稀疏表示人脸识别方法(group sparse representation face recognition method based on robust principal component analysis, GSR-RPCA)。该方法将人脸图像由空域变换到对数域,增强人脸图像的对比度,并通过结构非相关鲁棒主成分分析算法从训练样本图像矩阵D中分解出干净的低秩部分人脸图像矩阵A和误差图像矩阵E,以增强恢复数据的鉴别力;学习AD之间的低秩映射关系矩阵P,并用P将存在遮挡的测试样本映射到其潜在的子空间下,得到干净的测试样本y;计算yA上的群稀疏表示系数,并利用类关联重构残差对测试人脸进行识别,获得测试人脸的所属类别。在CMU PIE,Extended Yale B和AR数据库上的实验结果显示, 提出方法具有较高的识别率和较强的鲁棒性。
关键词: 人脸识别    鲁棒主成分分析    低秩映射矩阵    群稀疏    
Group sparse representation face recognition method based on RPCA
HU Jing1 , TAO Yang2     
School of Communication and Information Engineering, Chongqing University of Posts and Telecommunications, Chongqing 400065, P. R. China
Abstract: Due to the face recognition problem of illumination, pollution and occlusion in the test images and training images, a study of group sparse representation face recognition method based on robust principal component analysis with(GSR-RPCA)is proposed. Firstly, transferring the face image from the spatial domain to the logarithmic domain to enhance the contrast of the face image, and decomposes the clean low-rank partial face image from the training sample image matrix D by the structural incoherence robust principal component analysis algorithm. The matrix A and the error image matrix E are used to enhance the discriminating ability of the recovered data. Then, the low rank mapping relationship matrix P between A and D is learned, and P is used to map the occlusion test samples to their potential subspaces to get a clean test sample y. Finally, the group sparse representation coefficient of y is calculated, and the test face is identified by using the class association reconstruction residual to obtain the category of the test face. Experimental results on CMU PIE, Extended Yale B and AR database verify the effectiveness and robustness of our method.
Keywords: face recognition    robust principal component analysis    low rank mapping matrix    group sparse    
0 引言

人脸识别作为一种理想的身份验证手段,有着广泛的应用前景。但人脸数据样本类别多,每类样本数相对较少,不同人脸在结构上相似,这是众多从事人脸识别研究的学者所面临的挑战[1-2]。稀疏表示是目前人脸识别领域的研究热点,文献[3]提出了基于稀疏表示分类方法(sparse representation based classification, SRC),将待识别人脸图像用训练图像线性表示,然后利用重建残差对人脸进行识别。该理论框架激发了一系列改进算法的提出,如模糊稀疏表示方法[4],基于Gabor特征字典的SRC方法[5],鲁棒稀疏表示方法[6],自适应加权空间稀疏表示[7]以及改进的稀疏表示超分辨率重建算法[8]等。

SRC方法要求训练样本是在较为理想的情况下采集的,而当训练图像中存在大量的由遮挡、表情不同等引起的变化时,会破坏同一个体的人脸图像样本位于低维子空间这一假设[9]。另外,由于不同人脸模式间的相似性,SRC所得的表示系数虽然是稀疏的,但往往分布在多个类别,易导致误分类。

针对SRC方法的第一个问题,一个解决途径是从存在复杂变化的训练样本数据中分离出鉴别性的身份性信息,如Candes等[10]提出一种鲁棒主成分分析算法(robust principal component analysis, RPCA),可将受污染的样本数据矩阵分解为一个低秩逼近矩阵和一个稀疏误差矩阵之和。Chen等[11]将结构非相关性约束引入到RPCA中可以增强恢复低秩数据的鉴别力,取得了较好的识别效果,并进一步将低秩表示(low-rank representation, LRR)与低秩矩阵恢复技术结合起来用于恢复数据中潜在的低秩结构,并通过学习得到的原始污染数据与恢复低秩数据之间的映射关系矩阵来矫正测试样本[12]。针对第二个问题的解决方法是在求解测试样本的表示系数时,引入标签监督信息,使得求得的表示系数能够尽可能地集中在少数类别上,即得到群稀疏的表示。文献[13]通过对表示系数施加类内l2范数以及类间l1范数的l2,1范数约束,得到表示系数具有群稀疏的特性,文献[14]进一步提出逐类稀疏的表示分类策略,这些方法都取得了较好的识别效果。

本文针对训练集和测试集均存在遮挡、光照以及表情变化这一人脸识别场景以及SRC算法和低秩矩阵恢复技术中存在的问题,提出一种基于RPCA的群稀疏表示人脸识别方法(group sparse representation face recognition method based on robust principal component analysis, GSR-RPCA)。GSR-RPCA方法的系统组成框图如图 1,首先针对存在遮挡、光照以及表情等复杂变化的人脸训练样本,本文突破原有的低秩逼近图像向量矩阵与误差图像向量矩阵之间是“和”的关系的假设,考虑两者之间更一般、更实用的“乘”的关系假设,并通过对数域变换,将乘性关系转化为和性关系,进而实施低秩矩阵恢复运算,同时引入类间结构非相关性约束,以增强恢复数据的鉴别力。然后,通过学习原有污染数据与恢复出的低秩数据之间存在的低秩映射关系矩阵来矫正测试数据。最后,通过求解一个l2,1范数约束的最小二乘问题,获得矫正的测试数据在矫正的训练数据上的群稀疏表示系数,利用该表示系数进一步得到表示残差,其中,表示残差最小的类见图 1 step3中最短的柱状图所示,即为最终的测试人脸所属类别。实验证明本文所提算法具有较高的识别率和较强的鲁棒性。

图 1 GSR-RPCA系统组成框图 Fig.1 Frame of GSR-RPCA system component
1 群稀疏表示与鲁棒主成分分析 1.1 群稀疏表示

SRC是基于任一幅人脸图像都存在于同类别人脸图像构成的低维线性子空间中这一基本假设。根据该假设,给定测试样本图像向量y,其可由字典D中的元素线性表示,即y=Dx,当人脸训练样本图像数量充分时,yD下的表示系数x应是稀疏的,SRC首先定义如下优化问题为

$ \begin{array}{*{20}{l}} {{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \mathit{\boldsymbol{\hat x}} = {\rm{argmin}} {{\left\| \mathit{\boldsymbol{x}} \right\|}_0}}\\ {{\rm{s}}{\rm{.t}}{\rm{.}}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \left\| {\mathit{\boldsymbol{y}} - \mathit{\boldsymbol{Dx}}} \right\|_2^2 < \varepsilon } \end{array} $ (1)

(1) 式中,ε为表示误差。(1)式是NP难的,不易求解,但当x充分稀疏时,用‖x1替代‖x0,则(1)式等价于

$ \begin{array}{*{20}{l}} {{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \mathit{\boldsymbol{\hat x}} = {\rm{argmin}} {{\left\| \mathit{\boldsymbol{x}} \right\|}_1}}\\ {{\rm{s}}{\rm{.t}}{\rm{.}}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \left\| {\mathit{\boldsymbol{y}} - \mathit{\boldsymbol{Dx}}} \right\|_2^2 < \varepsilon } \end{array} $ (2)

进一步地,(1)式等价于

$ {\kern 1pt} {\kern 1pt} {\kern 1pt} \mathit{\boldsymbol{\hat x}} = {\rm{argmin}} {\left\| \mathit{\boldsymbol{x}} \right\|_1} + \mathit{\boldsymbol{\lambda }} \left\| {\mathit{\boldsymbol{y}} - \mathit{\boldsymbol{Dx}}} \right\|_2^2 $ (3)

(3) 式中,λ(λ>0)为权重参数。通过(3)式求得样本y在训练集上稀疏表示系数x后,计算测试样本对各类训练样本的残差

$ {r_i}(\mathit{\boldsymbol{y}}) = {\left\| {\mathit{\boldsymbol{y}} - {\mathit{\boldsymbol{y}}_i}} \right\|_2} $ (4)

(4)式中,xix中对应于训练样本子类Di的表示系数,以最小重建残差准则对测试样本进行归类,即

$ identity(\mathit{\boldsymbol{y}}) = {\rm{arg}}{\kern 1pt} {\kern 1pt} {\rm{min}}{r_i}(\mathit{\boldsymbol{y}}) $ (5)

当求解(3)式或(4)式时,由于人脸结构的相似性,所得的表示系数往往散布在多个类别,易导致误分类,文献[13]提出结合Group Lasso的思想来求解,即

$ \mathit{\boldsymbol{\hat x}} = {\rm{arg}}{\kern 1pt} {\kern 1pt} \;{\rm{min}}\sum\limits_i^c {{{\left\| {{\mathit{\boldsymbol{x}}_i}} \right\|}_2}} + \mathit{\boldsymbol{\lambda }}\left\| {\mathit{\boldsymbol{y}} - \mathit{\boldsymbol{Dx}}} \right\|_2^2 $ (6)

这是一种被广泛应用的群稀疏表示,通过(6)式,可得到具有群稀疏结构的表示系数x,其非零值集中在少数类别上,取得了较好的识别效果。

1.2 鲁棒主成分分析

现实中采集到的人脸图像数据往往会存在一定的干扰信息,如异物遮挡、高斯噪声、局部像素点的破坏等。因为RPCA具有在图片损坏的情况下也能准确地恢复出图像的性质。因此,本文将RPCA[1]方法引入到人脸识别中并对其进行改进。原始的RPCA模型为

$ \begin{array}{l} {\rm{mi}}{{\rm{n}}_{A,E}}( {\rm{rank}} (\mathit{\boldsymbol{A}}) + \mathit{\boldsymbol{\lambda }}{\left\| \mathit{\boldsymbol{E}} \right\|_0})\\ {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\rm{s}}{\rm{.t}}{\rm{.}}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \mathit{\boldsymbol{D}} = \mathit{\boldsymbol{A}} + \mathit{\boldsymbol{E}} \end{array} $ (7)

(7) 式中:A为需要恢复的低秩成分;E为噪声矩阵;‖E0表示矩阵El0范数。(7)式为NP难问题,因此将其松弛为

$ \begin{array}{l} {\rm{mi}}{{\rm{n}}_{\mathit{\boldsymbol{A}},\mathit{\boldsymbol{E}}}}( {\kern 1pt} \left\| {{\kern 1pt} \mathit{\boldsymbol{A}}{\kern 1pt} } \right\|{\kern 1pt} {{\kern 1pt} _ * } + \mathit{\boldsymbol{\lambda }}{\kern 1pt} {\kern 1pt} {\kern 1pt} \left\| {{\kern 1pt} \mathit{\boldsymbol{E}}{\kern 1pt} } \right\|{\kern 1pt} {\kern 1pt} {\kern 1pt} 1{\kern 1pt} )\\ {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\rm{s}}{\rm{.t}}{\rm{.}}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \mathit{\boldsymbol{D}} = \mathit{\boldsymbol{A}} + \mathit{\boldsymbol{E}} \end{array} $ (8)

用(8)式的RPCA模型可将从单一类别受污染的数据Di中恢复其潜在的低秩结构数据Ai,并移除稀疏误差Ei,建模为Di=Ai+Ei,数学上求解如下问题

$ \begin{array}{l} {\rm{mi}}{{\rm{n}}_{{\mathit{\boldsymbol{A}}_i},{\mathit{\boldsymbol{E}}_i}}}( {\kern 1pt} \left\| {{\kern 1pt} {\mathit{\boldsymbol{A}}_i}{\kern 1pt} } \right\|{\kern 1pt} {{\kern 1pt} _ * } + \mathit{\boldsymbol{\xi }} {\kern 1pt} {\kern 1pt} {\kern 1pt} \left\| {{\kern 1pt} {\mathit{\boldsymbol{E}}_i}{\kern 1pt} } \right\|{\kern 1pt} {\kern 1pt} {{\kern 1pt} _{1{\kern 1pt} }})\\ {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\rm{s}}{\rm{.t}}{\rm{.}}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\mathit{\boldsymbol{D}}_i} = {\mathit{\boldsymbol{A}}_i} + {\mathit{\boldsymbol{E}}_i} \end{array} $ (9)

(9) 式中:ξ(ξ>0)为权重参数;‖Ai*指的是数据矩阵Ai奇异值的和;‖Ei1用于替代‖Ei0以度量Ei的稀疏性。(9)式可以采用增广拉格朗日乘子法求解。通过求解(9)式可恢复原始训练数据D中的低秩成分A,移除误差成分E

2 基于RPCA的群稀疏表示

RPCA可用于恢复受污染数据中潜在的低秩结构,但存在3个方面的问题。首先,RPCA将数据中的低秩成分与稀疏误差成分建模为“和”的关系,这种简单假设未必能够适应现实的复杂情况。例如在光照条件下,应用广泛的朗伯光照模型的简化版本假设人脸图像I(x, y)是由反射分量L(x, y)和光照分量R(x, y)的乘积得到[15],即

$ I(x,y) = L(x,y) \times R(x,y) $ (10)

(10) 式中,反射分量可以看成人脸图像稳定的内在身份性特征,对于来自同一人的一组人脸图像数据,其反射分量是相关的,具备低秩结构。基于此,本文首先将待处理数据转换到对数域下,则(10)式可转化为

$ {\rm{log}}I(x,y) = {\rm{log}}L(x,y) + {\rm{log}}R(x,y) $ (11)

借助对数域变换,一方面,可以拉伸人脸图像的暗像素而压缩亮像素,增强图像对比度;另一方面,可将人脸图像光照模型由乘性模型变为加性模型,适应低秩矩阵恢复技术的基本假设,潜在地将光照模型与低秩矩阵恢复技术结合起来,以应对现实中的复杂情况。为叙述方便,下文中,仍以DAE表示原始训练数据对应的对数域数据。

其次,在人脸识别应用中,RPCA一般采取如(9)式中的逐类恢复的策略[8],由于不同人脸在结构模式上存在较强的相似性,恢复出的不同类别的低秩数据可能趋于同质。因此,本文在低秩矩阵恢复过程中,引入结构非相关性约束,使得恢复出的不同类别的低秩成分能够尽可能保持独立,保持较强的鉴别力[12]。考虑描述为(12)式的问题

$ \begin{array}{*{20}{c}} {{\rm{mi}}{{\rm{n}}_{A,E}}\sum\limits_{i = 1}^C {\{ |{\mathit{\boldsymbol{A}}_{i{\kern 1pt} * }} + \mathit{\boldsymbol{\xi }} {{\left\| {{\mathit{\boldsymbol{E}}_i}} \right\|}_1}\} } + }\\ {\mathit{\boldsymbol{\eta }} \sum\limits_{j \ne i} {\left\| {\mathit{\boldsymbol{A}}_j^{\rm{T}}{\mathit{\boldsymbol{A}}_i}} \right\|_F^2} }\\ {{\rm{ s}}{\rm{.t}}{\rm{.}}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\mathit{\boldsymbol{D}}_i} = {\mathit{\boldsymbol{A}}_i} + {\mathit{\boldsymbol{E}}_i}} \end{array} $ (12)

(12) 式中:第1项为低秩矩阵恢复运算,在对数域下,将每一类训练样本数据D分解为代表人脸本质特征的低秩成分Ai以及代表类内差异的误差成分Ei之和的形式;第2项是约束恢复不同类的低秩数据之间相关性尽可能小,可增强恢复数据的鉴别力;C为矩阵A的行数。本文逐类求解(12)式,即

$ \begin{array}{l} {\rm{mi}}{{\rm{n}}_{{A_i},{E_i}}}\left\| {{\mathit{\boldsymbol{A}}_{i{\kern 1pt} }}{|_{{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} * }} + \mathit{\boldsymbol{\xi }} \left\| {{\mathit{\boldsymbol{E}}_{i{\kern 1pt} }}{|_{{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} 1}} + \mathit{\boldsymbol{\eta }} \sum\limits_{j \ne i} {\mathit{\boldsymbol{A}}_j^{\rm{T}}{\mathit{\boldsymbol{A}}_i}} } \right\|_F^2} \right.\\ {\rm{ }}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\rm{s}}{\rm{.t}}{\rm{.}}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\mathit{\boldsymbol{D}}_i} = {\mathit{\boldsymbol{A}}_i} + {\mathit{\boldsymbol{E}}_i} \end{array} $ (13)

(13) 式中,η(η>0)为权重参数。在恢复数据Ai时,Aj(ji)保持不变,通过约束$\sum\limits_{j \ne i} {\left\| {\mathit{\boldsymbol{A}}_j^{\rm{T}}{\mathit{\boldsymbol{A}}_i}} \right\|_F^2} $最小化,使Ai与其他类恢复数据Aj(ji)之间的相关性尽可能小。为使问题更易求解,考虑存在关系式‖AjTAiF2≤ ‖AjF2AiF2, 令$\eta ' = \sum {\left\| {{\mathit{\boldsymbol{A}}_j}} \right\|_F^2} $,(13)式可松弛为

$ \begin{array}{*{20}{c}} {{\rm{mi}}{{\rm{n}}_{{A_i},{E_i}}}\left\| {{\mathit{\boldsymbol{A}}_i}} \right\|{\kern 1pt} {{\kern 1pt} _*} + \mathit{\boldsymbol{\xi }}\left\| {{\mathit{\boldsymbol{E}}_i}} \right\|{\kern 1pt} {{\kern 1pt} _1} + {\mathit{\boldsymbol{\eta }}^\prime }\left\| {{\mathit{\boldsymbol{A}}_i}} \right\|{\kern 1pt} {\kern 1pt} _F^2}\\ {{\rm{ s}}{\rm{.t}}{\rm{. }}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\mathit{\boldsymbol{D}}_i} = {\mathit{\boldsymbol{A}}_i} + {\mathit{\boldsymbol{E}}_i}} \end{array} $ (14)

利用增广拉格朗日乘子法来逐类求解(14)式,可从受污染数据D得到恢复低秩数据A,移除稀疏噪声误差E

RPCA存在的另一个问题是该方法是转导推理式的,不能用于处理未参与训练的数据,而对这部分新数据,RPCA需要重新计算所有的数据,这将限制RPCA在现实问题中的应用。受文献[16]启发,本文假定原始污染训练集D与从D中恢复的低秩数据A之间存在潜在的映射关系矩阵P。本文学习该潜在映射关系矩阵A=PD,并用之矫正存在污染的测试数据,有优化问题为

$ \begin{array}{*{20}{c}} {{\rm{mi}}{{\rm{n}}_{\mathit{\boldsymbol{P}},\mathit{\boldsymbol{A}}}}\left\| {{\kern 1pt} \mathit{\boldsymbol{P}}{\kern 1pt} } \right\|{\kern 1pt} {{\kern 1pt} _*} + \mathit{\boldsymbol{\zeta }}{\kern 1pt} {\kern 1pt} {\kern 1pt} \left\| {{\kern 1pt} \mathit{\boldsymbol{E}}{\kern 1pt} } \right\|{\kern 1pt} {{\kern 1pt} _1}}\\ {{\rm{s}}{\rm{.t}}{\rm{. }}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \mathit{\boldsymbol{D}} = \mathit{\boldsymbol{PD}} + \mathit{\boldsymbol{E}}} \end{array} $ (15)

(15) 式中,ζ(ζ>0)为权重参数。在本文的场景下,恢复数据A及误差E已经通过逐类求解(14)式得到,则模型(15)式转化为

$ \begin{array}{*{20}{c}} {{\rm{mi}}{{\rm{n}}_\mathit{\boldsymbol{P}}}\left\| {{\kern 1pt} \mathit{\boldsymbol{P}}{\kern 1pt} } \right\|{\kern 1pt} {{\kern 1pt} _*}}\\ {{\rm{s}}{\rm{.t}}{\rm{. }}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \mathit{\boldsymbol{A}} = \mathit{\boldsymbol{PD}}} \end{array} $ (16)

(16) 式有闭式解

$ {\mathit{\boldsymbol{P}}^ * } = \mathit{\boldsymbol{A}}{\mathit{\boldsymbol{D}}^\dagger } $ (17)

(17) 式中,${\mathit{\boldsymbol{D}}^\dagger }$D的伪逆,${\mathit{\boldsymbol{D}}^\dagger }$=VΣ-1UTUΣ-1VTD的瘦SVD,即仅保留D的正奇异值。P可将测试数据γ映射到其对应的潜在子空间下,移除其中的误差成分,得到“干净”的测试样本y=

通过以上步骤可得到恢复的训练数据集A和测试数据y。由于人脸数据维度较高,本文进一步将Ay进行PCA降维处理并按l2范数归一化。为方便叙述,本文仍用Ay表示PCA降维归一化后的训练样本矩阵和测试样本向量。

进一步地,为克服SRC方法样本稀疏的不确定性,本文求解yA上的群稀疏表示系数,提出优化问题为

$ \mathit{\boldsymbol{\hat x}} = {\rm{arg}}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\rm{mi}}{{\rm{n}}_x}\frac{1}{2}\left\| {\mathit{\boldsymbol{y}} - \mathit{\boldsymbol{Ax}}} \right\|{\kern 1pt} {{\kern 1pt} _1} + \mathit{\boldsymbol{\eta }}\sum\limits_{i = 1}^C {{{\left\| {{\mathit{\boldsymbol{x}}_i}} \right\|}_2}} $ (18)

$\sum\limits_{i = 1}^C {{{\left\| {{\mathit{\boldsymbol{x}}_i}} \right\|}_2}} $将训练样本标签信息引入表示系数的学习过程中,对类内施加l2范数约束,对类间施加l1范数约束,使得求得的非零系数集中在少数类别上,具有群稀疏结构。同时,第一项‖y-Ax1利用l1范数度量表示残差,对误差成分更为鲁棒。本文采用增广拉格朗日乘子法[17]求解(18)式,首先(18)式可转化为

$ \begin{array}{*{20}{c}} {{\rm{arg}}\;{\kern 1pt} {\kern 1pt} {\kern 1pt} {\rm{mi}}{{\rm{n}}_{x,e}}\frac{1}{2}\left\| {{\kern 1pt} \mathit{\boldsymbol{e}}{\kern 1pt} } \right\|{\kern 1pt} {{\kern 1pt} _1} + \mathit{\boldsymbol{\eta }}\sum\limits_{i = 1}^C {\left\| {{\kern 1pt} {\mathit{\boldsymbol{x}}_i}{\kern 1pt} } \right\|{\kern 1pt} {{\kern 1pt} _2}} }\\ {{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\rm{ s}}{\rm{.t}}{\rm{.}}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \mathit{\boldsymbol{e}} = \mathit{\boldsymbol{y}} - \mathit{\boldsymbol{Ax}}} \end{array} $ (19)

为使分量可分离,问题更易求解,引入辅助变量uRn,(19)式等价于

$ \begin{array}{*{20}{c}} {{\rm{argmi}}{{\rm{n}}_{x,e,u}}\frac{1}{2}\left\| {{\kern 1pt} \left. \mathit{\boldsymbol{e}} \right|{\kern 1pt} {{\kern 1pt} _1}{\kern 1pt} + \mathit{\boldsymbol{\lambda }}\sum\limits_{i = 1}^C {\left| {{\kern 1pt} {\mathit{\boldsymbol{u}}_i}{\kern 1pt} } \right.} } \right\|{\kern 1pt} {{\kern 1pt} _2}}\\ {{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\rm{s}}{\rm{.t}}{\rm{.}}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \mathit{\boldsymbol{e}} = \mathit{\boldsymbol{y}} - \mathit{\boldsymbol{Ax,x}} = \mathit{\boldsymbol{u}}} \end{array} $ (20)

应用ALM(application lifecycle management)得到(20)式的非受限等价优化问题为

$ \begin{array}{l} {\rm{argmi}}{{\rm{n}}_{x,e,u}}\frac{1}{2}{\kern 1pt} {\kern 1pt} {\kern 1pt} \left\| {{\kern 1pt} \mathit{\boldsymbol{e}}{\kern 1pt} } \right\|{\kern 1pt} {{\kern 1pt} _1} + \mathit{\boldsymbol{\lambda }}\sum\limits_{i = 1}^C {{{\left\| {{\mathit{\boldsymbol{u}}_i}} \right\|}_2}} + \\ {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \frac{\mathit{\boldsymbol{\mu }}}{2}({\kern 1pt} {\kern 1pt} \left\| {{\kern 1pt} \mathit{\boldsymbol{y}} - \mathit{\boldsymbol{Ax}} - \mathit{\boldsymbol{e}}{\kern 1pt} } \right\|{\kern 1pt} {\kern 1pt} _2^2 + {\kern 1pt} {\kern 1pt} {\kern 1pt} \left\| {{\kern 1pt} \mathit{\boldsymbol{x}} - \mathit{\boldsymbol{u}}{\kern 1pt} } \right\|{\kern 1pt} ) + \\ {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\mathit{\boldsymbol{\alpha }}^{\rm{T}}}(\mathit{\boldsymbol{y}} - \mathit{\boldsymbol{Ax}} - \mathit{\boldsymbol{e}}) + {\mathit{\boldsymbol{\beta }}^{\rm{T}}}(\mathit{\boldsymbol{x}} - \mathit{\boldsymbol{u}}) \end{array} $ (21)

(21) 式中:μ(μ>0)为惩罚参数;αRmβRn为拉格朗日乘子。对(21)式,本文采取一种交替优化的策略,分别对x, e, u进行优化。首先固定变量x, u, 优化e,此时(21)式转化为

$ {\rm{argmi}}{{\rm{n}}_e}{\kern 1pt} {\kern 1pt} {\kern 1pt} \frac{1}{{2\mathit{\boldsymbol{\mu }}}}{\left\| {{\kern 1pt} \mathit{\boldsymbol{e}}{\kern 1pt} } \right\|_1} + \frac{1}{2}\left\| {{\kern 1pt} \mathit{\boldsymbol{e}} - \left( {\mathit{\boldsymbol{y}} - \mathit{\boldsymbol{Ax}} + \frac{\mathit{\boldsymbol{\alpha }}}{\mathit{\boldsymbol{\mu }}}} \right){\kern 1pt} } \right\|_2^2 $ (22)

(22) 式可通过软阈值操作算子来求解[20],即

$ \mathit{\boldsymbol{e}} = \frac{{{S_1}}}{{2\mathit{\boldsymbol{\mu }}}}\left( {\mathit{\boldsymbol{y}} - \mathit{\boldsymbol{Ax}} + \frac{\mathit{\boldsymbol{\alpha }}}{\mathit{\boldsymbol{\mu }}}} \right) $ (23)

(23) 式中算子Sγ[χ]i=sign(χi)·max{|χi|-γ,0}, sign(·)是符号函数。

然后,固定变量xe,优化u,则(22)式转化为

$ \begin{array}{l} {\rm{arg}}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\rm{mi}}{{\rm{n}}_u}\mathit{\boldsymbol{\lambda }}\sum\limits_{i = 1}^C {\left\| {{\kern 1pt} {\mathit{\boldsymbol{u}}_i}{\kern 1pt} } \right\|{\kern 1pt} {{\kern 1pt} _2}} + \frac{\mathit{\boldsymbol{\mu }}}{2}\left\| {\mathit{\boldsymbol{x}} - \mathit{\boldsymbol{u}}} \right\|{\kern 1pt} {\kern 1pt} _2^2 + \\ {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\mathit{\boldsymbol{\beta }}^{\rm{T}}}(\mathit{\boldsymbol{x}} - \mathit{\boldsymbol{u}}) \end{array} $ (24)

经代数变换,(24)式转化为

$ {\rm{arg}}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\rm{mi}}{{\rm{n}}_u}\sum\limits_{i = 1}^C {\left\{ {\mathit{\boldsymbol{\lambda }}{\kern 1pt} {\kern 1pt} {{\left\| {{\kern 1pt} {\mathit{\boldsymbol{u}}_i}{\kern 1pt} } \right\|}_2} + \frac{\mathit{\boldsymbol{\mu }}}{2}\left\| {{\kern 1pt} {\mathit{\boldsymbol{u}}_i} - {\mathit{\boldsymbol{x}}_i} - {\mathit{\boldsymbol{\beta }}_i}/\mathit{\boldsymbol{\mu }}{\kern 1pt} {\kern 1pt} } \right\|{\kern 1pt} {\kern 1pt} _2^2} \right\}} $ (25)

通过一维收缩算子[20],得到(25)式的闭式解为

$ {\mathit{\boldsymbol{u}}_i} = {\rm{max}}\left( {{{\left\| {{\kern 1pt} {\mathit{\boldsymbol{r}}_i}{\kern 1pt} } \right\|}_2} - \frac{\mathit{\boldsymbol{\lambda }}}{\mathit{\boldsymbol{\mu }}},0} \right){\kern 1pt} {\kern 1pt} {\kern 1pt} \frac{{{\mathit{\boldsymbol{r}}_i}}}{{{{\left\| {{\kern 1pt} {\mathit{\boldsymbol{r}}_i}{\kern 1pt} } \right\|}_2}}} $ (26)

(26) 式中,ri=xi+βi/μ, i=1, 2, …, C

最后,固定e, u,优化x,此时(21)式转化为

$ \begin{array}{l} {\rm{arg}}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\rm{mi}}{{\rm{n}}_x}\frac{\mathit{\boldsymbol{\mu }}}{2}\left( {\left\| {\mathit{\boldsymbol{y}} - \mathit{\boldsymbol{Ax}} - \mathit{\boldsymbol{e}} + \frac{\mathit{\boldsymbol{\alpha }}}{\mathit{\boldsymbol{\mu }}}} \right\|_2^2 + } \right.\\ \left. {{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \left\| {\mathit{\boldsymbol{x}} - \mathit{\boldsymbol{u}} + \frac{\mathit{\boldsymbol{\beta }}}{\mathit{\boldsymbol{\mu }}}} \right\|_2^2} \right) \end{array} $ (27)

目标函数对x求导,并令其为0,可得

$ \mathit{\boldsymbol{x}} = (\mathit{\boldsymbol{\mu }}{\mathit{\boldsymbol{A}}^{\rm{T}}}\mathit{\boldsymbol{A}} + \mathit{\boldsymbol{\mu }} \circ \mathit{\boldsymbol{I}})(\mathit{\boldsymbol{\mu Ay}} - \mathit{\boldsymbol{\mu }}{\mathit{\boldsymbol{A}}^{\rm{T}}}\mathit{\boldsymbol{e}} + {\mathit{\boldsymbol{A}}^{\rm{T}}}\mathit{\boldsymbol{\alpha }} + \mathit{\boldsymbol{\mu u}} - \mathit{\boldsymbol{\beta }}) $ (28)

随后,更新拉格朗日乘子与惩罚参数

$ \begin{array}{*{20}{l}} {\mathit{\boldsymbol{\alpha }} = \mathit{\boldsymbol{\alpha }} + \mathit{\boldsymbol{\mu }}(\mathit{\boldsymbol{y}} - \mathit{\boldsymbol{Ax}} - \mathit{\boldsymbol{e}})}\\ {{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \mathit{\boldsymbol{\beta }} = \mathit{\boldsymbol{\beta }} + \mathit{\boldsymbol{\mu }}(\mathit{\boldsymbol{x}} - \mathit{\boldsymbol{u}})}\\ {{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \mathit{\boldsymbol{\mu }} = {\rm{min}}(\mathit{\boldsymbol{\rho \mu }},{\mathit{\boldsymbol{\mu }}_{{\rm{max}}}})} \end{array} $ (29)

求解(20)式的整体算法流程如算法1。

算法1

输入:恢复训练集A,测试样本y, 参数λ

初始化:x=0,u=0,e=0,β=0,α=0,μ=10-3μmax=106ρ=1.50,ε=10-3

未收敛时,重复

Step1利用(23)式更新e

Step2利用(26)式更新u

Step3利用(28)式更新x

Step4按照(29)式更新拉格朗日乘子与惩罚参数。

Step5检查此时是否满足收敛条件

y-Ax-e < ε,‖x-u < ε

直到收敛。

输出:稀疏系数x与误差e

利用算法1求得测试样本的表示系数x以及表示误差e后,重建的测试样本可表示为

$ \mathit{\boldsymbol{\hat y}} = \mathit{\boldsymbol{y}} - \mathit{\boldsymbol{e}} $ (30)

本文定义如下决策准则获得识别结果

$ identity(\mathit{\boldsymbol{y}}) = {\rm{arg}}{\kern 1pt} {\kern 1pt} {\kern 1pt} {\rm{min}}\{ {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \left\| {{\kern 1pt} \mathit{\boldsymbol{\hat y}} - {\mathit{\boldsymbol{A}}_i}{\mathit{\boldsymbol{x}}_i}{\kern 1pt} } \right\|{\kern 1pt} {\kern 1pt} /{\kern 1pt} {\kern 1pt} \left\| {{\kern 1pt} {\mathit{\boldsymbol{x}}_i}{\kern 1pt} } \right\|{\kern 1pt} {{\kern 1pt} _2}\} $ (31)

(31) 式中:Ai为恢复数据中对应于类别i的训练样本子集;xi为表示系数x中对应于类别i的子表示系数,由于xi中也蕴含着有利于人脸识别分类的判别性信息,因此, 本文在(31)式中也将这部分信息考虑在内。本文算法的总体步骤如算法2。

算法2   GSR-RPCA

输入:训练样本D,测试样本y

Step1在对数域下,逐类求解(14)式得到恢复的低秩训练数据集A

Step2求解(15)式得到原始训练样本集D与恢复数据A之间潜在的低秩映射关系矩阵P,可用于矫正测试样本中存在的干扰误差。

Step3对获得恢复的训练数据集A和测试数据y,进行PCA降维并做l2范数归一化处理。

Step4利用算法1求解(20)式,得到测试样本y在训练集上的群稀疏表示系数与表示残差。

Step5根据(31)式对测试样本y判别分类。

输出:测试样本y的类别。

3 实验验证

利用Matlab在CMU PIE,Extended Yale B和AR 3个人脸图像数据库上评估本文GSR-RPCA方法的性能。对比算法包括:稀疏表示分类(SRC)[3],低秩矩阵恢复(low-rank matrix recovery, LR)[11], 非相关性约束的低秩矩阵恢复(low-rank matrix recovery with structural in coherence, LRSI)[11]和鉴别低秩表示分类(discriminative low-rank representation, DLRR)[12],群稀疏表示分类(group sparsity representation classification, GSC)[14], 基于RPCA稀疏误差方法E-RPCA(face recognition algorithm based on improved RPCA)[21]和删除污染数据的稳健人脸识别方法[22] (removing contaminated data for illumination-robust face recognition, RCDFR)。实验环境为Matlab version R2011a,桌面是1.86 GHz CPU和2.99G RAM。

3.1 无遮挡人脸识别 3.1.1 Extended Yale B数据库

Extended Yale B人脸数据库包含38个人在光照条件变化下的2 400多张正面人脸对齐图像,每人约64张,其中,部分人脸图像如图 2a。本实验随机选取每人16张图像做训练样本,其余为测试样本,表 1给出了在此设置下各方法在特征维数分别为50,100,200时的识别率。由表 1,在无遮挡的条件下,GSR-RPCA的识别率高于其他方法达10%以上,最高识别率达95.75%。

图 2 实验数据库中部分人脸图像 Fig.2 Partial face image in the experimental database
表 1 每人16张图像做训练样本时的识别率 Tab.1 Recognition rate when 16 images per person are used as training samples
3.1.2 CMU PIE数据库

CMU PIE数据库共有68个人的41 368张人脸图像,该数据库中部分人脸图像如图 2b。本实验选取其中的C06子集,分别从每个人的图像中随机选取12张图像构成训练样本集,其余为测试样本集。表 2分别给出了在CMU PIE数据库上各方法在特征维数分别为50,100,200时的识别率。可以看出,在无遮挡的情况下,GSR-RPCA方法的识别率略高于其他方法。

表 2 每人10张图像做训练样本时的识别率 Tab.2 Recognition rate when 10 images per person are used as training samples
3.1.3 AR数据库

AR数据库包含126个人的4 000多张正面人脸图像,每人有26张图片。分为Session1和Session2两部分,每部分含3张戴太阳镜、3张戴围巾以及7张有光照表情变化的无遮挡的人脸图像,图 2c为AR数据库部分人脸图像。本文选取包含50男和50女的每人14张无遮挡图像为实验数据,从中随机选取每人7张图像做训练样本,其余7张做测试样本。表 3给出了各方法在特征维数分别为50,100,200时的识别率,可以看出,在AR数据库上无遮挡的情况下,各方法的识别率均能达到93%,其中,GSR-RPCA最高识别率为95.23%,略高于其他方法。

表 3 AR数据库无遮挡子集上各方法识别率 Tab.3 Recognition rate of each method on clean subset of AR database

综上所述,在无遮挡的条件下,本文提出的GSR-RPCA方法的识别率整体上略高于其他人脸识别方法,随着图像特征维数的升高都能够达到95%。

3.2 遮挡人脸识别 3.2.1 Extended Yale B数据库

本实验从Extended Yale B人脸数据库中每人随机取16张图像做训练集,其余图像做测试集。考察随机像素损毁10%和20%、块状遮挡10%和20% 2种情况,各人脸识别方法在不同特征维数下的识别率。对于块状遮挡,实验中用狒狒图像随机遮挡测试图像10%和20%的面积,如图 3a。对于随机像素损毁,对每一幅测试图像,用满足独立同分布的0~255之间的随机值,在任意位置替换图像中一定比例像素点的灰度值,并调整图像中像素点被损毁的比例,如图 3b图 4~图 7分别显示了在该数据库上存在10%遮挡、20%遮挡、10%像素损毁和20%像素损毁的情况下,各方法随特征维数变化识别率曲线。

图 3 遮挡条件下部分实验图像 Fig.3 Partial face image with occlusion
图 4 10%遮挡下各方法识别率 Fig.4 Recognition rate (%) of each method under 10% occlusion
图 5 20%遮挡下各方法识别率 Fig.5 Recognition rate of each method under 20% occlusion
图 6 10%损毁下各方法识别率 Fig.6 Recognition rate of each method under 10% damage
图 7 20%损毁下各方法识别率 Fig.7 Recognition rate of each method under 20% damage

图 4图 5可以看出,在Extended Yale B数据库上存在块状遮挡的情况下,GSR-RPCA方法的识别率都高于其他方法。当图像特征维数为400时,在10%遮挡的情况下,GSR-RPCA识别率高达95%,略高于RCDFR;在20%遮挡的情况下,GSR-RPCA识别率接近90%,高于其他方法约5%。

图 6图 7可以看出,在Extended Yale B数据库上,在像素损毁的情况下,本文提出的GSR-RPCA方法的识别率都明显高于其他方法,在10%像素损毁时,GSR-LRRSI方法识别率近90%,比其他方法高出约3%;在20%比例像素损毁时,识别率达到85%,也高于其他方法。

3.2.2 AR两种设置

设置1   训练集和测试集人脸图像均存在太阳镜遮挡。随机取AR数据库Session 1中每人7张无遮挡以及1张戴太阳镜的图像作为训练集。取Session 1和Session 2中每人剩余的戴太阳镜的5张图像以及Session 2中的7张无遮挡图像做测试集。

设置2  训练集和测试集人脸图像均存在围巾和太阳镜遮挡,如图 3c所示。随机取AR数据库Session 1中每人7张无遮挡、1张戴围巾和1张戴太阳镜的图像作为训练集,共9张。并取Session 1和Session 2剩余的共17张人脸图像做测试集。

图 8图 9分别给出了在AR数据库上不同设置下,各方法识别率随图像特征维数变化的曲线。

图 8 设置1下各方法识别率 Fig.8 Recognition rate of each method under setting 1
图 9 设置2下各方法识别率 Fig.9 Recognition rate of each method under setting 2

图 8可以看出,在训练集和测试集均存在太阳镜遮挡的情形下,GSR-RPCA即使特征维数为50的情况下识别率依然能达到80%,随着图像特征维数的升高识别率可以达到87%,高于其他方法约5%。由图 9可以看出,在训练集和测试集均存在围巾和太阳眼镜遮挡的情形下,GSR-RPCA方法的识别率略优于DLRR,GSC等方法,识别率约提升了3%。

从实验3.2可以看出,在训练样本与测试样本均存在遮挡的情况下,本文提出的GSR-RPCA方法的识别率都明显高于SRC,LR,LRSI,GSC和DLRR等人脸识别方法,略高于E-RPCA和RCDFR,这是因为E-RPCA和本文方法一样均对RPCA方法在低秩恢复过程中进行了改进,而RCDFR方法针对存在的遮挡、污染等部分进行了有效的删除处理,也在一定程度上保证了算法的识别效率。与其他方法不同的是,GSR-RPCA方法首先通过对数域变换,拉伸了训练样本图像的暗像素压缩了亮像素,增强了图像对比度,有助于提高低秩矩阵分解的准确性,从而提高识别率,且对数域变换可将人脸图像光照模型由乘性模型变为加性模型,适应低秩矩阵恢复技术的基本假设,潜在地将光照模型与低秩矩阵恢复技术结合起来,可以更好地应对图像遮挡、像素损毁等复杂情况。其次,与经典的SRC方法相比,GSR-RPCA方法通过项$\sum\limits_{i = 1}^C {{{\left\| {{\mathit{\boldsymbol{x}}_i}} \right\|}_2}} $将训练样本标签信息引入表示系数的学习过程中,对类内施加l2范数约束,对类间施加l1范数约束,使得求得的表示系数x中的非零系数集中在少数类别上,具有群稀疏结构,克服了SRC方法样本稀疏的不确定性,求解群稀疏表示稀疏的公式中的第一项‖y-Ax1利用l1范数度量表示残差,对遮挡、像素损毁等成分更为鲁棒。与LR,DLRR方法相比,GSR-RPCA在低秩恢复的过程中引入了非相关性约束,通过约束$\sum\limits_{j \ne j} {\left\| {{\mathit{\boldsymbol{A}}^{\rm{T}}}j{\mathit{\boldsymbol{A}}_i}} \right\|_F^2} $最小化,使得恢复出的不同类别的低秩成分能够尽可能保持独立,保持较强的鉴别力。与LRSI方法相比,GSR-RPCA方法通过学习原有训练样本数据与恢复出的低秩数据之间存在的低秩映射关系矩阵P,对测试样本数据存在的遮挡、像素损毁等误差进行了进一步的矫正,在提高人脸图像识别率的同时可以直接对存在遮挡等污染的训练样本进行处理,不必像其他方法一样进行转导式推理,可以适应复杂的人脸识别系统,提高人脸识别的鲁棒性。

3.3 GSR-RPCA时间性能分析

这里比较本文提出的GSR-RPCA和SRC、协作表示分类(collaborative representation based classification,CRC)[23]方法在测试样本均存在遮挡的情况下的运行时间,实验环境和前面实验一样。选取这2个方法是因为SRC是最具代表性的识别算法,CRC对SRC进行了改进,也是快速人脸识别系统中经常用到的识别算法。实验3.1和3.2中提到的LR,LRSI,DLRR,RPCA和FCDFR等算法主要针对提升人脸识别率,对时间的考虑不多,整体时间性能一般,与SRC相比并没有明显的改进,故在此不用这些算法进行时间性能实验的对比。

从AR数据库中选择50名男性和50名女性的子集为实验数据集。取来自Session 1的没有遮挡的每人的7个样本用于训练,来自Session 1和Session 2中剩余3张戴太阳镜的和3张戴围巾的样本用于测试。SRC和CRC方法中l1范数最小化问题均用ALM(augmented lagrange multiplication)求解。各方法识别率和运行时间的结果如表 4

表 4 遮挡条件下各方法识别率和平均运行时间 Tab.4 R Recognition rate and average running time of each method under occlusion conditions

表 4可以看出,每个测试样品的SRC运行时间约为12 s,这对于实际应用的人脸识别系统来说很长。GSR-RPCA需要约2.5 s,其中平均运行时间最快的为CRC,仅需不到2 s,2种方法均比SRC提高了约6倍。虽然GSR-RPCA比CRC略慢,但其识别率比CRC高出10%以上,且其运行时间不算太长,实时性不算差,这是因为在RPCA结构非相关分解的过程中花费了一定的时间,但本文提出的低秩投影矩阵P可以提前计算,这大大节约了时间成本。因此,综合考虑,GSR-RPCA还是有可取之处的。

4 结束语

稀疏表示分类和鲁棒主成分分析是人脸识别问题的两个重要解决方式。本文提出了一种基于RPCA的群稀疏人脸识别方法,该人脸识别方法将人脸图像由空域变换到对数域,增强人脸图像的对比度和可识别性,通过结构非相关RPCA算法得到各子类低秩成分相关性降低的训练样本,增强了恢复数据的鉴别力。且GSR-RPCA通过学习低秩成分与原始训练数据之间的低秩映射关系矩阵,将测试样本映射到其潜在的子空间下,有效移除了测试样本中存在的误差成分。因此,本文提出的人脸识别方法对于存在光照、遮挡、噪声污染等情况下的人脸图像的识别具有较高的鲁棒性。通过群稀疏表示获得类关联重构残差与类关联系数对测试样本进行分类识别,提高了人脸图像的识别率。

参考文献
[1]
WANG M, DENG W H. Deep Face Recognition: A Survey[EB/OL].(2018-04-28)[2018-10-02]. https://www.researchgate.net/publication/324600003_Deep_Face_Recognition_A_Survey.
[2]
王进, 颉小凤, 胡明星, 等. 基于LBP预处理和子图像特征采样的人脸识别[J]. 江苏大学学报(自然科学版), 2016, 37(1): 85-91.
WANG J, JIE X F, HU M X, et al. Face recognition based on LBP preprocessing and sub-image feature sampling[J]. Journal of Jiangsu University(Natural Science Edition), 2016, 37(1): 85-91. DOI:10.3969/j.issn.1671-7775.2016.01.015
[3]
WRIGHT J, YANG A Y, GANESH A, et al. Robust face recognition via sparse representation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31(2): 210-227. DOI:10.1109/TPAMI.2008.79
[4]
李懿, 刘晓东. 一种新的模糊稀疏表示人脸识别算法[J]. 大连理工大学学报, 2017, 57(2): 189-194.
LI Y, LIU X D. A New Fuzzy Sparse Representation Face Recognition Algorithm[J]. Journal of Dalian University of Technology, 2017, 57(2): 189-194.
[5]
YANG M, ZHANG L. Gabor feature based robust representation and classification for face recognition with Gabor occlusion dictionary[J]. Pattern Recognition, 2013, 46(7): 1865-1878. DOI:10.1016/j.patcog.2012.06.022
[6]
YANG M, ZHANG L, YANG J, et al. Regularized robust coding for face recognition[J]. IEEE Trans Image Process, 2013, 22(5): 1753-1766. DOI:10.1109/TIP.2012.2235849
[7]
MA X, ZHANG F, LI Y, et al. Robust sparse representation based face recognition in an adaptive weighted spatial pyramid structure[J]. Science China(Information Sciences), 2018, 61(1): 012101.
[8]
ZHANG X Y, QIN L L, QIAN Y, et al. An Improved Sparse Representation Super Resolution Reconstruction Algorithm[J]. Journal of Chongqing University of Posts and Telecommunications(Natural Science Edition), 2016, 28(3): 400-405.
[9]
胡正平, 李静. 基于低秩子空间恢复的联合稀疏表示人脸识别算法[J]. 电子学报, 2013, 41(5): 987-991.
HU Z P, LI J. Joint sparse representation face recognition algorithm based on low rank subspace restoration[J]. Chinese Journal of Electronics, 2013, 41(5): 987-991. DOI:10.3969/j.issn.0372-2112.2013.05.024
[10]
CAND'ES E J, LI X D, MA Y, et al. Robust principal component analysis?[J]. J ACM, 2011, 58(3): 11: 1-11: 37.
[11]
CHEN C F, WEI C P, WANG Y C F. Low-rank matrix recovery with structural incoherence for robust face recognition[C]//Proc IEEE Conf Computer Vision and Pattern Recognition. Providence, RI, USA: IEEE, 2012: 2618-2625.
[12]
CHEN J, YI Z. Sparse Representation for Face Recognition by Discriminative Low-Rank Matrix Recovery[J]. Journal of Visual Communication & Image Representation, 2014, 25(5): 763-773.
[13]
MAJUMDAR A, WARD R K. Classification via group sparsity promoting regularization[C]//Proc IEEE Conf Acoustics, Speech Signal Process. Taipei, Taiwan: IEEE, 2009: 861-864.
[14]
LAI J, JIANG X. Class-wise Sparse and Collaborative Patch Representation for Face Recognition[J]. IEEE Transactions on Image Processing, 2016, 25(7): 3261-3272. DOI:10.1109/TIP.2016.2545249
[15]
CHEN W, MENG J E, WU S. Illumination compensation and normalization for robust face recognition using discrete cosine transform in logarithm domain[J]. IEEE Transactions on Systems Man & Cybernetics Part B Cybernetics A, 2006, 36(2): 458-466.
[16]
BAO B K, LIU G, XU C, et al. Inductive Robust Principal Component Analysis[J]. IEEE Transactions on Image Processing A Publication of the IEEE Signal Processing Society, 2012, 21(8): 3794-3800. DOI:10.1109/TIP.2012.2192742
[17]
BERTSEKAS D P. Constrained Optimization and Lagrange Multiplier Methods[M]. New York, NY, USA: Academic, 1996.
[18]
COMBETTES P L, WAJS V R. Signal recovery by proximal forward-backward splitting[J]. Multiscale Model Simul, 2005, 4(4): 1168-1200. DOI:10.1137/050626090
[19]
DENG W, YIN W, ZHANG Y. Group Sparse Optimization by Alternating Direction Method[C]//Proc SPIE 8858, Wavelets and Sparsity XV, 88580R. San Diego, California, USA: [s.n.], 2013: 1-15.
[20]
NASEEM R T, BENNAMOUN M. Linear regression for face recognition[J]. IEEE Trans Pattern Anal Machine Intell, 2010, 32(11): 2106-2112. DOI:10.1109/TPAMI.2010.128
[21]
SHOU Z Y, YANG X F, MO J W. A face recognition algorithm based on improved RPCA[J]. Application of Electronic Technique, 2015, 41(9): 157-160.
[22]
XU Z, LU Z Q, LI W F, et al. Removing contaminated data for illumination-robust face recognition[C]//International Conference on Systems, Signal and Image Processing. Poznan, Poland: IEEE, 2017: 6344-6346.
[23]
ZHANG L, YANG M, FENG X. Sparse representation or collaborative representation: Which helps face recognition?[C]//2011 International Conference on Computer Vision. Barcelona, Spain: IEEE, 2011: 471-478.