职场文秘网

首页 > 心得体会 > 学习材料 / 正文

基于二进制标签松弛模型的遮挡人脸识别

2023-01-13 12:20:08

韩 肖,马 祥

(长安大学 信息工程学院,陕西 西安 710064)

人脸识别作为计算机视觉和生物统计学领域的热点研究方向,在生活中的应用越来越多,如人脸门禁考勤、社区出入管理、车站人脸闸机等。虽然人脸识别技术已经相当成熟,但是人脸识别性能常因各种干扰而受到不同程度的影响。自2019年底爆发新冠疫情以来,出门戴口罩成为人们日常生活中的一部分,戴口罩引起的遮挡让人脸识别变得困难。因此,研究如何提高遮挡情况下人脸识别方法的性能具有重要意义。

传统的人脸识别方法在实验室环境下可以获得很高的识别率,如基于核范数的矩阵回归(norm based matrix regression,NMR)和基于低秩表示的方法,但当人脸图像存在遮挡时,其识别性能严重下降。近年来,针对人脸遮挡识别的研究越来越广泛,文献[10-11]针对有遮挡人脸识别方法进行了改进,虽然相比传统的特征提取方法提高了识别率,但在更复杂的场景下识别率仍然有待进一步提高。文献[12]提出了一种基于RPCA与低秩投影的有遮挡人脸识别方法,通过利用图像在低秩投影下产生的稀疏误差图像以及计算图像平滑度和边缘等鉴别信息,设计了基于误差图像平滑度和边缘信息加权和的鉴别准则。该方法对人为连续遮挡的识别效果较好,但是对真实遮挡的识别效果较差,同时该方法的计算效率低。文献[13]基于普通的两阶段人脸识别方法,提出了一种基于稀疏表示的快速人脸识别方法。该方法能够提高第一阶段的识别效率,但是在处理聚合度较高的数据集时,识别率较差。文献[14]提出了一种扩展稀疏人脸识别方法,该方法能够将样本集非线性地映射到新的特征空间中,再根据每个样本对识别的贡献,给每个样本赋予一定的权重,同时利用类内变量矩阵共同表示测试样本。该方法在小样本情况下的识别率较好,但是在样本数较大的情况下,识别率还需要进一步提高。

在文献[15-16]研究的基础上,该文利用低秩技术和二进制标签松弛模型,提出了一种新的基于二进制松弛标签的回归模型。通过引入标签松弛模型获得一个有利于提取更多有用特征的变换矩阵,从而保证每类原子重构一类训练样本。

1.1 算法改进方案

最小二乘回归(least squares regression,LSR)是图像分类领域中一种非常流行的方法。LSR的主要思想是学习一个将原始训练样本映射到二进制标签空间的投影矩阵。LSR的目标函数可以表示为:

(1)

其中,=[,,…,]∈

R

×表示

n

个训练样本,

d

是样本的维度;

R

×表示属于第

i

类的样本子集;
=[,,…,]∈

R

×,其中

c

≥2,表示的二进制标签矩阵,

y

是的第

i

列;
表示投影矩阵。由于LSR方法在投影学习过程中没有考虑数据相关性和潜在的数据结构,这可能会使一些有用的结构信息丢失,从而导致过拟合。而且回归矩阵追求严格的0-1标签,不能反映每个样本的特征,特别是在多类情况下,很难实现准确分类。与LSR不同,DLSR(discriminative LSR)尝试学习松弛回归标签代替二进制标签,利用

ε

-draggings技术来扩大真类和假类之间的距离。其回归模型可以表述为:

s.t.≥0

(2)

其中,⊙表示Hadamard-product算子;

R

×是非负

ε

-draggings标签松弛矩阵;

R

×是一个常数矩阵,定义为:

(3)

该方法将回归标签矩阵扩展为

Y

=

Y

+

B

S

,尽管使用了松弛标签,但会引起过度拟合问题。为了解决这个问题,在DLSR模型的基础上,文献[15]提出了一个低秩判别最小二乘回归模型(low-rank DLSR,LRDLSR),用公式表示为:

s.t.≥0

(4)

基于上述研究,发现将标签矩阵变得松弛更有利于分类,因此对上述方法进行如下改进:

s.t.≥0

(5)

接下来,将详细阐述如何将严格的二进制标签矩阵松弛为松弛标签矩阵。从∈

R

×中可以看出,包含

n

个样本的标签,中的每一列代表一个样本的标签。中的每个标签都属于

R

×1。目的是发现不同类别样本之间的标签矩阵。为了便于理解,假设的第一列、第二列和第三列分别表示tr1、tr2、tr3的标签,tr1、tr2、tr3分别属于第一类、第二类和第三类的训练样本。因此,二进制标签矩阵可以定义为:

(6)

(7)

此时tr1和tr3之间的距离为:

(8)

此时,tr1和tr2之间的距离为:

d

={[(1+)-(-1-)]+[(-1-)-(1+)]+…+[(-1-1)-(-1-2)]}12=[(2++)+(2++)+…+(-1+2)]12

(9)

tr1和tr3之间的距离为:

d

=[(2++)+(-+)+(-2--)+…+(-1+3)]12=[(2++)+(-+)+(2++)+…+(-1+3)]12

(10)

很明显,在大多数情况下

d

d

且比式(7)中的差距更大,更有利于分类。

1.2 算法的优化过程

该文利用交替方向乘子法(ADMM)对算法进行优化。引入一个辅助变量,使公式(5)变为:

s.t.=,≥0

(11)

进一步写出公式(11)的增广拉格朗日函数:

L

(,,,,)=

(12)

其中,是拉格朗日乘数,

μ

>0是惩罚因子,接下来逐个更新变量。(1)更新:通过固定变量、、和可以得到如下最小化问题:

解得:

=(1+

α

+

λ

+

μ

)×[+

α

(((⊙)-)+((⊙)-)⊙)+

μ

-]

(14)

(2)更新:给定变量、、和可以得到如下最小化问题:

(15)

解得:

(16)

其中,(Θ)是奇异值收缩算子。(3)更新:给定变量、、和可以得到如下最小化问题:

(17)

解得:

=(+

λ

)

(18)

(4)更新:更新、、后,可以通过以下方法更新非负松弛矩阵:

(19)

解得:

=max(⊙,0)

(20)

1.3 分 类

一旦解出(5),就可以得到最优投影矩阵。利用可以获得训练样本的投影特征,即。假设∈

R

为测试样本,则其投影特征为。该文采用KNN分类器实现分类。

在以下三个数据集上进行实验,这三个数据集中所有图像都预先调整到32×32。

(1)The Extended Yale B Dataset:扩展的Yale B数据集由2 414张人脸图像组成,这2 414张图像来自38个个体,其中每个个体有大约59~64张图像。随机选取每个个体的10、15、20和25张图像作为训练样本,剩余图像作为测试样本。

(2)The CMU PIE Dataset:本实验选择该数据集的一个子集,其中每个个体有170张图像。随机选取每个个体的10、15、20和25张图像作为训练样本,剩余图像作为测试样本。

(3)LFW Dataset:LFW是自然场景下的数据集,本实验选择该数据集的一个子集,包含62个个体的3 023张图像,每个个体至少有20张图像。从每个个体中随机选择7、8、9和10张图像作为训练样本,其余图像作为测试样本。上述实验数据集的部分图像如图1所示。

图1 实验数据集的部分图像

为了验证文中方法的识别性能,与一些现有方法进行对比。对比方法有LRDLSR、TSL_LRSR、RSLDA、LRPP_GRR、EALPL和SALPL。

2.1 无遮挡时的实验结果

无遮挡时的平均识别率如表1和表2所示,所有实验结果都是进行十次实验取平均值之后的结果。

由表1可知,与现有方法相比,文中方法能够取得较好的识别性能,这是因为文中方法能够提取更多的深层特征用于识别,从而提高识别率。由表2可知,文中方法在大多数情况下优于对比方法。特别的,与EALPL相比,文中方法的识别率提高了近30%。并且随着训练样本数量的增加,表中所有方法的识别率都会增加。综上所述,无遮挡时文中方法具有较好的识别性能。

表1 无遮挡时Yale B数据集的平均识别率 %

表2 无遮挡时CMU PIE数据集的平均识别率 %

2.2 有遮挡时的实验结果

本小节在训练样本数为25时,给Yale B和CMU PIE数据集的测试集分别添加10%、20%、30%和40%的随机遮挡块。实验结果如表3和表4所示,所有实验结果都是进行十次实验取平均值之后的结果。并且本小节在Yale B和CMU PIE数据集上计算了不同方法的运行时间,评估了该方法的计算效率。所有方法都是使用MatlabR2019b在具有i7-6700八核3.40 GHz CPU的PC上实现的。

表3 有遮挡时Yale B数据集的平均识别率(%)和 平均运行时间(s)

由表3可知,与现有方法相比,文中方法能够在最短的时间内取得最高的识别率。由表4可知,文中方法的识别性能在随机遮挡块大小为10%和20%时,略低于SALPL的方法,其他情况下均优于所采用的对比方法,但是文中方法所消耗的时间远远低于SALPL的方法。特别地,在添加随机遮挡块的情况下,文中方法的识别性能远远高于TSL_LRSR的方法。综上所述,文中方法在添加随机遮挡块的情况下,仍然具有较好的识别性能。

表4 有遮挡时CMU PIE数据集的平均识别率(%) 和平均运行时间(s)

2.3 自然场景下的实验结果

文中采用LFW人脸数据集验证所提出的方法在自然场景下的识别性能。实验结果如表5所示。由表5可以看出,在自然场景下,与现有方法相比,文中方法仍然具有较高的识别率。特别地,文中方法的识别率远远高于LRPP_GRR和EALPL的识别率。

表5 LFW数据集的平均识别率 %

2.4 算法收敛性分析

本节验证了文中方法的收敛性。图2给出了文中方法的收敛性曲线。在三个不同的数据集中,目标函数的值随着迭代次数的增加而单调减小,证明了优化方法的有效性。

2.5 参数敏感性分析

目前,针对不同的数据集选择最优参数仍是一个尚未解决的问题。文中方法需要选择四个参数,即

α

λ

λ

λ

。其中

α

λ

是平衡松弛标签学习项和类低秩标签项的权重,

λ

λ

用于避免学习标签矩阵和投影矩阵的过拟合问题。为了考察参数的敏感性,首先将参数

λ

λ

固定在前一个网格研究阶段确定的最优值上(

λ

=0

.

1,

λ

=0

.

1),重点观察参数

α

λ

在{0.000 1,0.001,0.01,0.1,1}范围内变化时识别性能的变化。因为

α

对应于文中方法中最关键的一项,而在进行实验的过程中

λ

的变化对实验结果的影响较大。在Yale B和CMU PIE数据集随机选择25个训练样本,在LFW数据集随机选择10个训练样本,图3给出了三个数据集上的参数敏感性分析效果图,可以看出选择合适的参数对实验结果有一定的影响。

(a)Yale B

(b)CMU PIE

(c)LFW 图2 目标函数收敛曲线

(a)Yale B

(b)CMU PIE

(c)LFW 图3 参数敏感性分析效果图

基于低秩技术和二进制标签松弛模型,该文提出了一种新的基于二进制松弛标签的回归模型。实验结果表明,该方法不仅对遮挡具有鲁棒性,在自然场景下,仍然能够取得较好的识别性能。

猜你喜欢 识别率矩阵人脸识别 人脸识别的“国标”来了文萃报·周五版(2021年17期)2021-05-31中科视拓开放商业版本人脸识别算法中国计算机报(2020年13期)2020-04-26荣耀畅玩7C:人脸识别通信产业报(2018年10期)2018-04-13多项式理论在矩阵求逆中的应用读与写·教育教学版(2017年10期)2017-11-10档案数字化过程中OCR技术的应用分析中国高新技术企业(2017年5期)2017-05-05基于PCA与MLP感知器的人脸图像辨识技术软件(2016年6期)2017-02-06科技文档中数学表达式的结构分析与识别物联网技术(2016年11期)2017-01-12人工智能现状和发展电脑知识与技术(2016年24期)2016-11-14“人脸识别”人工智能测谎仪研发成功发明与创新·大科技(2016年1期)2016-02-01矩阵南都周刊(2015年4期)2015-09-10

Tags: 遮挡   松弛   识别  

搜索
网站分类
标签列表