人脸识别技术是一种通过计算机对人脸图像进行分析识别的技术,主要原理是通过提取图像中的人脸特征点与事先存储在系统中的人脸库进行比对并确定当前人员身份信息。该技术于20世纪60年代问世,在21世纪随着CPU计算能力的巨幅提高目前人脸识别技术已经迈入深度学习时代,随着商业化程度的不断加深人脸识别技术已经广泛应用在我们生活中的方方面面,例如门禁安防、金融支付、政务办事、手机解锁、自助服务终端等多种领域。由于人脸特征具备不可伪造性、采集便捷性等优点使得人脸识别技术迅速成为当今使用规模最大的生物识别方式,但是人脸识别技术在给人们带来极大便捷的同时也带来了个人信息滥用等数据安全问题,部分国家以及地区正在陆续出台相应政策以保护公民隐私不受侵害。
人脸识别技术工作流程主要由数据采集、人脸检测、特征提取、活体检测、身份识别、结果输出等几部分组成。
错误接受率(FAR)/错误拒绝率(FRR)均是生物特征验证系统的识别精度指标之一Q1。关于识别算法中的FAR以及FRR两项参数对于使用效果将会产生很大的影响,通过调整FAR与FRR参数将提升算法在不同使用场景下的表现。
人脸识别技术实际应用中主要分为两大模式即1:1模式、1:N模式。
1:1模式为身份验证模式,主要目的是为了解决“你是你”,在人脸识别过程开始前系统数据源就已经预先锁定了数据范围为1人,通过对被检测对象的面部进行采集并与当前1人的数据源做比对,最终核实当前被检测对象是否为本人。该模式主要应用于手机解锁、PC解锁、机场验票、火车站验票、刷脸支付、酒店入住、刷脸开门、景区验票等场景。
1:N模式主要目的是为了解决“你是谁”,通过采集被测对象面部信息后在海量人脸库数据源中检索相符合的图像信息最终确定当前被检测人员的身份信息。该模式主要应用于会议签到、门禁安防等场景。
M:N模式是多对多关系,即待检测对象数量大于1时需要分别识别出各自身份信息的过程。该模式在监控摄像头场景中由于无法要求用户采用任何形式的配合,故对于检测结果并非一定能够得到。该模式最常用的场景为公安抓逃场景。
模式 | 核验手段 | 结果强制性 | 用户配合度 | 设备算力要求 | 安全等级 | 适用场景 |
1:1 | 双重验证 | 必须给出核验结果 | 需要用户配合 | 较低 | 高 | 人证合一 |
1:N | 单一手段 | 必须给出核验结果 | 用户需配合系统看向摄像头 | 较高 | 较高 | 门禁、签到 |
M:N | 单一手段 | 非必须,监视名单漏报率不得大于70%Q2 | 无法要求用户配合 | 高 | - | 公安抓逃 |
活体人脸在不同光照条件下会显示微小的颜色变化,可以通过分析RGB图像中像素点的色值得到颜色变化信息最终确认当前被检测样本是否为活体,真实活体的面部通常显示出更多的纹理变化。
IR近红外活体检测是一种利用近红外光谱范围内的光学信息来确认人脸是否为真实活体的方式。IR传感器可捕捉活体组织产生的微弱热辐射并形成相关图像,根据这一原理,计算机可以分析面部组织的热量分布、血液流动等生物特征来区分被检测样本是否为活体。
动态视频流活体检测是在一段视频流中进行活体检测的方式。在视频采集中通常需要被检测者根据程序随机指令做出相应眨眼睛、张嘴、头部运动等配合来确认被检测样本是否为活体。
方式 | 外设支持 | 优点 | 执行效率 | 安全等级 | 用户体验 | 适用场景 |
RGB活体 | 普通可见光摄像头 | 无需专用设备,经济性好 | 高 | 中 | 无需特意配合使用体验好 | 门禁安防/会议签到 |
IR活体 | 专用IR摄像头 | 检测速度快,检测结果可信度高 | 高 | 高 | 用户与IR摄像头之间的距离要适中且需要看摄像头 | 门禁安防/机场通行验证 |
动态视频流活体 | 普通可见光摄像头 | 无需专用设备,检测结果可信度极高 | 中 | 高 | 通过指令要求用户进行相关动作并判断人脸的真实有效性Q3 | 金融业务/政务办理 |
人脸识别技术中分为静态人脸识别与动态人脸识别两类。静态人脸识别是针对单张图像进行人脸识别,通过人脸识别算法对某张图像进行人脸检测、特征提取、特征比对等过程完成最终的识别结果输出。相对而言,动态人脸识别处理的对象是一段视频,针对视频中的每一帧都要完成静态人脸识别的全过程,由于动态人脸识别比静态人脸识别多了时间维度,通过时序分析最终将多个识别结果进行叠加综合给出最终识别结果。
静态人脸识别与动态人脸识别主要针对的使用场景不同。静态人脸识别主要适用于快速验证通道、自助服务终端机等场景,动态人脸识别主要适用于金融业务办理、政务办理、视频监控行为分析等高安全性或AI智能分析场景。
分类 | 二维人脸识别 | 三维人脸识别 |
技术原理 | 使用传统的摄像头获取面部的二维图像,依赖于分析人脸的颜色、纹理等特征进行识别。 | 使用具备深度感知能力的传感器,获取面部的三维形状和深度信息。 |
数据获取方式 | 通过普通摄像头获取的二维图像只包含人脸在水平和垂直方向上的位置信息。 | 利用深度传感器获取的数据,能够获取面部的三维形状和深度信息。 |
准确性 | 在受光照、姿势和遮挡等影响时可能准确性降低。 | 对光照变化、姿势变化和遮挡等因素具有更强的鲁棒性④,提高了识别的准确性。 |
应用场景 | 对于一些攻击手段,如使用静态照片进行欺骗,抵抗性相对较低。 | 更适用于对安全性要求较高的场景,如金融领域、高级安保系统等。 |
成本和设备要求 | 相对成本较低,使用常规摄像头即可。 | 需要具备深度感知能力的传感器,相对成本较高。 |
实时性 | 通常可以实时进行,适用于快速的人脸识别场景。 | 需要处理更多的数据,可能稍显滞后,但对于某些场景也可以实现实时性。 |
复杂性 | 实施相对简单,适用于各种场景。 | 系统设计和实施相对复杂,需要更专业的硬件和算法支持。 |
人脸识别技术目前已经用在多种硬件上,例如电脑、手机、Android智能终端机、基于Linux操作系统的智能终端机、AI边缘计算盒、监控摄像头、监控刻录机、物联网终端模块等具有非常丰富的硬件生态。虽然涉及到的硬件种类繁多但人脸识别技术在这些产品上的部署形式可以分为终端形式、终端服务器结合形式、服务器形式三类。
随着人脸识别技术的普及,面部数据的安全性成为一大挑战,不法分子可能通过各种手段窃取到面部数据,导致数据泄露。由于人脸识别对于数据采集的低门槛限制,也引发了人们对于大规模监控、人脸信息滥用、身份追踪等方面的担忧。为了解决这一问题,一些人脸识别技术厂商迅速做出调整,人脸识别全流程中不再保存人脸照片信息而以加密人脸特征值取而代之,经过加密后的人脸特征值不能被还原为一张图片,这样一来即可将人脸识别技术的使用限定在一定范围内。我国也在相关国标文件中发布了有关人脸识别数据存储相关要求中明确指出“应采取加密存储等安全措施存储人脸识别数据”Q4。下面简单介绍一种加密存储人脸识别数据的流程:
人脸识别技术的应用场景可按照1:N或1:1两种使用模式分类:
1:1 | 1:N | M:N |
|
|
|
注解:
①人脸识别算法:人脸识别算法是一系列用于处理和识别人脸图像的计算机算法,是人脸识别技术的核心。
②机器学习/深度学习:机器学习是人脸识别算法的基础学习模式主要通过在数据中学习规律并根据规律做出预测和决策;深度学习侧重于通过深度神经网络来学习复杂的特征表示,深度学习在处理大规模和复杂数据时表现出色。
③1:1、1:N、M:N:这是三种不同的人脸识别技术应用模式,主要针对不同使用场景。1:1模式即当前识别过程中的人脸库数量为1个人的特征,是为了解决当前待检测对象是否为本人;1:N模式即需要从人脸库中识别出当前待检测对象是谁;M:N模式即多对多关系,需要将多于1个的待检测对象与当前人脸库做对比,识别出待检测对象分别是谁。
④鲁棒性:指的是系统或算法对于外部干扰、噪声、变化或异常情况的稳健性和抗干扰能力。
引用:
Q1 引用自 中华人民共和国国家标准《生物特征识别防伪技术要求 第1部分:人脸识别》
Q2 引用自 中华人民共和国国家标准《安全防范 视频监控人脸识别系统技术要求》
Q3 引用自 中华人民共和国国家标准《信息安全技术 远程人脸识别系统技术要求》
Q4 引用自 中华人民共和国国家标准《信息安全技术 人脸识别数据安全要求》