近段时间,“吗咿呀嘿”短视频爆火,以洗脑旋律和诙谐表情收获大量点击,在社交平台上实现了病毒式传播。除最初马云、马化腾等首富合唱版本外,明星素人也纷纷下场跟拍,几乎成为一场现象级的全民传播。
“吗咿呀嘿”视频源自短视频应用Avatarify。去年年初,俄罗斯程序员 Ali Aliev用DeepFake技术将自己的脸换成伊隆·马斯克,之后又将该技术开发成短视频应用Avatarify,受到了很多包括名人在内的用户追捧。
无独有偶,最近美国一家名叫MyHeritage的基因检测公司,在算法的帮助下,推出了一项全新的免费服务:用户在官网上传老照片后,算法能够将静态的人脸照片变成动态短视频,让照片中可能已经过世的长辈重新动起来,引得不少缅怀先辈的老人潸然泪下。
然而这些应用在爆火的同时,都不免引发质疑的声音:在人脸识别应用越来越普及的当下,使用换脸应用有安全隐患吗?
事实上,“蚂蚁呀嘿”等视频活化的核心技术是动作迁移算法,功能是将人物A的脸部动作搬移到人物B身上,让人物B的脸演绎人物A的表情。我们知道,在很多人脸识别使用场景中,需要配合进行眨眨眼、张张嘴等动作以验证是否是真人在进行识别。那利用动作迁移算法是不是可以就可以让照片活化,骗过人脸识别?
这时候就需要活体检测出场了——为防范假脸攻击而发展出的技术。
【活体检测的作用】
什么是活体检测?
简单来说,就是算法判断镜头捕捉到的人脸,究竟是真实人脸,还是伪造的人脸攻击。
借助其他媒介呈现的人脸都可以定义为虚假的人脸,包括打印的纸质照片、电子产品的显示屏幕(照片&视频)、硅胶面具、立体3D人像等。无论是换脸还是照片活化,在人脸识别应用面前都是典型的伪造人脸攻击。
活体检测技术能够抵御各种假脸的攻击,为人脸识别保驾护航。在人脸识别的完整链路中,通常需要先确认目标为真实人脸,之后才会进入识别环节。
随着人脸识别的应用愈发广泛,技术安全性也愈发受到重视,尤其是无人值守的应用场景下,活体检测几乎是不可或缺的刚需功能。
如果缺乏活体检测功能,或者活体检测相对初级,人脸识别设备就可能被打印出的人脸照片或者照片活化视频攻破。
【主流检测方案及原理】
目前主流的活体检测方案分为静默式和配合式两种。
静默式活体检测无需用户进行额外动作,而是直接基于算法甄别纸张照片、屏幕成像、人脸面具等伪造人脸攻击。与配合式相比,静默式用户体验更好,速度更快,可在无感的情况下直接进行活体检测。
配合式活体检测则需要用户根据提示做出相应的动作,通过眨眼、张嘴、摇头、点头等配合式组合动作,使用人脸关键点及人脸追踪技术,通过连续的图片,计算变化距离与不变距离的比值,进行上一帧图像与下一帧图像的对比,从而验证用户是否为真实活体本人操作。
实际使用中,可根据具体场景选择方案。如闸机、门禁、验票等对检测速度要求更高的场景,一般推荐选用静默式活体。
配合式活体检测技术出现较早,使用也较为普遍,但黑产从业者仍然处心积虑寻找攻破方式。开头提及的照片活化技术就是典型手段。
2019年深圳曾出现过居民身份信息被冒用的案件:不法分子使用AI换脸技术,绕开多个社交服务平台或系统的人脸认证机制,为违法犯罪团伙提供虚假注册、刷脸支付等黑产服务。
警方破案后,发现嫌疑人主要是通过“人脸照片活化”软件,利用人脸关键点定位技术,在非法获取公民照片后生成眨眨眼、张张嘴、点点头等动态视频,以欺骗人脸核验的活体检测。并且还有卖家声称,这样的一套软件及教程,只需35元即可购得。
黑产猖獗,这也对活体检测算法提出更高要求。无论是配合式还是静默式,都可以配合RGB单目活体、IR双目红外活体、3D Depth三种技术路线使用,从而进一步提升防范能力。
目前国内已有算法平台开放了人脸识别活体检测技术。譬如虹软视觉开放平台免费开放的ArcFace人脸识别SDK,同时支持RGB和IR红外活体检测。该算法不仅能实现高鲁棒性的判断,可供开发者满足各类场景需求,而且还支持完全免费、离线使用。
虹软开放平台最新发布的ArcFace 4.0版本在算法性能上进一步增强,对于人脸检测、人脸识别、活体检测、人证核验等算法模型都进行了升级,提升了大面积遮挡及复杂光线下人脸检测能力,以及复杂光线场景下识别精度,同时新增多项人脸属性分析能力和图像质量检测功能,在开发和使用体验方面都上升了一个台阶。
尤其在活体检测方面,ArcFace 4.0更新了RGB/IR活体模型,新增了在大面积遮挡下的可见光(RGB)、近红外(IR)活体检测能力。哪怕面对大面积遮挡下的人脸,算法也能通过分析采集摩尔纹、成像畸形、反射率等人像破绽来识别活体,或者基于红外图像天然滤除特定波段光线的特征,来抵御基于屏幕成像的假脸攻击。同时,在成本与性能上达到了较好的平衡。
【活体检测技术路线比较】
谈到RGB单目活体、IR双目红外活体、3D Depth这三种技术路线,在防范能力和使用成本上又各有差异。
一、RGB单目活体
虹软视觉开放平台RGB单目活体检测技术,采用普通RGB摄像头即可,通过分析采集摩尔纹、成像畸形、反射率等人像破绽,从而获得活体检测所需要的识别信息,通过多维度的识别依据保证了识别的准确性。
特点:采用普通单目摄像头,所以成本较低,对屏幕成像和纸张照片类攻击有着良好防御性。
二、IR双目红外活体
虹软视觉开放平台IR双目红外活体,在RGB单目活体的算法能力基础上,加入了红外摄像头。
由于红外图像滤除了特定波段的光线,天生抵御基于屏幕成像的假脸攻击。事实上,不管是可见光还是红外光,本质都是电磁波。物体成像与其表面材质的反射特性有关。真实人脸和纸片、屏幕、立体面具等攻击媒介的反射特性都是不同的,所以成像效果也不同。
而这种表面材质差异在红外波反射方面会更加明显,当屏幕上的人脸出现在红外摄像头前,红外成像的画面里只有白花花一片,人脸也无法显示。换言之,红外摄像头是前文提及的照片活化攻击手段的天敌:只要需要在屏幕上成像,攻击就无法生效。
特点:由于硬件的差异,红外活体相对RGB活体成本有所提高。但同时,对于屏幕成像和纸张照片类的防御力也更加优秀。
三、3D Depth活体
3D Depth活体检测采用结构光/TOF等深度摄像头,引入了“深度信息”概念,可以得到人脸区域的3D数据,并基于这些数据做进一步分析,能够很容易地辨别纸质照片、屏幕等2D媒介的假脸攻击。
特点:3D Depth活体检测对屏幕、纸张和面具类攻击的防御能力最好,但是同时硬件成本也是最高的。
在具体使用中,通常需要具体考量成本与需求的平衡,选择适合的活体检测算法,这样才能实现效益最大化。
尽管活体检测技术可以防御绝大多数伪造人脸攻击,但用户使用换脸应用时,最好还是保持一些警惕,毕竟人脸信息除了身份识别与人脸核验等应用场景外,也存在被嫁接在非法视频中,导致名誉权和肖像权被侵犯的风险。
专业人士能分辨视频真实与否,但普通人还是容易信以为真。在这个“眼见也未必为实”的时代,保障个人信息安全需要活体检测技术这类科技进步,也需要用户提升自我防范意识。