(原标题:人机大战人脸识别比拼复盘胜负手不在双方算法基础)
轰动全球的阿尔法狗与李世石的围棋对抗热潮还没消退殆尽,6月30日,在中国杭州又上演了一出人机极限视力挑战赛——蚂蚁金服生物识别技术团队与旷视(Face++)合作研发的人工智能生物识别机器人“蚂可”与《最强大脑》“鬼才之眼”王昱珩同台直播竞技,在数百个网红脸中挑出指定人选,这也是人工智能机器视觉领域与人类的首次正面交锋。
赛前有调查显示,61%的网友认为人类选手王昱珩会赢。这位有着超强微观识物能力的设计师毕业于清华,江湖人称“水哥”。他曾在节目中,从同质同量同水源的520杯水中选出特定的一杯水;也曾在不到十分钟内,从700份口红印迹中,准确无误锁定四枚唇印。这种超越凡人的能力,被观众认为是难以理解、不可逾越的。
在活动开始前,“水哥”王昱珩接受记者采访时表示:“与以前的比赛不同,这次和机器的对决其实我自己心里也没有胜算,毕竟在单位时间的识别数量和速度上机器肯定是占很大优势,也不会受到现场环境、和直播压力的干扰,从我的角度来说要追求的是更稳的精准度。”而蚂可此前从未针对“网红脸”数据集进行过训练,现场红人都化着比较重的彩妆,且有过微整形的人不在少数,墙上的自拍照无一例外都是经过美图处理过的——这相当于把业务场景极端化。可见这场对决不论是对人还是对机器来说都是前所未有的挑战。
人脸识别跨次元对决复盘
比赛分三场,在公证员的见证下,第一回合,主持人从现场网红中随机抽取3位供选手观察,人机分别从照片墙中的150张照片中挑出对应的3张,一方是凭肉眼判断,一方是由摄像机分别拍摄照片、真人后,再由5名技术人员通过“蚂可”识别技术在电脑中分析。
蚂可识别网红的过程中需要三个步骤,首先需要对目标图片进行扫描检测,进行人脸检测,简单来说就是找到画面中人脸的位置,随后第二步是对网红的面部特征进行提取,完成对图像质量、拍摄角度和环境等因素的矫正处理并进行特征点标注和特征值提取,而最后一步才是进行人脸身份的识别,蚂可将提取来的特征值与底库中的人脸进行计算并返回比对信息。虽然在读取信息环节中机器没有直接导入图像数据而是采用和人观察速度相当的拍摄录入手段,但第一场蚂可的成绩还是比较乐观,用时22分19秒超前“水哥”6分钟完成了精准识别。
蚂可识别人脸步骤
第二回合,底库照片增加到300张,而这次“水哥”用时27分04秒率先完成观察并锁定目标,蚂可紧随其后28分53秒按下计时器,双方再次准确识别并打成平手。这一局“水哥”在速度上反超有一定优势,因为300张照片中的150张已经在第一轮翻开且位置保持不变,人类大脑(尤其是“水哥”此等超凡大脑)可凭借记忆省去二次学习的时间,而机器进行识别则需要重新对全部人像信息进行读取、标注、比对。
第三回合需要双方从80张幼年照片中找出2名随机选出的到场红人,然而有一位红人的照片或许并不在照片墙中。要完成这样的挑战这不仅需要选手要有观察能力,还要有超强的推理能力。现场两名当事网红也没能从照片墙中找到自己。“水哥”21分48秒结束观察精准找到1名对应网红,而蚂可28分02秒方才提交答卷却均未答对。
机器之眼和肉眼是如何认人的?
王昱珩曾在以前的采访中笑言:“是我的海马体和我这个视觉性的VR系统确实和常人不太一样”。其实他练就“鬼眼”的能力是需要在脑内快速地建立独特的算法并根据观察适时地进行调整重构的。而从生物科学角度分析,尚未有研究证明人类进行面孔识别的神经机制,影响较大的有1986年提出的Bruce-Young认知模型,称人类在处理面孔时分为三个阶段:面孔结构编码、视觉处理通道和面孔识别通道。
而旷视(Face++)通过深度学习技术同样赋予了蚂可一双火眼金睛,模拟人脑的神经网络,并针对人脸识别应用设计了自己的CNN卷积神经网络。主要包括三个层次:卷积层、降采样层和全连接层。通过卷积层实现对空域局部信息的提取,通过降采样层实现对数据的进一步降维处理,利于数据计算,同时通过局部极值的方式增加了网络的鲁棒性,最后通过全连接层实现对全局信息的数据特征的学习并输出人脸图像的数据以确定身份,
蚂可用于学习训练的人脸超过500万张,阅过照片超过1.2亿张。而其云端后台Face++的API日调用量已超过1600万次,据悉,蚂可的人脸识别精度高达99.6%,高于普通人类97.64%的识别水平。
然而蚂可最终却以两平一负的成绩惜败“水哥”,深蓝和阿尔法狗之后,“水哥”王昱珩终为人类扳回一局。
其实蚂蚁金服安全智能部总监陈继东表示对于这个结果早有心理准备,他表示蚂可作为依托人脸识别技术做身份验证的智能机器人,能够应用在互联网金融真实身份验证的场景当中,与这场人机大战的特殊认人场景非常不同:用户使用人脸识别远程在线验证身份、登录账户或找回密码,都是1:1比对(之前与用户身份信息已经绑定的人脸采集图像进行匹配),PK现场则是1:N识别(从人脸图像库中搜索出一个最相似的人脸图像)。
此外,陈继东补充道,蚂可识别用户人脸是从二维图片中提取600多个关键点,进行交叉验证和动态识别,而PK现场,在光线角度姿态等复杂的状态,在大量长相妆容相似的美女集中出现的照片集合识别,光靠眼睛是不够的,人脑的综合推理与分析显得更为重要。
在考验精度的前两局中,双方展示出来同样的实力,快速从人脸中抽取相应信息并加以寻找;而第三盘则是一个并非比拼技术硬实力的娱乐性加赛,从人类面部特征生长规律来看,从0岁到18岁成人这段是没有固定变化轨迹的,而通过算法去解决一个没有规律的题目则是违背科学本质。然而“水哥”的获胜也展示出,在“推理”这个层面人类的智商等级还是要高于人,而机器的本质则是遵守理性思维,通过既定的科学算法去对每一个题目做出最精确的解答,这也是上一次人机大战AlphaGo所展现出来全程无庸手的原因。
旷视(Face++)负责人也表示人工智能技术的初衷是延伸人的能力,蚂可与“水哥”的PK的目的并不在于胜负,而是在于对人机能力的探索和技术进步空间的切磋。此次蚂可的成绩足以说明人脸识别技术已经十分成熟,而以人脸识别为代表的人工智能技术正在快速地迈向产业化阶段,成为人们生产生活的助手,如金融领域的远程身份认证、实名制管理、智能商业、智慧这区等场景中。目前,由旷视(Face++)自主研发的人工智能云平台已经为众多行业领域提供了智能解决方案和智能数据服务。