前段时间,微软的How-old.net这个根据照片脸部特征识别男女和年龄的网站一下子就在社交网站传播开来。其中让人觉得好玩的是背后令人惊奇的图像识别技术,能够准确的根据照片中的面目特征来读取一些用户信息。比如广为流传的如下这张图——“在林志颖和郭德纲之间差一个吴奇隆”(-R/v2Sx3 )。
图 1 How-old.net面部识别截图
How-old网站从本质上说就是一个人脸识别的计算引擎,这种人脸识别的技术由微软的“牛津项目”所提供,这个项目还提供了相应的API接口供外部使用(-R/f2Sz )。得益于计算技术的进步,图片识别技术已经取得了较大的进展,而且随着网络的发展,通过调用类似服务的API接口,应用开发者也可以构建基于人脸识别的各类App应用。
目前在微软牛津项目主页上,这项人脸识别技术已对所有的开发者开放。想要在自己的软件中实现同样的功能,开发者只需要简单地调用一下其 Web API,就可以以 JSON 格式获取所需的一切信息。用户还可以尝试着在该项目的页面上传一幅图像,它将在数秒内给出结果,脸部坐标、性别和年龄信息都在里面,如图 2 微软的牛津项目人脸识别技术演示所示。
用户能够在右侧返回结果信息中读到JSON格式的数据信息,如JSON:[ { "faceId": "7c5f2fe4-582d-4249-8bfb-093ae8c2e530","faceRectangle": { "width": 238, ……, "attributes": {"age": 3, "gender": "female","headPose": { "roll": "-10.7", "yaw": "8.7", "pitch": "0.0" } } } ]
对这些信息做进一步的解读,或者与相应的业务逻辑相结合,即可构建成一个全新的App应用。人脸识别技术不只微软的科研人员在钻研,由于互联网的普及,人脸识别技术领域的探索正在如火如荼地进行,人脸识别技术正被广泛地应用在各个场景。Linkface就是这样一家专注于人脸识别技术及服务的创业公司,他们也通过Web API的形式对外提供人脸识别服务,对于微软的牛津项目,Linkface的技术表现得似乎更精准一些,同样一张测试图片,我们上传到Linkface的“人脸测试”页面(-R/o2Sr),得到如下识别结果。
经过对比图 2和图 3,首先,可以发现左侧同一人物,上图识别女性,三岁,而下图则识别为女性,6.57岁,实际情况是后者符合现实。其次,后者还提供了更丰富的神态、笑容、是否戴眼睛和是否是墨镜的判断,属性值更加丰富。再次,图片中右侧是侧脸人物,在上图中未被识别,而在下图Linkface的识别结果中,则准确的判断出是36.35岁,男性,戴眼镜,而且不是墨镜,神态自若,没有笑。最后,出乎意料的是,Linkface还有一项“吸引力(attractiveness)”的属性,左侧年幼女性是0.332975,右侧年长男性0.0117815,两者吸引力的值差了28倍。
Linkface也采用返回JSON封装的数据集方式对外服务,通过上面的测试,我们看到其返回的数据格式为:RESPONSE{ "status": "OK", "image_id": "c0eb385306e34ccd9bac4177a8394f20", "image_width": 2048, "image_height": 1536, "faces": [{….. } ] }.
面部检测是年龄检测和性别检测的基础。对于年龄检测和性别检测来说,涉及到的是机器学习中很典型的回归和分类问题,这些用到的技术包括面部特征的表示、训练数据的采集、回归和分类模型的构建以及模型的优化。对于开发人员来说,也许无需深入了解其实现路径,通过调用相应的Web API服务,就能够制作出具有吸引力的App应用来。基于智能的人脸识别技术,未来的某一天,在商场购物时,仅靠“刷脸”就可以在收银台完成支付;约见医生,踏入诊室已经把健康数据取出;下班回家,摄像头扫描一下门锁就会自动打开;打开电脑,它认识家庭里的所有成员,贴心地记录着每个人的网站喜好,所有这些都正在或有待开发。在智能化设备和应用迅速普及的今天,人脸识别或将成为一枚钥匙,打开人与万物互联的那道门。
(研究院 刘振兴)