为了治好你的脸盲,这家表情包网站开源了一个明星识别器丨GitHub

现在,有一家公司来拯救脸盲了,不是你熟悉的硅谷/后厂村大公司,而是一家动图表情包网站:GIPHY。

郭一璞 发自 凹非寺

量子位 报道 | 公众号 QbitAI

小鲜肉太多,让人分不清,需要AI替我识别,这又是谁家的爱豆。

现在,有一家公司来拯救脸盲了,不是你熟悉的硅谷/后厂村大公司,而是一家动图表情包网站:GIPHY

GIPHY开源了一个表情包识别器,可以分清楚超过2300个名人,而且它识别的还是动图,准确率超过98%

这效果,可以的

良心的是,GIPHY不仅把这个工具开源了,而且还直接用在了自己的网站上,不是Demo,已经是成品。

为了治好你的脸盲,这家表情包网站开源了一个明星识别器丨GitHub

那我们来测验一下这个功能好不好用~

为了治好你的脸盲,这家表情包网站开源了一个明星识别器丨GitHub

第一张,泰勒·斯威夫特,传上去试试效果

为了治好你的脸盲,这家表情包网站开源了一个明星识别器丨GitHub

认出来了,匹配度84.92%。

为了治好你的脸盲,这家表情包网站开源了一个明星识别器丨GitHub

换个人,安妮·海瑟薇~

为了治好你的脸盲,这家表情包网站开源了一个明星识别器丨GitHub

这次认还是认出来了,就是AI心里不太有谱,它的把握不到6成,甚至还觉得可能是另一个妹子。

我们加大难度,看艾玛·沃森这张魔性的动图能不能认出来。

为了治好你的脸盲,这家表情包网站开源了一个明星识别器丨GitHub

Emma觉得不行

笑成这样,估计识别起来有点难了吧?

为了治好你的脸盲,这家表情包网站开源了一个明星识别器丨GitHub

还真是,AI虽然认出来这是Emma,但是,它觉得还有4个妹子笑得跟Emma一样魔性

另外,这个AI还对一位明星表现出了迷之钟爱:

为了治好你的脸盲,这家表情包网站开源了一个明星识别器丨GitHub

赫本的匹配度,高达100%

为了治好你的脸盲,这家表情包网站开源了一个明星识别器丨GitHub

这让人怀疑AI的心理年龄……

模型原理

模(mei)型(zi)测评就先到这里了,我们来看看这个模型是怎么训练出来的。

摆在GIPHY团队里的第一个问题,就是识别谁,以及用什么数据集。

作为一个表情包网站,秉持着自己动手丰衣足食的精神,先把自己家的热搜TOP 50000盘点了一下,找到了里面的所有人名,接着又用同样的方法去Facebook、Twitter等网站搜了一遍,凑齐了一个2300多名人的人脸数据库。

识别的过程则包括两部分,第一部分是人脸检测,使用MTCNN(arxiv: 1604.02878)预训练模型来找动图中所有帧里的人脸;第二部分是人脸识别,用前面的那个DIY的数据集在基于Resnet-50的深度卷积神经网络上训练,以识别MTCNN模型发现的每一张人脸。

最后,还需要对人脸进行聚类,给出预测结果。

模型训练完成后,在Labeled Faces in the Wild数据集上的准确度达到了96.8%。之后GIPHY还做了一个众包验证集,在这个验证集上的准确度达到了98%,覆盖度达到75%。

最后,这个模型已经在GitHub上开源了,如果想自己用的话,需要Python 3.6及以上的版本,用Linux的话则需要安装好libsm,libxext,libxrender。

进入下面传送门体验一下吧~

传送门

在线使用

https://celebrity-detection.giphy.com/

开源地址

https://github.com/Giphy/celeb-detection-oss

版权所有,未经授权不得以任何形式转载及使用,违者必究。