为什么有些画面让你终生难忘？GAN来告诉你原因

十三 2019-11-08 12:54:17 来源：量子位

十三发自凹非寺
量子位报道 | 公众号 QbitAI

GAN又做了件了不起的事。

提到达芬奇的《蒙娜丽莎》，那张神秘的微笑立即浮现脑海。

提到梵高的《星月夜》，那片迷幻的夜空也仿佛历历在目。

△上：《蒙娜丽莎》；下：《星月夜》

我们深知一张图片胜过千言万语，但到底为什么那些著名的画作即使很久没再看过，也能让人如此印象深刻呢？

或许你了解其中原理，但现在有一个更简单粗暴且直观的方法：

问问AI，让GAN给你模拟一个过程。

这个神奇的技术叫GANalyze，来自麻省理工学院(MIT)。

什么是GANalyze

简单来说，GANalyze就是一个使用生成模型来研究认知特性的框架。

认知特性可以包括记忆力、美学或者情感效价等。

MIT电气工程和计算机科学助理教授Phillip Isola说：

关于记忆性的文章有很多，但是这种方法可以让我们想象出什么是记忆性。

它为我们提供了一个难以用语言表达的视觉定义。

这项研究是建立在MemNet基础之上。简单来说，MemNet这个模型会对图像的可记忆性进行评级，并且还能强调图像中的哪些特征会对决策产生影响。

而GANalyze使用了GAN技术，在一张图像从“无人问津”到“印象深刻”的过程中，将其可视化。

量子位根据在线测试工具实验了一波，结果如下：

我们可以看到一个在竹林中较为模糊的熊猫，逐渐转变为特点鲜明的熊猫：黑色的眼睛、耳朵、爪子，和它白色的部分形成鲜明对比。

这个GAN有三个部分组成：

assesor(评估器)：基于MemNet，打开目标图像的记忆旋钮，并计算如何达到预期的效果；
transfomer(转换器)：执行指令；
generator(生成器)：输出最终的图像。

来看下这张汉堡变得令人印象深刻的过程：

从左至右的变化不禁让小编想起一句著名Rap：你看这个汉堡它又大又圆~

研究人员利用GANalyze在生成图像的过程中，详细的展示了让图像或场景脱颖而出的因素。

被试者记忆最深刻的图像具有以下特点：

· 具有明亮的颜色
· 背景简单
· 处于画面突出的中心位置

研究的合著者Lore Goetschalckx表示：

人类的大脑在进化过程中最关注这些特征，而这正是GAN所注意到的。

但最具美感的图像并不是最让人印象深刻的。

GitHub代码

这么有意思的项目当然已经在GitHub上开源：
https://github.com/LoreGoetschalckx/GANalyze

研究人员提供了Tensorflow和Pytorch实现。也通过下面的途径正式测试过：

PyTorch >= 0.4 (1.1.0) 和 torchvision >= 0.2.2 (0.3.0)
Tensorflow 1.12.0 和tensorflow_hub 0.1.1 (针对预训练过的BigGANs)
numpy, scipy, PIL

研究人员建议参考本地文档来获得更详细的安装说明。但是，如果是在Ubuntu的linux服务器上，以下命令可能就足够了：

要clone这个repo，可以运行如下代码：

可以首先下载GANalyze项目页面上托管的预训练的generator和assesor。

也提供了用于下载Tensorflow或PyTorch模型的实用程序脚本，可以使用以下命令进行调用：

TensorFlow：

Pytorch：

训练代码如下：

测试代码如下：

One More Thing

其实，GANalyze除了上述功能外，研究人员发现它还有很多潜在的应用价值。

例如，可以通过增强现实系统中的对象来检测甚至治疗失忆。

还可以通过创建令人难忘的图形，帮助读者记住信息，这可能会给教育带来革命性的变化。

那么，你觉得这样的GAN技术还能为我们带来怎样的福利呢？

GAN

十三

商汤科技日日新大模型亮相巴黎，中国AI共赴奥运之约2024-07-26
智谱AI版Sora来了！人人免费不限次，有手机就能玩，API也开放了2024-07-26
Mac装上字节豆包，艾玛！一下变AI PC了！2024-07-22
英特尔举办2024网络与边缘计算行业大会，推动边缘AI创新发展2024-07-24

为什么有些画面让你终生难忘？GAN来告诉你原因

什么是GANalyze

GitHub代码

相关阅读

GAN不只会造假：捕获数据中额外显著特征，提高表征学习可解释性，效果超越InfoGAN | IJCAI 2020

史上最强GAN：训练费10万起，现在免费体验，画风鬼畜又逼真

这个AI让马斯克头秃，还能帮他设计特斯拉

用AI变身16岁女孩，抓住40岁违法警察！20岁男大学生钓鱼执法秀翻美国

头像秒变像素风，宅男大叔自学AI打造大师级水准，火爆推特

GANs很难？这篇文章教你50行代码搞定(PyTorch)

热门文章

雷军：地表最强四门车，小米造！自曝造车起步估值超700亿

陶哲轩在IMO上给AI团队颁奖！他们要做AI数学的ImageNet

给iPhone背面贴个AI录音机，生意老好了

AI视频修复速度10倍提升，过曝变色也能逐帧搞定｜美图国科大新算法

微软蓝屏搞瘫全球，马斯克很生气，原因很尴尬