AI被自己骗了!生成照骗轻松逃过AI鉴别器法眼,马斯克机器女友、3米巨人都「成真」了
给图片加点颗粒度也能骗过AI
明敏 发自 凹非寺
量子位 | 公众号 QbitAI
以假乱真的AI生成式图片,AI自己分辨不出来了。
这张马斯克和机器人女友的照片,5个鉴别器里有2个都觉得是真的:
![AI被自己骗了!生成照骗轻松逃过AI鉴别器法眼,马斯克机器女友、3米巨人都「成真」了](/wp-content/uploads/replace/c73ae6f821c425d1cfc14b91fa835535.png)
还有这张人类和3米巨人的合照,居然5个鉴别器一致判断为真:
![AI被自己骗了!生成照骗轻松逃过AI鉴别器法眼,马斯克机器女友、3米巨人都「成真」了](/wp-content/uploads/replace/b5e699e460f99a3aa1b01e3d1f9bf609.png)
啊这,AI鉴别器似乎不太靠谱的亚子。
这就是《纽约时报》最近做的一项测试,他们找来了市面上五个常见的AI鉴别器,分别喂给它们100多张照片做测试。
结果发现,AI鉴别器不仅会把AI照片错认成真的,也会把真实照片划定为AI生成的。
而且不同鉴别器之间的水平差距也不小。
具体表现如何?一起来看
加点颗粒(Grain)就能骗过鉴别器
在这项测试中一共使用了5个AI鉴别器,分别是:
- Umm-maybe
- Illuminarty
- A.I or Not
- Hive
- Sensity
测试的内容包括AI和人类创作的图片,分别喂给每个鉴别器,看它们会怎样判断。
使用的AI创作工具包括Midjourney、Stable Diffusion、Dall-e等。
《纽约时报》主要展示了这样几个例子。包含5张AI创作的图片,以及2张真人拍的照片。
从统计结果来看,五个鉴别器中只有Hive全部判断正确。
Umm-maybe的表现最差,只判断对了两张图。
![AI被自己骗了!生成照骗轻松逃过AI鉴别器法眼,马斯克机器女友、3米巨人都「成真」了](/wp-content/uploads/replace/8a682389c36e58236ff532ba1347ef0c.png)
举例来看,这张照片是AI生成的,听说还在2月的一场摄影比赛中拿下大奖,这道题就难倒了大部分鉴别器。
![AI被自己骗了!生成照骗轻松逃过AI鉴别器法眼,马斯克机器女友、3米巨人都「成真」了](/wp-content/uploads/replace/331abfb46126ab0bdf9a08564e114880.png)
但这张纯AI生成的照片,就没有逃过大部分鉴别器的法眼。
![AI被自己骗了!生成照骗轻松逃过AI鉴别器法眼,马斯克机器女友、3米巨人都「成真」了](/wp-content/uploads/replace/263089568a879c02a7ebd60650d9e20e.png)
对于人类创作的照片,AI鉴别器的正确率比较高,两张照片都只有Umm-maybe鉴别器判断错误。
![AI被自己骗了!生成照骗轻松逃过AI鉴别器法眼,马斯克机器女友、3米巨人都「成真」了](/wp-content/uploads/replace/933a4521675dd18a9003e317b034e0bf.png)
此外他们还专门测试了艺术画,发现大部分AI鉴别器能判断出这是真人画的。
![AI被自己骗了!生成照骗轻松逃过AI鉴别器法眼,马斯克机器女友、3米巨人都「成真」了](/wp-content/uploads/replace/4ff7df6f3d843404370d75b3dbca21da.png)
对比另一幅AI创作的,同样也是四个鉴别器判断正确。
(Umm-maybe啊……是真的不太行)
![AI被自己骗了!生成照骗轻松逃过AI鉴别器法眼,马斯克机器女友、3米巨人都「成真」了](/wp-content/uploads/replace/436a0bf89d4be1f99e39993959c93c7d.png)
值得一提的是,如果对AI图像进行一些加工处理,AI鉴别器会失效。
比如这张Nike男的照片,一开始有4个鉴别器判断它是AI生成的。
![AI被自己骗了!生成照骗轻松逃过AI鉴别器法眼,马斯克机器女友、3米巨人都「成真」了](/wp-content/uploads/replace/a14ec912ca9e4378f309002cb24131ad.png)
但如果给图片加一些颗粒,AI鉴别器就会将这张图片的AI含量从99%,判断为仅有3.3%。
![AI被自己骗了!生成照骗轻松逃过AI鉴别器法眼,马斯克机器女友、3米巨人都「成真」了](/wp-content/uploads/replace/14bad076f031f9f4dffcce3f64135fd3.png)
最后,我们也测试了一些能上手实测的鉴别器(Umm-maybe、Illuminarty、A.I or Not)。
结果显示,对于“马斯克在苏联”这张图,Umm-maybe觉得它有85%的概率是人类创作的。
![AI被自己骗了!生成照骗轻松逃过AI鉴别器法眼,马斯克机器女友、3米巨人都「成真」了](/wp-content/uploads/replace/fe6d7de1ce6c87eccfff670a4107b9b0.png)
Illuminarty觉得它是AI创作的概率仅有5.4%。
![AI被自己骗了!生成照骗轻松逃过AI鉴别器法眼,马斯克机器女友、3米巨人都「成真」了](/wp-content/uploads/replace/d5defae8a4d8be1b2be95313f61b130a.png)
只有A.I or Not确定了它是AI生成的。
![AI被自己骗了!生成照骗轻松逃过AI鉴别器法眼,马斯克机器女友、3米巨人都「成真」了](/wp-content/uploads/replace/8a4c1ba46f9af2231d45e55bc058090e.png)
AI鉴别的判断标准是啥?
那么AI到底是怎么鉴别真伪的?
普遍来说,它们和人类的判断标准不太一样,人类一般以图像内容的合理性为依据,而AI更多是从图像的参数入手,比如像素的排列方式、清晰度、对比度等。
所以这就解释了开头那张巨人照片,为啥所有鉴别器都觉得很真。
![AI被自己骗了!生成照骗轻松逃过AI鉴别器法眼,马斯克机器女友、3米巨人都「成真」了](/wp-content/uploads/replace/155d858dbfe8b8e77798eabc3305b345.jpeg)
在AI画画大火一年多以后,如今市面上已经出现了非常多鉴别器。
有的就是直接放在Hugging Face上供大家免费使用,有的则是已经成立公司,只提供API接口形式。
比如Hive就是一家提供商业解决方案的公司,从如上的测试结果可以看到,Hive的表现效果也是最好的,几乎都能判断正确。
而在这之前他们的主要业务是为平台网站提供数据审核服务,图像视频文字都支持,服务的平台有Reddit、Quora等。
参考链接:
https://www.nytimes.com/interactive/2023/06/28/technology/ai-detection-midjourney-stable-diffusion-dalle.html
- 12h订单破万,卖爆了的国产AR眼镜公司什么来头?2024-07-26
- 联想CTO换帅!芮勇转任新集团总裁,瞄准新兴技术2024-07-26
- ICML最佳论文曾被ICLR拒稿,Pika联创参与,一作已入职OpenAI2024-07-25
- 北大刘若川教授获拉马努金奖,中国学者4次获此殊荣2024-07-24