OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸
网友:MidJourney订阅,取消
梦晨 萧箫 发自 凹非寺
量子位 | 公众号 QbitAI
起猛了,OpenAI竟然把AI绘画和ChatGPT合 并 了!
这不,最新发布的DALL·E 3,直接给AIGC带来了两大震撼——
- 提示词门槛极大降低
- 理解语意的细微差异的细节描述,准确到令人发指
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/fb36aa44705cbcc71835d4848e1d2e21.png)
没错,新版DALL·E 3,不仅省去了提示词工程,还顺带把语言理解能力提升了一个档次!
你只管随意想象。词,ChatGPT帮你拓展;画,DALL·E 3给你精确到细节。
AI就能像拍电影一般,保证从背景到人物,细节一字不差地复刻出来:
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/a9a58a7a0127f162a85b194d8d1e572c.png)
满月下的街道,熙熙攘攘的行人正在享受繁华夜生活。
街角摊位上,一位有着火红头发、穿着标志性天鹅绒斗篷的年轻女子,正在和脾气暴躁的老小贩讨价还价。
这个脾气暴躁的小贩身材高大,老道,身着一套整洁西装,留着引人注目的小胡子,正在用他那部蒸汽朋克式的电话兴致勃勃地交谈。
除了基础细节,DALL·E 3甚至能将模糊的形容词如繁华、讨价还价、脾气暴躁演绎得活灵活现,和CLIP已经不在一个档次了。
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/1eee7121f8feb6a2c8c807d84079dd78.jpeg)
同时,相比上一代老模型,DALL·E 3自身的画技也前进了一大步:
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/0ff748dc34974c4f4b00efc055f5412e.png)
这般操作,直接把网友看愣了。
有网友已经决定取消Midjourney订阅了。“如果Midjourney无法准确理解文本,这甚至称不上是同台竞技。”
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/86d7e585dfbadc64df1882e3f0fc96dd.png)
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/19d666cfa21adaceee987c85d92db3f3.png)
还有网友调侃,这简直就是给即将到来的谷歌Gemini上压力。
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/974f8614b67a1c92cadcd21f48fcc6b1.png)
更多细节,我们从DALL·E 3展示的效果一一来看。
在ChatGPT里直接用
相比前两代,DALL·E 3最大的优势在于原生构建在ChatGPT之上。
不仅意味着语言理解能力大幅飞跃,甚至提示词都可以让ChatGPT自己来写。
更多细节藏在奥特曼都忍不住自夸可爱的宣传视频里。
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/71599e0d3294e4e32307a89f8f4666e4.png)
这是一个家长把5岁小朋友脑海里的幻想变成现实的故事。
首先家长询问ChatGPT,“我家5岁宝宝一直在说一个’超级向日葵刺猬’,它该长什么样?”
可以看到ChatGPT同时写了四段不同风格的提示词,并给出对应图像。
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/76427b5659748c450154cf9898532d4c.gif)
家长选择其中偏童话插图风格的一张后,故事的主角小刺猬形象似乎就能固定下来了,可以继续请ChatGPT画出更多。
顺便给小刺猬一个名字Larry,后面的对话中就不用每次都说“超级向日葵刺猬”了。
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/ef45b6ea96397aab07046cbc4a96d1a8.gif)
主角定好了,接下来再添加更多元素,让整个童话故事更丰富,比如给Larry画个房子。
这里既展示出了DALL·E 3创作一致形象的能力,也展示出邮箱上正确写上了LARRY的名字,解决了之前版本DALL·E不会写字的问题。
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/bb4d8772e916a8e60b013c13118f6895.gif)
反正都用上ChatGPT了,不如把故事情节也完善一下?
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/6e60c044490bae768c3c904c0d1ab71a.gif)
刚编好的情节立马就可以有配套的插画了。
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/e762372c7b1ee069fa1fa873f71c7a85.gif)
保持角色形象,迁移到完全不同的贴纸画风也没问题,可以直接打印出来。
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/062b92f1b279c3960045f9277334279c.gif)
注意了,最绝的地方来了,直接让ChatGPT总结前面对话中所有内容,写成一个完整的睡前故事。
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/43d42f7eac613a906105f73f20f228df.gif)
虽然演示到此结束,但完全可以想象配合ChatGPT插件功能,还可以直接生成一本电子书出来。
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/047bc16b607ed07bfd313dfd75c7c4a0.gif)
就让人想起之前网友提议,确保AI安全的最佳方法是让OpenAI、Anthropic等公司的员工都有孩子。
这样他们就有动力确保AGI到来时世界是安全的。(手动狗头)
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/bfca83b91d655fc3604e8ad04e6309e4.png)
虽然DALL·E 3现在还不能马上玩到,一次放出的大量样张也可以先看个饱了。
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/bf954c1b50fb7dae07de9196344033fd.png)
每一张点开还可以看到提示词,都是直接用人话描述,没怎么加复杂咒语的那种。
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/7a0154715f20470e7ede92e83aad1285.png)
复杂场景与不存在的概念组合,效果很惊艳。
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/d74a8ba94628054a2c32585e47370644.png)
搞室内设计概念图,光影明暗关系乍看也挑不出毛病。
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/b6938e27ba6500962505051548edab9b.png)
配合正确写字能力,直出海报也是生产力拉满(没指定文字的小字部分还有些问题)。
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/6456b179fecb742683aba539dc35fc0d.png)
刚加入OpenAI不久的德扑AI之父Noam Brown也晒出了他试玩的机器人打牌图。
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/fe86a5324acf84709ddff2c97826f1cb.png)
CEO奥特曼最喜欢的则是这张“牛油果看医生”。
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/22895efdfb2c375260d328273bd576a9.png)
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/718ee578edf557f4da57d23b8dc6b741.png)
有网友去试了同样的提示词用在DALL·E 2的效果,只能说字也不对、牛油果中间的洞没画出来,治疗师更是没有……
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/95a3e3ce2f7d68c1b421782a3e1f2d38.png)
还记得2021年1月DALL·E 1刚出的时候吗?梦开始的地方就是一组“牛油果做的沙发”。
也难怪网友感叹:看看它走了多远!
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/459cec3537d34ef3b77bc7f636439248.png)
“如有侵权,请来删图”
当然,除了上述特性以外,OpenAI也预告了一些神奇的新功能。
例如,DALL·E 3即将配套推出一个图像鉴别器。
这个分类器可以帮助识别图像是否由DALL·E 3生成,不仅能避免误伤(手动狗头),也能在DALL·E创作出好作品时快速将它认领成自己的。
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/6c4a1d892c3f9d6b250bc5f28ba2d262.png)
至于在生成图像上,OpenAI自述也做了大量工作,防止其生成暴力、色情或其他有害图片,或是带有公众人物(明星、名人等)姓名的图像生成。
关于隐私方面,之前纽约时报就曾爆料称,OpenAI正在通过某些技术,模糊掉上传到ChatGPT的图像中的人脸。
这也是为了避免ChatGPT变成一个彻底的“人脸识别工具”,尤其是已经有不少照片流传到互联网上的名人明星们。
如今这个技术可能也被用到了DALL·E 3中,防止生成侵权图像。
同时,OpenAI也与安全红队合作,提高了图像风险评估的能力。
除此之外,在训练数据上,有了Midjourney的“前车之鉴”,OpenAI这次也学会了保护自己。
相比于直接和画手打官司、或者等着被起诉,OpenAI在官网放出了一则训练数据“免责声明”:
您可以填写表格,禁止我们的网络爬虫GPTBot访问您的网站。或者,您也可以发送您想要保护隐私的图像,我们会把它从训练数据中删掉。
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/a4bfa06ffbd46e9fa92a6f14074cd475.png)
不过也有网友对DALL·E 3演示效果不满意,认为比不上MidJourney资深玩家出的图,OpenAI的资金可是充裕n多倍啊。
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/3ca282664207d8100c6889f8d3a444a6.png)
还有网友开启列文虎克模式,开始挨个挑演示图中漏掉的提示词细节。
比如这张杯子里缺少微型闪电。
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/693e8df67df7186ce64073db1fd9ba65.png)
这张散落在海底的只有大炮残骸,没有宝藏。
![OpenAI一夜颠覆AI绘画!DALL·E 3+ChatGPT强强联合,画面直接细节爆炸](/wp-content/uploads/replace/1545c8d367fbc0088142ad073ebc38ca.png)
具体这些问题能不能通过调整提示词改善,就要等实际上手玩过才知道了。
那么DALL·E 3具体什么时候上线呢?划重点了:
- ChatGPT Pro会员(20美元/月)和企业版在10月可用。
- 独立版在今年秋天晚些时候提供(目前价格15美元可以玩115次)。
参考链接:
[1]https://openai.com/dall-e-3
[2]https://www.nytimes.com/2023/07/18/technology/openai-chatgpt-facial-recognition.html
[3]https://twitter.com/sama/status/1704547625482203560
- 首个GPT-4驱动的人形机器人!无需编程+零样本学习,还可根据口头反馈调整行为2023-12-13
- IDC霍锦洁:AI PC将颠覆性变革PC产业2023-12-08
- AI视觉字谜爆火!梦露转180°秒变爱因斯坦,英伟达高级AI科学家:近期最酷的扩散模型2023-12-03
- 苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型2023-12-07