ControlNet新玩法爆火:画出可扫码插画,内容链接任意指定
8种风格任选
萧箫 发自 凹非寺
量子位 | 公众号 QbitAI
一组神秘的“虚拟老婆”照片,最近在国内外社交媒体上传疯了。
![ControlNet新玩法爆火:画出可扫码插画,内容链接任意指定](/wp-content/uploads/replace/9c41a5980470a5d2f1558a14ebf96e9c.png)
怎么回事?
试着用手机扫一下,就能发现其中的玄机——
原来这些看起来颇为自然的照片,都是藏了二维码的图像。它们不仅能被手机相机识别,跳转的网站还都是有效的:
![ControlNet新玩法爆火:画出可扫码插画,内容链接任意指定](/wp-content/uploads/replace/3a10e8185bd4aefe99b4053df89af190.png)
从推特到Reddit,每隔几条就能刷出这些二维码照片,下面全是一片“竟然扫出来了”的惊叹声。
![ControlNet新玩法爆火:画出可扫码插画,内容链接任意指定](/wp-content/uploads/replace/c5e37a91cc4f8fa2e8efb1d8b0851ea1.png)
![ControlNet新玩法爆火:画出可扫码插画,内容链接任意指定](/wp-content/uploads/replace/05b7d07dbfeba3ab4da181a7e1faabbe.png)
![ControlNet新玩法爆火:画出可扫码插画,内容链接任意指定](/wp-content/uploads/replace/d852e9b869aa5e6d4b5ef54f776b0e23.png)
最关键的是,这些照片并非手动绘制,而是用Stable Diffusion生成的,背后再一次加持了神奇的ControlNet魔法。
生成的二维码图像风格,也远非只有二次元虚拟人像这一种,一起来看看~
8种图像风格任意可选
除了上述的二次元插(lao)画(po)风格以外,作者们还展示了另外8种二维码图像的生成效果。
这是立体风格的二维码图像,看起来就像一张真正的城市照片一般:
![ControlNet新玩法爆火:画出可扫码插画,内容链接任意指定](/wp-content/uploads/replace/a6a56ef01071839a48e36d32e5568a16.png)
有网友感叹,简直可以在物理世界中构造一个真的二维码城市了:
甚至它只能在特定的地点、特定的日子、特定的时间被扫出来,有寻宝游戏内味了。
![ControlNet新玩法爆火:画出可扫码插画,内容链接任意指定](/wp-content/uploads/replace/98051c0f14873b779b972020792167c8.png)
这类立体作品不仅细节可控(如更多的草木植被),还可以改变风格,生成更具机械感的科幻二维码图像:
![ControlNet新玩法爆火:画出可扫码插画,内容链接任意指定](/wp-content/uploads/replace/bbc7bc9848c7f5656cdb70ea5768d058.png)
3D城市看得不过瘾,还有2D抽象风格的作品,数据都藏在小房子里了:
![ControlNet新玩法爆火:画出可扫码插画,内容链接任意指定](/wp-content/uploads/replace/9767f096199500c2b1aa72d878090612.png)
除此之外,二维码还能被融入中国传统纹样风格中,或是被巧妙放置在瓷器或壁画一类的装饰物里:
![ControlNet新玩法爆火:画出可扫码插画,内容链接任意指定](/wp-content/uploads/replace/04d01c46fab403b8776e1b1187901cec.png)
更具艺术性的水墨风格也能hold住,无缝衔接画作笔迹:
![ControlNet新玩法爆火:画出可扫码插画,内容链接任意指定](/wp-content/uploads/replace/7dba0c519b2494e25931f06b18f2f1dc.png)
又或是这种水彩风格的画作:
![ControlNet新玩法爆火:画出可扫码插画,内容链接任意指定](/wp-content/uploads/replace/76e6957d18a8df4be4caf25f24b64419.png)
日式的浮世绘风格也没问题:
![ControlNet新玩法爆火:画出可扫码插画,内容链接任意指定](/wp-content/uploads/replace/2755b791c3b4ce571d4334eb4bc162c9.png)
还能嵌进PCB风格图像里,以后电路板要找售后,直接扫码就行(doge):
![ControlNet新玩法爆火:画出可扫码插画,内容链接任意指定](/wp-content/uploads/replace/3ad0d1f39465b3dab7ffa779fc370a0b.png)
显然,除了二维码图像可控,模型就连插画风格都能很好地控制。
这背后究竟是依靠什么技术实现的?
LoRA和ControlNet齐出动
要想实现这种图像风格+二维码可控的效果,需要Stable Diffusion结合LoRA和ControlNet一起实现。
其中,LoRA负责控制整体的图像风格,ControlNet则负责确保二维码“放进”了图像中。
LoRA全称Low-Rank Adaptation of Large Language Models,能很好地实现少样本学习,从而对Stable Diffusion的图像风格生成进行更精准的控制。
换而言之,最少只需要几十张同种风格的图片,就能训练一个LoRA,用来调教Stable Diffusion生成的效果。
目前,比较有特色的如中国传统风格和浮世绘风格的图像,作者们都已经在Civitai和Hugging Face等平台上开源了对应的LoRA模型。
像浮世绘风格LoRA模型,就已经可以在Civitai上直接下载:
![ControlNet新玩法爆火:画出可扫码插画,内容链接任意指定](/wp-content/uploads/replace/30528b856c5c1d8ae4b2f57cfd878877.png)
训练这样一个浮世绘风格的LoRA模型,并不需要很多照片,像这个模型就只用了46幅葛饰北斋《富岳三十六景(追加十景)》的浮世绘。
![ControlNet新玩法爆火:画出可扫码插画,内容链接任意指定](/wp-content/uploads/replace/ba77e076b13fda0003faa636d4902f61.png)
风格变化更加多样的,如生成不同中国传统纹样的图片,也只需要近百张图片训练:
![](/wp-content/uploads/replace/d1094afd5e9d1c565d1fa1b3213e0b67.png)
就可以得到能画出不同纹样的LoRA模型:
![](/wp-content/uploads/replace/cb919c9a24b191b845d52a12186dedde.png)
QR Code ControlNet则是作者们新训练的一个二维码图像生成专用ControlNet模型,目前还在不断优化中。
作者们尝试了不同的Stable Diffusion Checkpoint、LoRA和QR Code ControlNet的组合,生成了上面这些二维码图像的效果。
值得一提的是,结合最近的PS新出的Generative Fill功能,这些二维码还能被很好地嵌进一大块AI生成图像中:
![](/wp-content/uploads/replace/62c42de166c9bdbb8337eaf563a57138.png)
有网友调侃,未来就连广告也会变得更好看了。
![](/wp-content/uploads/replace/dd904f57db0f5082c263a4816c4e7995.png)
作者介绍
制作这个二维码生成项目的作者一共有四位,分别来自中国传媒大学和北京航空航天大学。
其中,倪豪和陈柏宇是中国传媒大学大四本科生,王照涵是中国传媒大学一年级研究生,陈智勇是北京航空航天大学大四本科生。
在这次的AI二维码图像生成项目前,倪豪和陈智勇就已经做出过一个参数化二维码生成器,不过主要采用的还是图形学方面的技术。
![](/wp-content/uploads/replace/c76b40644faec45cee9920725e952524.png)
据倪豪介绍,他们之前的研究方向主要集中在图形学和交互艺术上,随着这段时间AIGC爆火,团队也对这方面的技术产生了兴趣。
这段时间里,他们开发了不少不同风格的LoRA模型,以及可控制光影的ControNet等,目前模型也都已经放在Civitai上。
![](/wp-content/uploads/replace/f19dc236cbffeed7a4a1d8e243b1b76b.png)
团队表示,目前这个二维码图像生成模型还在持续优化中,后续如果有更多的进展更新,也会同步到这个网站上。
可以码住期待一波了~
团队已开发的AI模型:
https://aigc.ioclab.com/index.html
参考链接:
[1]更多二维码效果展示:https://mp.weixin.qq.com/s/i4WR5ULH1ZZYl8Watf3EPw
[2]https://www.reddit.com/r/StableDiffusion/comments/141hg9x/controlnet_for_qr_code/
[3]https://twitter.com/dahbiahmed/status/1665778398084431872
- 首个GPT-4驱动的人形机器人!无需编程+零样本学习,还可根据口头反馈调整行为2023-12-13
- IDC霍锦洁:AI PC将颠覆性变革PC产业2023-12-08
- AI视觉字谜爆火!梦露转180°秒变爱因斯坦,英伟达高级AI科学家:近期最酷的扩散模型2023-12-03
- 苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型2023-12-07