< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

让Stable Diffusion秒出图！清华硕士加速神器爆火，已有公司接入

克雷西 2023-11-17 16:45:53 来源：量子位

推理阶段只需4步

克雷西发自凹非寺

量子位 | 公众号 QbitAI

AI图像生成，已经进入了秒速级别，只要4步推理就能完成绘制，最快更是能在1秒之内完成。

现在，清华大学联合HuggingFace的研究人员，推出了全新的绘图模型加速模块。

作者给出的体验版当中，点击生成按钮后，模型只用了几秒钟就绘制出了4张清晰的图像。

这个加速模块叫做LCM-LoRA，发布后不久就斩获了2k+次GitHub星标。

它不仅加速能力强、泛化性能好，适配的模型也很广泛，SD系和LoRA模型都能用它来加速。

团队基于LCM-LoRA自行优化的文生图模型已在HuggingFace上开放体验，图生图模型也推出了CoLab等版本。

AI绘图工具迅速接入

LCM-LoRA开源后不久，就有AI绘图工具厂商Scenario宣布将基于它推出“实时绘图”功能。

Scenario的CEO还在上亲自展示了即将上线的实时绘图功能DEMO。

只见一边在绘制草图，另一边AI就把相应的画作绘制好了，时间上几乎同步。

调整提示词和有关参数，模型响应得也是干脆利落。

这些DEMO发布后，引发了众人的一致赞叹。

那么，LCM-LoRA这个加速模块到底有多强，又是怎样实现的呢？

“跳步”降低内存开销

LCM-LoRA将LoRA引入潜在一致性模型（LCM）的蒸馏过程，显著减少了训练内存开销，从而提高性能。

而LCM是从潜扩散模型（LDM）中蒸馏出来的，“蒸馏”的过程也可以看做是对扩散模型的微调。

它的核心思想是在图像的隐变量空间中学习一致性映射函数，该函数可以直接将扩散过程中的任意点映射到终点，即微分方程的解。

通过这种一致性映射，LCM可以跳过迭代采样过程，直接进行少步甚至一步采样，从而极大地加速了图像的生成。

而隐变量空间操作相比基于像素空间的方法，计算复杂度和内存需求也更低。

结合LoRA后，只需要训练低秩分解矩阵，可训练参数量和内存开销进一步减少，应用范围也从单纯的文生图扩展到了图生图和视频生成。

最直观体现的就是我们看到的秒速出图，而训练时间上，LCM-LoRA优化后的模型在A100上训练只需32个GPU时。

训练时间缩短的背后，也于训练参数量大幅减少密切相关：

SD-V1.5全量参数为9.8亿，使用LoRA后可训练参数减少到6750万，约减少了93.1%。
SSD-1B参数从13亿减少到1.05亿，约减少了91.9%。
SDXL参数从35亿减少到1.97亿，约减少了94.3%。

不仅是训练消耗的降低，推理过程中的步数也大幅减少，一般只需要4步推理就能绘制出质量不错的图像。

有时甚至只要一步就能完成，用时还不到1秒，FID分数（越低越好）在50以下。

不仅加速性能优异，LCM-LoRA的适配性也十分广泛。

LCM-LoRA训练得到的LoRA参数又称为加速向量，可以数据集上微调得到的LoRA参数直接线性组合，不需要额外训练。

这种组合方式使得LCM-LoRA成为一个可直接插接到各种微调模型中的通用图像生成加速模块。

作者简介

LCM和LCM-LoRA论文的两位主要作者是来自清华大学交叉信息研究院的研究生骆思勉（Simian Luo）和谭亦钦（Yiqin Tan）。

清华叉院的黄隆波副教授、李建副教授和赵行助理教授也参与了这两项研究。

在LCM-LoRA的工作中，来自HuggingFace的研究人员亦有贡献。

论文地址：
[1]https://arxiv.org/abs/2310.04378
[2]https://arxiv.org/abs/2311.05556

开源项目页：
https://github.com/luosiallen/latent-consistency-model

文生图在线体验（HuggingFace）：
https://huggingface.co/spaces/SimianLuo/Latent_Consistency_Model

图生图Colab笔记：
https://colab.research.google.com/github/camenduru/latent-consistency-model-colab/blob/main/latent_consistency_model_webui_colab.ipynb

LoRA stable diffusion

克雷西

实测小米最快1T大模型：吞吐量每秒1000+ Tokens，Vibe Coding七秒交付2026-06-11
教你用AI一节课收17万，华尔街精英排着队付费2026-06-07
MiniMax M3一手实测：老黄PPT上74个Logo，我以为能难住它2026-06-02
将DSA注意力引入多模态，快手Keye2.0开启强化推理新范式2026-05-26

让Stable Diffusion秒出图！清华硕士加速神器爆火，已有公司接入

AI绘图工具迅速接入

“跳步”降低内存开销

作者简介

相关阅读

表情最逼真机器人靠AIGC再进化！接入Stable Diffusion能用笔画画

AI这样把NB写在脸上，它在玩一种很新的艺术

Stable Diffusion还能压缩图：比JPEG更小，肉眼看更清晰，但千万别试人脸

Stable Diffusion团队放大招！新绘画模型直出AI海报，像素级生成

Stable Diffusion团队开撕！“背后公司”刚成独角兽，最新版本遭原作者抢发：这是我们的

Stable Diffusion原班人马新公司官宣！新模型一夜刷新AI绘画格局，已获2.3亿元融资

热门文章

GPT-5.6首批实测来了！精准狙击Mythos

英特尔锐炫™ Pro B70 GPU亮相MPTS2026，共探大视听时代AI创作新范式

中国第一、全球第二！HiDream-O1-Image-1.5 登顶文生图榜单，超越谷歌、英伟达

3D创作迎来ChatGPT时刻：Meshy发布全球首个3D AI Agent

实测小米最快1T大模型：吞吐量每秒1000+ Tokens，Vibe Coding七秒交付