Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

西风 2023-11-22 13:29:41 来源：量子位

代码权重已上线

西风发自凹非寺

量子位 | 公众号 QbitAI

Stable Diffusion官方终于对视频下手了——

发布生成式视频模型Stable Video Diffusion（SVD）。

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

Stability AI官方博客显示，全新SVD支持文本到视频、图像到视频生成：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

并且还支持物体从单一视角到多视角的转化，也就是3D合成：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

根据外部评估，官方宣称SVD甚至比runway和Pika的视频生成AI更受用户欢迎。

虽然目前只发布了基础模型，但官方透露“正计划继续扩展，建立类似于Stable Diffusion的生态系统”。

目前论文代码权重已上线。

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

最近视频生成领域不断出现新玩法，这次轮到Stable Diffusion下场，以至于网友们的第一反应就是“快”，进步太快！

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

但仅从Demo效果来说，更多网友们表示并没有感到很惊喜。

虽然我喜欢SD，而且这些Demo也很棒……但也存在一些缺陷，光影不对、而且整体不连贯（视频帧与帧之间闪烁）。

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

总归来说这是个开始，网友对SVD的3D合成功能还满是看好：

我敢打赌，很快就会有更好的东西出来，到时候只要描述一下，就会得到一个完整的3D场景。

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

SD视频官方版来袭

除了上面展示的，官方还发布了更多Demo，先来看一波：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

太空漫步也安排上：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

背景不动，只让两只鸟动也可以：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

SVD的研究论文目前也已发布，据介绍SVD基于Stable Diffusion 2.1，用约6亿个样本的视频数据集预训练了基础模型。

可轻松适应各种下游任务，包括通过对多视图数据集进行微调从单个图像进行多视图合成。

微调后，官方公布的是两种图像到视频模型，可以以每秒3到30帧之间的自定义帧速率生成14（SVD）和25帧（SVD-XT）的视频：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

之后又微调了多视角视频生成模型，叫做SVD-MV：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

根据测试结果，在GSO数据集上，SVD-MV得分优于多视角生成模型Zero123、Zero123XL、SyncDreamer：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

值得一提的是，Stability AI表示SVD目前仅限于研究，不适用于实际或商业应用。SVD目前也不是所有人都可以使用，但已开放用户候补名单注册。

视频生成大爆发

最近视频生成领域呈现出一种“混战”的局面。

前有PikaLabs开发的文生视频AI：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

后又有号称“史上最强大的视频生成AIMoonvalley推出：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

最近Gen-2的“运动笔刷”功能也正式上线，指哪画哪：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

这不现在SVD又出现了，又有要卷3D视频生成的可能。

但文本到3D生成方面好像还没有太多进展，网友对这一现象也很是困惑。

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

有人认为数据是阻碍发展的瓶颈：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

还有网友表示原因在于强化学习还不够强：

Stable Video Diffusion问世！3D合成功能引关注，网友：进步太快

家人们对这方面的最新进展有了解吗？欢迎评论区分享～

论文链接：https://static1.squarespace.com/static/6213c340453c3f502425776e/t/655ce779b9d47d342a93c890/1700587395994/stable_video_diffusion.pdf

参考链接：
[1]https://stability.ai/news/stable-video-diffusion-open-ai-video-model
[2]https://news.ycombinator.com/item?id=38368287

版权所有，未经授权不得以任何形式转载及使用，违者必究。

AI视频生成 Stable Diffudion 大模型

Moltbot作者被Claude刁难后：MiniMax M2.1是最优秀的开源模型2026-01-29
爆火Clawdbot被Claude公司强制要求改名2026-01-28
3D版Nano Banana来了！AI修模成为现实，3D生成进入可编辑时代2026-01-27
成立两年半登顶全球AI创作社区，背后是中国团队在“卖情绪”？？2026-01-22

相关阅读

全栈智能才能兑现AI红利？

新技术周期有了新共识

明敏2024-02-05

全栈智能大模型技术革命

正面硬刚OpenAI！智谱AI推出第三代基座模型，功能对标GPT-4V，代码解释器随便玩

直接公测，人人可玩

梦晨2023-10-28

大模型

AI刘强东007带货，背后大模型也就10亿参数

京东称不是强东特供版

衡宇2024-04-24

AI 大模型数字人

00后华人大模型创业，组队7人挑战langchain，硅谷顶级创始人给了天使投资

开发者新玩具，还不愁写不好prompt（doge）

丰色2023-07-29

langchain 大模型

搞大模型巨亏，微软都还没挣到钱！GitHub Copilot每月收10刀，倒赔20

谷歌亚马逊也面临窘境

萧箫2023-10-10

大模型微软

如果没有AI算力，大模型这场战役我们可能胜不了

国产AI算力市场生变

明敏2023-12-08

AI算力华为云大模型

热门文章

“开源版贾维斯”一夜席卷硅谷！Mac mini因它卖爆

李飞飞世界模型公司一年估值暴涨5倍！正洽谈新一轮5亿美元融资

瑞幸背后的芯片，藏不住了

Skills刚火，就有零Skill的Agent来了…

爆火Clawdbot被Claude公司强制要求改名