Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群
CEO甩出四段视频
白交 衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
Stable Diffusion要王者归来了?
Stability AI CEO Emad Mostaque最新推文,四段视频引人无数遐想。
![Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群](/wp-content/uploads/replace/bd4c4853f01b752e91de3daaef412a4d.png)
不少网友怀疑,这是Stable Video Diffusion新版本的演示Demo。
![Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群](/wp-content/uploads/replace/6bade0bb315f639f88e4a070153b6fa0.png)
因为从效果上看,不管是画面清晰度、一致性还是流畅度都十分惊人。
比如这只毛绒熊带着泳镜潜水。
![Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群](/wp-content/uploads/replace/e1606cdeb749cf92b871e5cad4380838.gif)
毛绒熊动作十分流畅,甚至还眨眼睛。而背后也有丰富的海水细节。
再加上Emad Mostaque本人,自今年1月1日开始就消失了几星期,始终未曾在社交网络上露面。
![Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群](/wp-content/uploads/replace/f336ea5e4c384f6fd69d9bfecf1cddba.png)
网友觉得,这一波更像是憋了个大新闻。Stability AI is back?
![Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群](/wp-content/uploads/replace/bc45b94ff3d1cf5f1af5fd6d74a45d9c.png)
(一度以为Stability AI已经在竞争中落后)
Stable Diffusion杀回来了?
从释出的四秒Demo来看,应该是针对SVD视频生成功能的升级。
不过基于文本还是图像生成尚不能断定,直接来感受一下效果。
![Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群](/wp-content/uploads/replace/d4d9b97ea1cd7a0cd62804c594c70988.gif)
还有这种动漫风夜晚的街道。
![Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群](/wp-content/uploads/replace/35e2fd457b10e6175efe3083e7a2da6a.gif)
去年11月,Stable Video Diffusion(SVD)正式问世,当时除了支持图像、文本到视频之外,还支持物体3D合成。
按照当时透露的计划, SVD只是作为基础模型,接下来还将继续拓展,建立起整个Stable Diffusion的生态系统。
当时网友对Demo的反馈包括光影不对、而且整体不连贯(视频帧与帧之间闪烁)。
![Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群](/wp-content/uploads/replace/bb2fd12dd53bb7b15a9a082e92a2db3a.gif)
而从现在Demo看,以一个类似视频作对比:绿色机器人躺在床上。
可以看到,机器人,以及旁边的杯子灯盏,甚至床被枕头的褶皱细节都更为丰富了。
而且在机器人脸上也有明显的光影映射。
![Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群](/wp-content/uploads/replace/157a3adf7775e8f7c5b0cb92d3616e54.gif)
不过更多更新信息还得等官方版本发布才能知晓。
值得一提的是,在这条推文之后,Emad Mostaque还发了条类似的。
没有文字,四张静图。
![Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群](/wp-content/uploads/replace/8bec94dc5c8dc2c25131ba33ce92f75e.png)
网友们表示了期待。“希望这个模型能全方位地超越SDXL,并更好地及时迭代。”“这是SD3?”
![Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群](/wp-content/uploads/replace/40898f36fc892b1bc6b6400f638c4a49.png)
![Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群](/wp-content/uploads/replace/76565f349f5f02dcabfed91dde2cde41.png)
不过这个地球西红柿是什么鬼???
又是同一天,他们的StableLM2 1.6B发布,一个只有16亿参数的小语言模型。它经过了英语、西班牙语、德语、法语、葡萄牙语和荷兰语等多语种训练。
![Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群](/wp-content/uploads/replace/d81015de9c592c73a16577ac6b5f2ee1.png)
几天前,他们刚发布新年以来第一个大语言模型Stable Code 3B。
如此频繁的进展,Stability AI莫不是真的要翻身了?
决战视频生成
之所以要说翻身,因为Stability AI在上一波文生图赛道里的确备受瞩目,Stable Diffusion的爆火,让它一度成为全球最受关注的AI独角兽。
但随着Midjourney的出现,以及OpenAI谷歌在内的频繁进展,而内部也不安生,包括CEO疑似剽窃成果、挪用公款,公司商业模式不明晰、拖欠工资等情况爆雷,Stability AI一度陷入风波之中。
去年11月官宣进军视频生成赛道,彼时已经有runway和pika这样的热门玩家出现了。
如今SVD新版本疑似亮相,之所以受到众人关注,除了本身企业之外, 还同当下正在高能爆发的视频生成赛道密切相关。
不少网友直言:真是一波又一波的卷,一家比一家更卷。
![Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群](/wp-content/uploads/replace/228a15389247378752fd11f6b4034efe.png)
要么是比版本发布迭代,这段时间国内大厂阿里字节等新进展频出。要么是从生成效果,清晰度、流畅性,前段时间,Moonvalley横空出世,惊呆不少人。
![Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群](/wp-content/uploads/replace/065b69c10884bbaba06b0ac249eab547.gif)
又或者在可控性等上面去卷……
这不就在前几天,runway的Gen-2再进化——
只需5个笔刷,对着一张图一顿刷刷刷刷刷,原本静止的小鸟们就各自运动了起来。
![Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群](/wp-content/uploads/replace/f139f99077be4f7b501c510cc9b2eeeb.gif)
那么在视频生成这个赛道,你看好Stability AI吗?
参考链接:
[1]https://twitter.com/StabilityAI/status/1747352719487054105
[2]https://x.com/emostaque/status/1748405750907457548?s=46&t=HBob6gxh8cOfZTIbieKeSA
- 开源=最强大模型!Llama3.1发布,405B超越闭源GPT-4o,扎克伯格:分水岭时刻2024-07-24
- 国内首批丨腾讯云上架 Llama 3.1模型,支持在 TI 平台精调和推理2024-07-24
- AI视频修复速度10倍提升,过曝变色也能逐帧搞定|美图国科大新算法2024-07-21
- 李飞飞创业:3个月估值破10亿美元2024-07-17