新Vidu Q3参考生,这是冲着「剧」来的!万物皆可参考:特效音效场景都备好了
参考生的纪录,Vidu自己超越自己
针寞机 发自 凹非寺
量子位 | 公众号 QbitAI
咱就是说啊,这年头做一个小短剧,真的不要太简单。
因为,现在手搓一集国漫小短剧,真的是几张图就能搞定!
话不多说,直接来看效果:
视频地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
不论是打斗的特效还是背景音效、人物的旁白,都是一锅出的那种!
这就是生数科技Vidu Q3正式发布的参考生视频,主打的就是一个为剧而生,万物可参,声画同出。
(早在Vidu Q3在今年1月发布的时候,它就登顶了国际权威AI基准测试机构Artificial Analysis榜单。并且在全球首个参考生榜单,SuperClue榜单中,Vidu Q3断层登顶,一举拿下多图/单图参考任务双榜第一!)
视频地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
刚才的国漫小片段,所需要的素材,仅仅就是一个人物主体、一张背景图,再搭配一段Prompt即可:
甚至你只需要一张参考图,Prompt描述到位,也可以解锁类似柳神的国漫效果:
视频地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
不只是准备工作需要得少,这次Vidu Q3的参考生视频,感觉就像把一个完整剧组摆到了你面前:
- 6大特效:粒子、流体、动力学、运镜、转场、光影,通过自然语言就能控制
- 5大音效:环境、动态、氛围、拟音、情绪,听觉也有了叙事连续性
- 4大场景:短剧、漫剧、影视剧、广告核心场景提升了能力,可作为商用的内容单元
嗯,不难看出,Vidu Q3是冲着剧而来的。
视频地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
万物皆可参考,人人都有一个影视库
那么Vidu Q3到底能把剧做到什么程度,我们接下来就从特效、音效和场景三大角度来一波实测。
六大特效,把想象力给“画”出来
首先是特效方面,我们实测的是一段未来科幻赛博风的视频,先来准备三张图:
然后我们再给Vidu Q3输入一段Prompt:
竖屏9比6,高清科幻质感,电影级动态运镜;机甲战士激活核心,蓝紫霓虹粒子束喷涌而出,流体能量光带环绕周身,金属机甲动力学形变自然丝滑;抬手释放等离子护盾,光影体积光穿透烟雾,镜头极速推进+360°环绕转场,建筑破碎、碎片飞溅遵循真实物理碰撞;全程无对白,仅保留高能科幻特效轰鸣,10秒无崩坏,成片级未来科技视觉冲击力拉满。
在稍等片刻之后,特效拉满的视频片段就诞生了:
视频地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
可以看到,视频中的特效内容、运镜等等,都和Prompt中的要求做到了一致。
区别于其他模型单一特效叠加的生硬感,Vidu Q3参考生视频的特效高度服务于剧情节奏,光影明暗呼应情绪起伏,运镜转场贴合叙事逻辑。
而且是几张参考图和一段Prompt就能解锁影视级特效的那种。
更宏观、更细节、更天马行空的特效,现在拿着Vidu Q3也是手拿把掐:
锁定参考图 @图2星云主体 + @图1 星环场景,全程无人物,纯宏观宇宙视觉,6 秒无缝连贯,无崩坏;粒子 / 流体 / 光影 / 运镜四大特效拉满,低频宇宙轰鸣音效,史诗级沉浸感0-2s 上帝视角俯冲推进,深空暗蓝基底,鎏金星尘粒子呈漩涡状流体涌动,体积光穿透星云,光晕弥散2-4s 镜头 360° 环绕拉升,巨型星环缓缓自转,碎星刚体动力学漂浮碰撞,蓝紫能量光带环绕星环流转4-6s 中心超新星微光爆发,金白粒子射线辐射全域,光影明暗极致对比,定格浩瀚宇宙史诗画面,音效低频震颤收尾。
视频地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
像下面这个火焰特效,是直接可以在电影中使用的程度:
视频地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
动漫中的华丽特效亦是如此:
视频地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
五大音效,听声音就很有感觉
接下来,我们继续实测一下音效方面的能力。
同样是先丢两张图进来,但这次设计的Prompt将更加聚焦于声音:
图1一条茂密的雨林小径,两侧高耸松树形成天然走廊。中景雾气缓缓飘移,降低能见度。背景树木逐渐隐入灰白雨幕。雨滴持续穿过树冠,落在潮湿的树叶和地面水洼上。景深大,镜头沿小径缓慢前移,沉浸宁静氛围,写实风格,平滑运动,自然雨动态。图2在图一的中间走着。不要音乐,只要环境音
在没有任何背景音乐的情况下,雨中漫步的感觉就通过音效传递出来了:
视频地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
以及像影视片段里经常看到女主在舞台演唱,Vidu Q3也能把唱歌这事给hold住:
0-2s 慢推近景,女生指尖拨动吉他琴弦,发丝随动作轻扬,舞台暖光柔焦闪烁,吉他弦震动拟音清晰自然2-4s 固定中景,女生开口弹唱“星光为我加冕,歌声奔赴山海”,口型精准匹配歌词,音色清甜元气,环境音适配舞台混响,光影随旋律明暗律动音效配置:吉他弹奏原声、舞台空间混响、轻柔氛围音,听觉层次饱满,人声与伴奏融合自然
视频地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
四大场景,总有一个是你需要的
除了上面提到的动漫、电影,再来看下一个快节奏短剧的实测:
视频地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
有一说一,这个质感,乍一看真还以为是真人出演的短剧了。
最后,我们再来看下Vidu Q3参考生视频做广告视频的能力,Prompt如下:
竖屏9比16,轻奢广告大片质感,特写+中景无缝切换;柔光冷调光影,模特指尖轻捏唇釉,瓶身鎏金光泽细腻,特写镜头展示唇釉丝绒质地,上唇丝滑无卡纹;无多余台词,仅高端画外音:“一抹鎏金,定义高级质感”;音效极简高级(瓶身碰撞轻响、膏体丝滑摩擦音),背景无杂音,人物妆容精致统一,镜头高级不浮夸,适配美妆广告批量生成、多版本迭代。
视频地址:
https://mp.weixin.qq.com/s/ZQSMvJtMOlovg0E_fBC7Wg
同样依旧是稳稳实现了Prompt中的各种细节要求,有了Vidu Q3参考生,现在做个广告也是图片+自然语言就能搞定的事了。
参考生优等生,不断自己超越自己
在整体实测过后,最大的感受或许就是——
曾经AI视频圈子里比拼的一致性等问题,到了Vidu Q3参考生视频这里已经是个基本项,它追求的是一种全新的内容生产范式。
万物可参,是Vidu Q3最核心的突破。角色形象、场景布景、服化道细节、核心视觉元素全部支持可复用建模,创作者无需再依赖一次性随机生成,而是像搭建专业影视素材库一般,自由组合、反复调用、灵活迭代,每一次生成都能稳定输出专业级、影视级的标准化内容,解决了AI视频创作中风格割裂、形象崩坏、细节失控的行业痛点,让低成本、高质量的批量内容生产成为现实。
回顾Vidu清晰的模型演进路线,我们能完整窥见AI影视创作从0到1、从能用至好用的全进化轨迹。
Q1版本重新定义叙事逻辑,夯实了AI视频基础生成能力;Q2版本解锁AI演技,赋予虚拟角色灵动的微表情与肢体表现力,打破虚拟人物僵硬感;而全新的Q3版本,正式宣告AI视频工具迈入工业化内容生产阶段,以“为剧而生”为核心定位,彻底转型为可落地、可商用的专业影视创作生产力工具。
更值得一提的,是Vidu Q3打造的参考生全家桶全链路生态。模型层面,完整覆盖文生视频、图生视频、参考生视频三大核心能力,形成无死角创作矩阵;服务层面,以Q3模型为核心底座,Vidu SaaS(Vidu Agent、Vidu Claw)、Vidu MaaS(Vidu AI开放平台、Vidu.API)全面接入核心能力,构建起创作、生产、交付一体化的闭环服务体系。
同时,Vidu Q3兼顾了专业性与普惠性:0门槛快速上手,价格仅为行业平均水平的1/3,生成速度快、镜头切镜自然流畅,即便在使用高峰期也能保持稳定输出,还支持定制化提示词调优、全流程工作流适配。无论是个人独立创作者、短视频工作室,还是影视制作公司、品牌广告团队,都能低成本接入,快速将创意转化为可直接交付的成片内容。
从技术突破到生态落地,从创意生成到商用交付,Vidu Q3用一次次自我迭代,重新定义了AI视频的行业标准。一句“Action”、几张参考图、一段文字指令,人人都能化身专业导演,一键开拍影视级大片,这便是Vidu献给整个内容行业的全新答案。
最后,送上一波福利:
输入专属邀请码:JQZXN3,登陆Vidu.cn。注册即送500积分。
- 开源模型首超Opus4.6!智谱GLM-5.1登场,14小时后CUDA专家被冲了2026-04-08
- 国产免费2B开源语音模型征服《莽撞人》!复刻郭德纲最难贯口2026-04-08
- 企业玩不转龙虾,是人的思维出错了2026-04-03
- 智谱上市后首份财报:超7.24亿元!国内收入最高大模型公司,MaaS发力了2026-03-31




