扫码关注量子位
比DiT快了10倍
视频可以延延延延延长到5分钟了
全程画面还能不崩坏
一手实测来了
一举攻克了视角-动作对齐与因果耦合两大瓶颈
内附实测链接
能够通过模拟人类的认知过程,建立起连接文本指令与视觉内容的智能评估体系。
利用AI视频世界模型生成神经轨迹,学会执行22种新任务
背后是商汤大装置在发力
我们直接拍个短剧
扩散模型在视频生成、编辑及理解等前沿领域的进展
校正流Transformer拿下新SOTA
成功实现“牛在天上飞”
每秒最低只要4分钱!
新版通义万相来了
自回归实时视频生成技术
已上线元宝APP
小范围内测已开启