扫码关注量子位
5个ICLR审稿人谁也没看出来
Agent正在打破人机交互的边界
开源多模态推理模型SOTA易主
智能座舱L3时代
可以广泛应用在游戏娱乐、影视与动画制作、工业制造与设计等各种场景
“模型突破先于商业化”
首个MLLM+DiT架构开源图像编辑模型来了
已经可以在 GitHub、HuggingFace、ModelScope 等技术社区调用。
只需拍一张图,小布助手就可以精准识别并理解图像中蕴含的信息
登顶VBench评测榜
阶跃开源首月各生态厂商均已接入
复杂奖励函数不是必要的
没有赢家通吃的神话,只有深耕场景的长期主义者
开源生态滚雪球ing
普通人都能体验的AI大模型魔法时刻
视觉理解/视觉推理/语音/视频生成,通通来袭
万亿、多模态打底基座