扫码关注量子位
双杀两大难题
模型未出现性能饱和
字节也押注离散扩散路线了
Make MCTS Great Again?
在H100 GPU上达到1109tokens/秒吞吐量
一个“多余手指”引发的思考
视觉生成迈向多模态、3D语义与交互融合的新智能创作范式
可以即插即用
我们直接拍个短剧
扩散模型在视频生成、编辑及理解等前沿领域的进展
正向掩码+反向预测
从时间和空间优化扩散模型
玩转《DOOM》
全新多模态推荐系统范式
中科大哈工大度小满出品
覆盖297篇文献
各种风格都能驾驭
提出极简版新架构
时间成本仅产生约17%,可忽略不计
空间一致性也大幅提高了