视觉推理

大模型首次拥有“脖子”!纽大团队实现360度类人视觉搜索

视觉空间推理从“脱离身体的被动范式”向“具身的主动范式”转型

henry 6分钟前

首个视觉RL统一框架!推理感知两手抓,性能横扫MEGA-Bench

构建三层组件设计和动态IoU奖励机制,性能升至14.1%

腾讯微视AI新技术曝光:斩获VCR榜单第一

模型大小相当于多模型中的单个模型