首页
资讯
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
VLM
人类秒懂,AI崩溃:一个简单测试,就让GPT-5、Gemini等顶级模型集体“翻车”
AI靠模式匹配,不懂文字结构
不圆
2025-09-10
VLM
图像识别
多模态
巧妙!一个传统技术让国产视觉基础模型直接上大分
格灵深瞳发布Glint-MVT
十三
2025-05-23
VLM
格灵深瞳
视觉基础模型
视觉语言模型安全升级,还不牺牲性能!技术解读一文看懂|淘天MMLab南大重大出品
概念瓶颈+渐进式对齐
衡宇
2025-01-17
VLM
多模态
视觉大模型
北大最新多模态大模型开源:混合数据集训练,图像视频任务直接用
3天训完130亿参数通用VLM
衡宇
2023-11-29
VLM
北京大学
多模态
加载更多
热门文章
阿里发布Qwen3.5-Omni,多模态能力超越Gemini-3.1 Pro
2026-03-30
ClawTip来了! 京东科技首发推出AI智能体的“专属自主零钱包”
2026-03-31
全球OCR新王来自中国开源!GitHub狂揽73300+Star
2026-03-30
刚刚,TRAE SOLO上线独立端:已经不满足写代码,还要跨界干活!
2026-03-31
实测拿215项SOTA的Qwen3.5-Omni:摄像头一开,AI给我现场讲论文、撸代码
2026-03-31