首页
资讯
数码
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
视频理解
大模型无法真正理解视频,GPT-4o正确率仅36%,南洋理工大团队提出新基准
用5种问题发现AI视频理解的3大弱点
不圆
2025-08-01
新加坡南洋理工
视频理解
视频理解大模型
视频理解能力
单卡搞定万帧视频理解!智源研究院开源轻量级超长视频理解模型Video-XL-2
2048帧视频12秒编码
鱼羊
2025-06-04
智源
视频理解
3B模型逆袭7B巨头!Video-XL-Pro突破长视频理解极限,大海捞针准确率超98%
单卡可处理近万帧视频,超长视频理解新SOTA
十三
2025-05-04
上海交通大学
大海捞针
视频理解
Llama都在用的RoPE有了视频版,长视频理解/检索绝佳拍档
复旦大学、上海AI Lab等带来
明敏
2025-02-19
视频理解
达摩院开源VideoLLaMA3:仅7B大小,视频理解拿下SOTA | 在线可玩
还有2B的图像理解模型
十三
2025-02-14
图像理解
开源模型
视频理解
达摩院
加载更多
热门文章
英伟达巧用8B模型秒掉GPT-5,开源了
2025-12-06
“豆包手机”在二手市场价格都翻倍了……
2025-12-05
谷歌新架构突破Transformer超长上下文瓶颈!Hinton灵魂拷问:后悔Open吗?
2025-12-05
SpaceX估值8000亿美元超OpenAI,IPO就在明年
2025-12-06
Ilya刚预言完,世界首个原生多模态架构NEO就来了:视觉和语言彻底被焊死
2025-12-06