首页
资讯
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
大模型加速
推理效率提升超200%,易用性对齐vLLM,这款国产加速框架啥来头?
运营成本最高降低 64%
白交
2024-09-18
大模型加速
腾讯云
用上这个工具包,大模型推理性能加速达40倍
满足LLM更多场景应用需求
白交
2023-12-01
CPU
大模型
大模型加速
英特尔
PyTorch官方认可!斯坦福博士新作:长上下文LLM推理速度提8倍
已在64k CodeLlama上通过验证
丰色
2023-10-17
Transformer
大模型加速
加载更多
热门文章
卡帕西没做完的,开源社区48小时搞定了!完全体知识库,token省70倍
2026-04-07
Meta员工空转AI只为浪费token!烧的多挣的多,日均消耗2万亿
2026-04-07
阿里视频生成大模型Wan2.7登顶DesignArena榜单
2026-04-10
LeCun点赞:国产开源模型占领硅谷,性价比超10倍
2026-04-10
Anthropic发布Managed Agents,才发现这支硅谷华人团队早就押对了赌注
2026-04-09