首页
资讯
数码
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
大模型训练
大模型训练开销还能更小!微软推出首个FP4训练框架,训练效果与BF16相当
中科大博士生一作
克雷西
2025-01-30
大模型训练
微软
700亿参数LLaMA2训练加速195%,开箱即用的8到512卡LLaMA2全流程方案来了!
可无代码训练、一键部署
明敏
2023-09-04
Llama2
大模型训练
开源方案
1块GPU+几行代码,大模型训练提速40%!无缝支持HuggingFace,来自国产开源项目
寥寥数行代码,大模型被玩出新花样
明敏
2022-07-13
Hugging Face
大模型训练
并行计算
加载更多
热门文章
4090单卡跑满血版DeepSeek-R1,清华团队开源项目再破大模型推理门槛
2025-02-12
免费!满血版DeepSeek丝滑畅玩,低门槛实现671B-R1/V3自由
2025-02-12
腾讯元宝接入DeepSeek-R1满血版,首次引入第三方模型,能联网能调用微信独家生态
2025-02-13
配这种CPU,GPU单卡就能跑满血DeepSeek-R1,至强+AMX让预填充速度起飞
2025-02-14
啊?7B的DeepSeek反超R1满血版,上海AI Lab周伯文团队新成果
2025-02-12