首页
资讯
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
模型训练
SFT别急着接RL!你的多模态大模型可能一直在“带伤训练”
先把SFT挖的坑填了!
衡宇
2026-05-17
SFT
多模态大模型
模型训练
打破代码大模型训练瓶颈:MicroCoder将算法数据框架训练经验升级
用34条经验破解现代代码模型训练瓶颈
量子位
2026-03-30
模型训练
调整训练数据出场顺序大模型就能变聪明!无需扩大模型/数据规模
微软亚研院提出模型训练新范式
衡宇
2025-09-06
MSRA
模型训练
2天训练出15亿参数大模型,国产开源项目力克英伟达Megatron-LM,来自LAMB作者团队
只用一半GPU,训练同款大模型
明敏
2022-01-20
并行计算
开源
模型训练
秒秒钟揪出张量形状错误,这个工具能防止ML模型训练白忙一场
首尔大学最新开发PyTea
十三
2021-12-27
张量形状
机器学习
模型训练
加载更多
热门文章
4nm!比亚迪自研AI芯片来了:制程对齐英伟达,算力拉爆特斯拉
2026-05-29
DeepSeek V4芯模协同背后,国产算力生态开始飞轮加速
2026-05-28
面壁智能「开源周」:一场定义端侧 AI 终局的系统性「亮剑」
2026-05-29
创意设计版WorkBuddy来了!腾讯发布智能体创意工作室Miora
2026-05-29
7B打败o3、GPT-5!医学AI智能体让模型学会“看哪里、怎么看”
2026-05-28