扫码关注量子位
从时间和空间优化扩散模型
训练的token越多,需要的精度就越高
苹果M2上已运行BitNet b1.58 3B模型
量化后模型表现甚至超过全精度
模型越大效果越好
解决同质化问题,效果媲美真实数据