Transformer

Mamba架构第一次做大!混合Transformer,打败Transformer

取两架构之长,混合模型Jamba诞生

丰色 2024-03-29

Mamba正式被ICLR拒收!“年度最佳技术原理解读”却火了

一文看懂“Transformer挑战者”两大主要思想

丰色 2024-02-26

谷歌大模型研究陷重大争议:训练数据之外完全无法泛化?网友:AGI奇点推迟了

网友找出论文中更多关键却被忽略的细节,比如只做了GPT-2规模的试验等

大模型111人:谷歌和OpenAI的人才战争

从OpenAI和谷歌出走后,他们去了这4家公司