扫码关注量子位
复杂推理基准超越同规模模型
后训练正在重塑企业AI
24小时内即可生成数百个高质量的候选蛋白
大语言模型在解数学题时,真正的计算发生在哪里?
引入模式自动切换并未牺牲精度
坏了,被AI学到真东西了(Ctrl V大法)
推动了大模型的降本增效
首次在一个模型里融合推理、代码和Agent
苏轼的一首诗还道出了背后的三大定律
超半数医学生在使用
GPT-4o、Gemma 3等大语言模型有“固执己见”和“被质疑就动摇”并存的冲突行为
高考全科目评测来了
国内首个高考志愿大模型
采用双分支并行生成机制
当模型被明确要求生成特定长度的文本时,大多数模型表现糟糕
大模型越擅长复杂推理,越容易忽视用户的指令要求
还发现了缓解模型谄媚行为的方法
京东给出的大模型解法并不是“黑箱”