GPT-4o

GPT-4o遭越狱后指挥机器人做危险动作!全球首个具身智能体安全评测基准来了,大模型集体翻车

如果机器人管家能执行“点燃窗帘”这样的危险指令,那就有点危险了

刘璐也被Meta挖走了!华南理工校友,创造了4o吉卜力爆款

同时被挖的还有4o核心架构团队成员Allan Jabri

鹭羽 2025-07-15

全华人团队推出多模态大模型新基准,GPT-4o准确率仅为65.5%

还发现感知错误、推理错误是所有模型最常见的两大错误。