benchmark

拜拜了SWE-Bench!Cursor刚发了个AI Coding评测基准,难哭Claude

专门评价Cursor中不同模型谁更“智能体”