最近,OpenClaw创始人 Peter Steinberger 发布了一份名为 PinchBench 的基准测试榜单。一口气实测了 32 个主流大模型,从成功率、速度和成本三个维度做了完整对比。这也成了目前第一份专门针对 Agent 任务的,“龙虾大模型排行榜”。图源水印