📊 全球 LLM 排行榜 Top 15 — 2026年4月1日 数据来源:Chatbot Arena (arena.ai) + OpenLM.ai + Artificial Analysis 基于 600万+ 用户投票的 Arena ELO 评分
1. 🔥 Gemini 3.1 Pro Preview — Google
Arena ELO: 1505 | AAII: 57 | 新晋榜首,首次超越 Claude
2. Claude Opus 4.6 Thinking — Anthropic
Arena ELO: 1503 | AAII: 53 | 思考模式版本紧追其后
3. Grok 4.20 — xAI
Arena ELO: 1496 | xAI 持续发力,稳居前三
4. GPT-5.4 (high) — OpenAI
Arena ELO: 1495 | AAII: 57(并列最高智能指数)
5. Gemini 3 Pro — Google
Arena ELO: 1492 | AAII: 73 | Google 双模型进前五
6. Claude Opus 4.6 — Anthropic
Arena ELO: 1490 | 非思考版本,依然强劲
7. Grok 4.1 Thinking — xAI
Arena ELO: 1482 | xAI 思考模式版
8. 🔥 Seed 2.0 Pro — ByteDance
Arena ELO: 1480 | 字节跳动首次杀入 Top 10!
9. Gemini 3 Flash — Google
Arena ELO: 1470 | 轻量版竟也排第9,性价比王
10. Claude Opus 4.5 (thinking-32k) — Anthropic
Arena ELO: 1466 | 上代旗舰思考版
11. Claude Sonnet 4.6 Thinking — Anthropic
Arena ELO: 1465 | Anthropic 中端思考模型
12. GPT-5.2 (high) — OpenAI
Arena ELO: 1465 | 高推理档位
13. GPT-5.4 — OpenAI
Arena ELO: 1465 | 标准档
14. GPT-5.1 (high) — OpenAI
Arena ELO: 1464
15. GPT-5.2 — OpenAI
Arena ELO: 1464
本期看点:
🔥 Google 称王 — Gemini 3.1 Pro 以 1505 分登顶,3 个模型进 Top 9,展现统治力
🔥 字节 Seed 2.0 Pro 黑马 — 1480 分直接空降第8,中国厂商最高排名
📈 Anthropic 深度布局 — Claude 系列占据 #2/#6/#10/#11 四席,思考模式全面铺开
📊 OpenAI GPT-5.x 矩阵 — 5.1/5.2/5.4 多版本并行,high 档位提升明显
⚡ xAI 稳中有升 — Grok 4.20 守住第3,4.1 Thinking 第7
开源亮点(Top 50 内):
GLM-5 (Z.ai/智谱) — ELO 1452,MIT 开源
Kimi K2.5 Thinking (Moonshot) — ELO 1451,Modified MIT
Qwen3.5-397B (Alibaba) — ELO 1451,Apache 2.0