112023喜报
© dream18560710
INVITATION
2026最新
AI大模型排行榜
火热出炉
数据来源Imarena
北京中品体育
文化发展有限公司
📊 总榜:Gemini 3系列“鲨疯了”
最近,LMSYS(大型模型系统组织)发布了2026年最新的AI大模型盲测排行榜,这份由全球数万用户参与评选的榜单,直接反映了各模型在真实场景下的表现,今天就跟随小编一起来看一下吧~
谷歌Gemini 3系列展现绝对统治力
Gemini 3 Pro
Gemini 3 Pro 以1489分拿下第1名,在英语、日语、德语、西班牙语等主流语言中全部登顶,堪称“六边形战士”。
Gemini 3 Flash
Gemini 3 Flash 紧随其后位列第3,不仅智能水准高,还主打极速响应和极致性价比,日常对话几乎无延迟。
xAI的Grok 4.1 Thinking以1477分位居第2,同样表现出色。
而我们熟悉的GPT-5.1-high仅排在第9名,已经掉出第一梯队;Claude Opus 4.5虽然在英语中排名第2,但在中文场景中直接跌到第13名,对中文用户不太友好。
📈 真实用户选择:Token消耗趋势
从OpenRouter的Token消耗趋势图可以看出,用户的实际使用偏好:
Gemini 2.5 Flash
Gemini 2.5 Flash 长期位居前列,是用户最青睐的模型之一。
Grok Code Fast 1
Claude Sonnet 4.5
Grok Code Fast 1 和 Claude Sonnet 4.5 也保持着高活跃度。
新发布的Gemini 3 Pro Preview正在快速增长,未来可能取代2.5系列的位置。
🎯 多维度细分:各领域强者
除了文本能力,榜单还对视觉、文生图、图编辑、文生视频等能力进行了细分排名:
视觉能力(Vision)
Gemini 3 Pro和Flash包揽前两名,GPT-5.1-high仅排第4。
文生图(Text-to-Image)
GPT Image 1.5夺冠,Gemini 3 Pro的图像预览版紧随其后。
图像编辑(Image Edit)
ChatGPT Image Latest表现最佳,Gemini 3 Pro系列同样位列前三。
文生视频(Text-to-Video)
谷歌Veo系列霸榜,Sora 2 Pro仅排第5。
💡 对我们的启示
1. 选模型看场景:如果是日常对话和多语言任务,Gemini 3系列是首选;如果侧重中文场景,Gemini 3 Flash反而比Pro版更优。
2. 性价比优先:Gemini 3 Flash兼顾性能与速度,适合普通用户日常使用。
3. 关注技术迭代:谷歌在多模态领域持续领跑,而OpenAI和Anthropic也在快速追赶,未来竞争将更激烈。
结语
AI大模型的竞争正在进入新阶段,这份榜单不仅反映了当前技术的天花板,也为我们选择工具提供了重要参考。后续我们会持续跟进榜单更新,为你带来第一手解读。关注我们,带你收集最新信息!
小编说明
文字:曲可乐
排版:曲可乐
图片:图源网络
审核:范海波