当前位置:首页>排行榜>Gemini模型在战略棋盘游戏新AI排行榜中占据主导地位

Gemini模型在战略棋盘游戏新AI排行榜中占据主导地位

  • 更新时间 2026-02-04 08:57:34
Gemini模型在战略棋盘游戏新AI排行榜中占据主导地位

谷歌发布AI世界生成工具,多家游戏公司股价应声下跌


    谷歌的Gemini模型在棋盘游戏基准测试中表现优于竞争对手。谷歌DeepMind和Kaggle已在其“游戏竞技场”平台新增两款游戏:《狼人杀》和《扑克》。该平台通过一系列战略游戏测试AI模型的各项认知能力——国际象棋评估逻辑思维,《狼人杀》测试沟通和识破欺骗等社交技能,《扑克》则评估模型如何处理风险和不完整信息。

    这些游戏提供了客观方法来衡量不确定性下的规划和决策等技能。目前,Gemini 3 Pro和Gemini 3 Flash在所有排行榜中均占据首位。《狼人杀》基准测试还具有安全研究的双重用途:它能测试模型是否能检测到操纵行为,且无需承担任何现实世界的后果。谷歌DeepMind首席执行官德米斯·哈萨比斯表示,AI行业需要更严格的测试来正确评估最新的模型。

最新文章

随机文章