Gemini 2.5 Pro的这一壮举,无疑让众多网友沸腾。大模型不仅在科技领域取得了突破,还在游戏世界中留下了自己的足迹。网友们纷纷感叹,Gemini的自我介绍里现在可以自豪地加上一条:首个成为宝可梦联盟冠军,并登入《宝可梦蓝》名人堂的大模型。
回顾Gemini的通关之路,可谓是一路坎坷。一年前的旧模型Claude 3.5还只能勉强走出新手村,到达常磐森林。而两个月前,Claude 3.7虽然能够击败道馆主,但也未能成功通关。如今,Gemini 2.5 Pro终于完成了这一壮举。
在直播中,我们可以看到Gemini每动一步都深思熟虑。左边的文本框里详细展示了Gemini每个行动背后的思考过程。在完成一长串行动后,Gemini 2.5 Pro在目标位置足足思考了40多秒,消耗了76011个token,才规划出下一步的行动。这种深思熟虑的态度,虽然让直播过程显得有些无聊,但也展现了Gemini在游戏中的专注和策略。
尽管Gemini已经成为了联盟冠军,但在宝可梦这款主要面向儿童和青少年的游戏中,大模型的表现仍然明显不如人类。这主要是因为大模型“视力不佳”,难以解读Game Boy屏幕中展现的低分辨率、像素化的世界。同时,游戏中的二维地图也对大模型构成了挑战。然而,在游戏中偏文本的部分,大模型已经展现出了惊人的表现。例如,在宝可梦对战中,大模型能够迅速理解游戏提示,并将这些知识整合到自己的战斗策略中。
谷歌的这一突破,无疑为大模型在游戏领域的应用开辟了新的道路。未来,或许会有更多的大模型加入到游戏世界中,与人类玩家一较高下。而测试大模型的基准,也许真的会变成谁能更快通关宝可梦了。