《原神》又要引领一次革命?
文/秋秋
01
会玩《原神》的AI
这两天,一款号称能玩《原神》的AI模型Lumine-Agent突然刷屏。
在B站,Lumine团队放出了总长超过25小时的8段实录视频,主要展示了AI游玩《原神》《崩坏:星穹铁道》和《鸣潮》的过程。

在实录视频中,团队公开的内容除了游戏流程实机,还包括下方的「AI思考过程」,右侧的AI鼠标键盘指令——通过这些视频,我们能比较清楚地看出AI玩游戏的具体过程:


居然还知道看教程
从实机来看,Lumine不仅能顺利完成多款游戏的体验流程,还闹出了不少笑话。如果加上配音,其节目效果可能不亚于一些游戏实况UP主——看来又一个职业要被AI威胁到了。

朝凯亚发起攻击

理直气壮地跳过《鸣潮》动画
据官网介绍,Lumine在《原神》中的应用场景包括:
1. 基础交互:能完成战斗后开宝箱、通关秘境、完成日常委托等复合操作;


2. 应对BOSS机制:可理解并应对无相之雷、风魔龙等BOSS的特定玩法,如 躲避攻击、攻击弱点、拾取元素颗粒等等;


3. 精密操作:能完成飞行搜集、瞄准射击、点燃荆棘、激活元素方碑、限时挑战等复杂解谜;


4. 界面适应:可在3D探索与2D界面 (如NPC交互、GUI操作)间自然切换;


此外,通过将复杂目标拆解为具体步骤,你还可以引导Lumine完成收集风神瞳、冻结水面取物、利用风场开箱等更复杂的操作。

爬上右侧的石柱,到达最高处后收集位于左侧空中的蓝色风神瞳

切换角色为凯亚,不断释放E技能冻结水面,以收集前方浮在水面上的风神瞳

收集风种子以激发风场,进入风障内,开启宝箱
从这一系列演示的效果来看,虽然Lumine并没有表现出网友所说的「完全让代练、代肝UP失业」的效果,但至少能在过剧情、重复刷本等相对耗时的流畅中解放玩家双手,展现出一定的实用价值。
有意思的是,有网友指出「Lumine」这个名称,正是《原神》中女主「荧」的英文名,团队也因此制作了一组相关图片。

论文进一步指出,Lumine是目前唯一能在3D开放世界中完成数小时任务的AI智能体。在四项关键测试中,其特定版本「Lumine-Instruct-NonHis」的成功率均超过80%,性能显著优于GPT-5、Gemini 2.5 Pro、Grok-4、Qwen3-VL等主流大模型及其它基线方法。

此外,尽管Lumine主要使用《原神》数据进行训练,但其目标却是打造通用型智能体。论文显示,团队也将Lumine的实测范围扩展至《鸣潮》《崩坏:星穹铁道》乃至《黑神话:悟空》,并取得了不错的结果:
在《鸣潮》中,Lumine仅凭推理能力,就以接近新手的水平完成了游戏的前两个剧情(约107分钟)。
有意思的是,由于基础模型知识库的截止时间早于《鸣潮》上线,它在推理时会出现「幻觉」,借用《原神》的术语来描述《鸣潮》的内容——论文表示,类似的跨游戏知识迁移现象,在人类玩家中也很常见。

面对与《原神》玩法不同的《崩坏:星穹铁道》 (箱庭探索+回合制战斗),Lumine依然通关了「黑塔」空间站的主线,耗时约7小时,仅比人类玩家的平均速度 (4.7小时)慢2.3小时——速度差距主要来自回合制战斗的操作、验证跳跃(崩铁不能跳)和空气墙阻挡。

快难为死AI了


尽管存在局限,但跨游戏的测试仍表明,Lumine所展现的通用能力存在较大潜力。
02
还在早期,还在招人
为了达到目前的实测效果,Lumine团队投入了不少心力。
简单来说,Lumine采用视觉推理模式:由两台主机协同工作,一台负责每200毫秒截一张图并提交推理请求,另一台主机负责推理并将其转化为鼠标键盘指令返回。

基于这一流程,Lumine团队使用了总计约4500小时的《原神》视频数据进行训练,其中包括1731小时的人类游戏数据用于预训练、200小时的指令数据用于语言基础训练,以及15小时的推理数据用于实现混合式思维。
整个过程不仅耗时、耗力,更耗钱——仅用于推理的主机,就搭载了4块H20显卡,价格超过30万人民币,而训练整个Agent模型更是需要64块H100显卡,成本至少1500万元。再算上AI领域高昂的人力成本,整个项目推进下来,少说也要耗费数千万的成本。

「安柏」和「火元素方碑」
其次是会「偷懒」,比如任务要求射击三个史莱姆,AI射完两个就干别的去了,或者忽略类似「捡起一朵花」这样的细节指令;再然后还有空间感知偏差问题、控制精度问题等等。
可以说,在Agent能力和成本没有突破性迭代之前,普通玩家想用AI「代肝」,仍是一个不切实际的幻想。
而Lumine团队之所以如此「财大气粗」,则是因为他们来自字节跳动种子计划 (ByteDance Seed)。
该团队负责字节跳动的AI能力研究,覆盖大模型、视觉、语音、多模态交互、通用机器人乃至生物领域,目前字节旗下的飞书、火山引擎、豆包、猫箱、星绘、即梦等应用都有该团队的技术落地。

ByteDance Seed官网
Lumine项目的负责人及论文主要作者谭伟豪,是南洋理工大学博士生。他在个人主页上表示自己很喜欢米哈游的游戏,巧的是,他的博士导师也叫「安柏」——与《原神》开篇的引路人安柏的中文名相似。

谭伟豪曾在2024年,发表过能「玩游戏」的智能体Cradle的相关论文,后者的底层基于GPT-4V,执行逻辑同样是以屏幕截图作为输入,输出键鼠操作。

当时团队「让AI玩游戏」的技术能力还没有这么强,主要展示的能力包括:在《荒野大镖客2》中完成40分钟主线任务、在《城市:天际线》中建造千人城市、在《星露谷物语》中耕种并收获欧洲萝卜、以及在《经销商的生活2》中实现单周最高87%的交易利润率;此外,Cradle还能操作Chrome、Out书等日常软件,并使用美图秀秀、剪映处理图片和视频,展现出了一定的通用性。


由此可见,Lumine可能是Cradle的迭代与特化版本,专注于开放世界游戏场景的测试,目前仍处于早期探索阶段——论文末尾附带的《原神》数据标注人员招募信息也印证了这一点。

03
任何技术都有意义
可能看到这里,不少读者会觉得:除了「AI玩游戏」听起来挺新奇,再加上对实况主、代练业可能有点冲击之外……这项技术,似乎也没有那么大的实际意义?
我认为这个问题可以从两个层面看:
第一层,我们先聚焦「AI玩游戏」本身。
利用AI模拟真实玩家的操作,一直是众多游戏厂商重点投入的技术方向。从硬件层面的操作脚本,到《王者荣耀》《逆水寒》等产品中训练的AI队友或对手,都显示出游戏行业对高拟真AI的强烈需求。
但同时,有资料显示,《王者荣耀》训练AI「绝悟」时,其测试架构就动用了60万个CPU核心和1064张显卡,保守估计成本达数亿元;网易《逆水寒》手游也曾表示,每年投入约3000万元用于AI云计算资源,以训练智能NPC。
图源《逆水寒》手游公众号
某深圳射击游戏厂商CEO也表示,每年只是为游戏配备AI队友,就要向超参数这类专业公司支付数千万元的费用(也证明这类生意确实赚钱),这是他们最终选择自研AI的原因。

超参数官网
在这种背景下,Lumine展现出了两大优势。
首先是 通用性。跟上述依赖游戏内部封闭数据的专属AI智能体相比,Lumine的技术路线和特性有些不同:

某大厂射击游戏制作人曾提到,其项目中的AI队友始终效果不佳,主因是副本类型多、机制复杂,传统规则型AI难以灵活适应——现在来看,如果采用视觉推理AI,或许就有机会解决这一问题。
比如论文指出,Lumine在导航上的效果非常出色,堪称其通用能力中最扎实的一环。这跟早期的「传奇自动寻路」不同,AI智能体的通用性更强,路线更自由,在研发端也几乎不需要绘制导航网格之类的设计成本。

没有「璃月」地图训练数据的情况下,AI仍能正常推进璃月主线
其次是 训练成本较低。
虽然整个Agent模型的训练,保守需要数千万的成本,但相比上面这些烧钱的情况,确实算得上比较划算。更何况,厂商也完全不必自己从零开始训练,如果能直接调用字节训练好的、成熟的Lumine API或基础模型,所需的成本或许会更低,风险也更小。
难怪论文中会用「仅需」
此外,我认为Lumine至少还有两种应用场景:自动化游戏测试,以及反推游戏设计。
传统游戏的研发阶段,厂商一般依赖人力测试游戏性能、稳定性,寻找BUG等,虽然随着技术的迭代,部分测试环节可以用脚本代替,但相比之下,Lumine Agent不仅可以24小时不间断工作,还能模拟真实玩家的复杂操作,高效地发现极端情况下的BUG,极大提升测试场景覆盖率和效率——而且游戏的场景越复杂(像《原神》),它的优势就越明显。
你看,这证明Lumine还能顶掉一大块游戏测试的开销。
更进一步,「AI玩游戏」的背后,是AI对游戏交互逻辑的理解。如果把这套能力反推,未必不能实现用「AI做游戏」:只需要设定目标和规则,AI就能自主推理,结合其他工具,自动生成地图、关卡、任务动线等等。
当然,说来说去,又回到了问题的第二层:这一切真的有意义吗?
比如相关的担忧不难理解:AI都帮你玩游戏了,那你玩游戏的乐趣又在哪?如果有人用AI刷资源或者打破游戏平衡,那是不是又变成了另一种「外挂」(当然目前已经有AI外挂了)?这些问题也需要随着技术演进反复论证。

《原神》一周前还发布了打击鼠标宏、自动化脚本的违规行为,而Lumine说到底还是三方自动化脚本的一种
但在此之前,我依然相信任何AI与游戏结合的技术,都有其存在的价值。
就像你现在回过头看AlphaGo,它不就是个只会下围棋的AI吗?但它带给世界、带给AI行业的震撼和价值,早已让很多人忘了这点——说不定到了某一天,我们过去所有讨论过「有啥意义」的技术,也会在未来,给我们巨大的回报。
至少现在,字节跳动CEO张一鸣,大概不会再批评员工上班摸鱼玩《原神》了吧……

图源网络
参考资料:
https://www.lumine-ai.org/
https://seed.bytedance.com/zh/research
https://weihaotan.github.io/
https://baai-agents.github.io/Cradle/
游戏葡萄招聘内容编辑,