昨天(5月13日),腾讯游戏发布了2025年第一季度财报。
不出意外,《洛克王国:世界》登上了这次财报。作为今年目前为止最大的爆款之一,《洛克王国:世界》成绩确实亮眼: 上线9天用户量突破3000万,上线一个月DAU均值达到1300万,在唤醒老玩家情怀之外,还带来了大量的泛用户和年轻玩家。按目前的发展趋势来看,洛克很有机会成为腾讯游戏新的长青产品。
作为继火影、暗区之后,魔方第三款DAU破千万的产品,《洛克王国:世界》的成功,标志着魔方在动作、射击和大世界RPG三条赛道,都有了自己的扛鼎之作,也证明了魔方持续产出爆款产品的能力。

对于《洛克王国:世界》的爆火,我们之前已有文章分析()。无论通过精灵大世界的打造,突破传统捉宠品类的限制,还是商业化上的克制、对IP的深度理解,都是《洛克王国:世界》持续出圈的原因之一。
但在这些之外,还有一个很少为人知晓,但影响无数洛克玩家的存在:AI。在本次的腾讯财报中,就提到《洛克王国:世界》中,运用了 强化学习AI驱动NPC对战。
过去两年,AI几乎成了游戏行业最炙手可热的关键词。但在技术热潮之外,真正值得追问的问题是:AI究竟改变了什么?这些技术红利,有多少是真正改善玩家体验的?
为此,我们专访了腾讯魔方工作室AI负责人廖诗飏,深入拆解这款游戏背后的AI实践。在这次交流中,他详细拆解了魔方团队如何利用强化学习(Reinforcement Learning)等前沿技术,在《洛克王国:世界》中,面对 “300+选6”这种超大规模角色组合带来的计算爆炸挑战时,如何通过一套务实的工程化逻辑,构建出一个兼顾竞技深度与人情味的游戏生态。
对战AI:让NPC打得更像真人
作为魔方工作室运用AI技术最全面的产品之一,《洛克王国:世界》中最常见的AI 运用,藏在跟玩家对战的NPC当中:NPC的战斗决策,全部由强化学习AI驱动。
在内测期间,曾有玩家反映《洛克王国:世界》中的PVE对战不够智能,NPC喜欢根据属性克制、玩家阵容等因素来行动,甚至会出现NPC为了打属性克制,来回切宠物的现象。这是因为在传统行为树模式下,NPC的行为模式是写死的,一方面行为模式容易被玩家摸透,另一方面NPC也会出现机械的读指令现象,影响玩家对战时的趣味性。
强化学习AI的引入,其目的便是让NPC在战斗过程中更像真人,给到玩家丰富多样的对战体验。身为一款精灵大世界游戏,《洛克王国:世界》一直追求让玩家体验到真实生动的精灵世界,而让NPC更有活人感,自然对实现这一目标更有帮助。

从技术视角看,洛克所采用的强化学习对战AI并不算横空出世的新物种,而是早已被反复验证的成熟路径。
魔方工作室更是从《火影忍者》开始,就在这一方向上积累了数年经验。
但首要的问题是,当这套技术进入具体产品时,它究竟该怎么去优化玩家的体验。
在纯粹的强化学习逻辑下,最优策略往往指向绝对的理性,AI为了奖励最大化,会选择风险最低、收益最高的行为路径。廖诗飏举了个格斗游戏的例子:在《街霸》中,有些高手玩家会一直站着不动等待对手出招,再抓住破绽一击制胜。

这种决策在算法层面是无可挑剔的“正确答案”,但在实际游玩体验中却令玩家难以接受,因为它不仅显得不够真实,而且会迅速消耗掉玩家的耐心 。
廖诗飏直言,这正是早期AI常见的问题: 很强,但不像人。
因此,《洛克王国:世界》有意识地限制了AI的“正确性”,将对战AI的目标重新锚定在提供多样且合理的博弈体验上。
敏锐的玩家会发现,在《洛克王国:世界》中,AI并不会读取玩家的精灵信息,也不会基于固定规则进行克制判断,而是依赖训练过程中积累的统计经验来做决策。
换句话说,AI很像一个 打过大量对局、老道成熟的“玩家”,凭借丰富经验作战。
这种变化带来的影响是十分微妙的。在对战过程中AI不再总是做出最优选择。在拥有优势时,它可能选择直接攻击,也可能会继续叠buff,以更加保守的策略巩固优势;而在某些情况下,它甚至会判断失误。
这些看似不完美的行为,反而构成了更接近于真实玩家的对战体验。
其次,AI在游戏中落地还面临另一个问题:如何保证对局的多样化及不可预知性。
为此,魔方在训练中引入了 多模型对抗机制,让不同的AI挑选精灵组队对战,在博弈中互相对打拆解,从而确保策略池的深度与多样化。
同时,团队还通过“人类知识蒸馏”的方式,将策划的实战经验灌输给AI,让算法在保持泛化能力的同时,其行为逻辑始终贴合玩家所熟悉的策略常识。

类似的取舍也体现在阵容组合的处理上。《洛克王国:世界》的精灵体系本身就具备极高的复杂度,约300只精灵中选择6只组成队伍,双方共有12只精灵出战,每个精灵4个不同的技能,其中还有属性克制、buff、天气等要素,都会影响阵容配置。
如果完全依赖穷举训练,不仅成本不可控,也难以在项目周期内落地。

洛克的做法是“抓大放小”。一方面,团队会优先针对玩家常用阵容和策划设计阵容进行重点训练,保证主流对局的体验质量;另一方面,则依赖强化学习的泛化能力覆盖长尾情况。
这种策略服务于一个核心目标:让玩家在绝大多数时间里,都能遇到合理但不重复的对手。最终,这些能力并不会以“AI系统”的形式被玩家明确感知。
相反,它润物细无声地融入到一条更平滑的体验曲线中。从新手区域到高难挑战,不同场景下的NPC表现出明显的策略差异,而这种差异既来自AI本身,也来自策划对节奏的控制。
从玩家的反馈来看,这套AI对战系统的引入,确实解决了不少问题。就比如测试阶段常见的NPC对战时频繁切宠的问题,在正式上线后已经很少能看到玩家吐槽,说明这个问题至少在玩家侧,已经得到了不错的解决。
团队的经验表明,一个精心训练的AI不但要能精准应对玩家行为,还能通过多样化策略维持游戏节奏的自然感,让玩家感受到 “有人在对面思考”的真实体验。

这样一套聪明的AI对战系统,让对手显得更有人情味,让生态显得更加平衡,让整个游戏世界在算法的驱动下,呈现出一种自然且富有生命力的博弈美感。
魔方AI:从产品需求出发做AI
据廖诗飏介绍,在魔方内部,AI技术应用主要分为四大核心方向: 强化学习对战AI、利用大语言模型做的AI NPC、生成式AI、以及传统AI系统。
这四个方向互为支撑,使得AI不仅能解决单一技术问题,更能在产品节奏、玩法设计和运营策略上发挥价值。
这种体系化的能力,让魔方AI团队在面对不同项目时拥有 高度的灵活性和适应性:无论是策略偏向明显的回合制对战,还是对即时反应要求极高的动作竞技,亦或是自由度极高的开放世界,《火影忍者》《暗区突围》等项目都能得到定制化的AI解决方案。
在这当中, 强化学习是团队最成熟、最具竞争力的方向。这跟魔方AI团队的起源有关。魔方AI团队成立了五年,最开始做的就是《火影忍者》的强化学习技术。由于人力有限,他们只能集中去做这一件事,直到有了成功案例后,才逐渐拓展到人机交互、大模型等领域。

魔方早期在《火影忍者》中的AI训练
也因此,魔方的AI团队,很多时候会考虑,如何用有限的人力去完成具体的需求。这也是魔方AI团队跟主流的AI大模型团队之间的差别。
廖诗飏就曾跟我们强调, 希望技术能服务玩家体验,而非单纯追求技术指标。
如果说大模型团队的工作模式,是先打造好强力的工具,再给工具找到实际落地场景,那魔方的AI团队则是先找到靶子,再思考如何将箭准确射到靶子上。
一个具体的例子是天气系统。
洛克的对战中有天气机制,可以通过精灵释放,为双方添加buff,但这个机制并没有设置强制的新手教学环节——而是让AI在战斗中主动释放天气。玩家在这个过程中能够很明显地感受到天气技能的存在,继而主动去了解这个机制,并在后续的对战中学会运用。

技能:冬至,召唤雪天
随着魔方在强化学习方向上不断迭代,在《洛克王国:世界》的开发流程中,AI也介入了内容设计与平衡性验证的环节。这同样诞生于项目的实际需求。
在传统开发流程中,精灵强度、技能设计以及阵容平衡,主要依赖策划经验与内部测试。这也意味着,很多不平衡的阵容、精灵,往往是在上线后才被逐渐暴露出来的。
而魔方尝试改变这一点的方式,是 让强化学习提前介入测试阶段。
在实际流程中,AI会在大量模拟对局中进行互相博弈,通过数以百万计的战斗记录,统计不同精灵、技能与阵容的胜率表现。这些结果不会直接替代策划决策,但会作为一个额外视角为策划提供参考,并作为设计方案的重要补充。

游戏内存在多种技能配置
这让传统意义上的上线后迭代,开始前移到上线前验证。
不过,这种能力终究不能代替人的判断。廖诗飏在采访中强调,AI的分析本质上仍然是统计结果,它无法理解设计意图。在定调策略走向和判定玩家体感的关键环节,最后的决策始终握在人手中。
这一切背后,是团队对机器学习技术的深耕与对玩家体验的敏锐洞察。
从上述案例也能看出来,魔方的AI团队一直秉持着浓厚的务实精神。相较于追求一些前沿概念,他们更倾向于将精力投入到能够解决具体项目需求、具有高性价比的场景中。
廖诗飏提到,有时某项AI技术看起来可能很强,但是如果将它强行塞到游戏里,反而会起到反效果。
他为我们举了个例子,有的厂商想用机器学习做射击游戏,可能效果还不错,但整体算下来成本高。而用传统的行为树规则来做,也能得到大致的效果,成本却低出一大截。在这种情况下,使用行为树规则反倒是更好的选择。
在笔者看来,这种从实践中不断打磨技术,把技术和需求紧密结合的做法,能让魔方的AI团队在面对市场竞争时,能有更加灵活的应对和充足的底气。
结语
回到最初的问题:AI究竟改变了什么?
尤其是相较于玩家能够直接感知到的AI队友,强化学习对战AI离玩家的距离更远:如果不是本次的深入采访,连我们都不知道,在洛克中对战的NPC,背后其实藏着历经过数百万次战斗的强化学习AI。
但正是在玩家无法直接看到的地方,AI正深入改善玩家的底层体验。最直观的例子就是,在洛克内测期间被不少玩家吐槽的NPC切宠问题,在强化学习对战AI引入之后,已经基本上看不到踪影。
《洛克王国:世界》从一开始,就想要为玩家打造有真实感的精灵大世界。游戏上线后,确实也有不少玩家沉浸其中,他们与精灵的关系早已超越了游戏的界限。只要翻开各种社交平台,就能看到小洛克分享的各种精灵日常。玩家和精灵间的情感链接,早已超越了游戏的范围。

强化学习对战AI的运用,正是构成《洛克王国:世界》真实性和沉浸感的基础之一。玩家可能不知道背后运用了什么技术,但他们能感受到,对战有了博弈感,NPC有了活人感。
而只要玩家与精灵的羁绊在,《洛克王国:世界》的故事就将一直书写下去。
