腾讯魔方再添千万DAU大作,专访AI负责人:做有“人味”的AI
创始人
2026-05-15 20:57:49
0

昨天(513日),腾讯游戏发布了2025年第一季度财报。

不出意外,《洛克王国:世界》登上了这次财报。作为今年目前为止最大的爆款之一,《洛克王国:世界》成绩确实亮眼: 上线9天用户量突破3000万,上线一个月DAU均值达到1300万,在唤醒老玩家情怀之外,还带来了大量的泛用户和年轻玩家。按目前的发展趋势来看,洛克很有机会成为腾讯游戏新的长青产品。

作为继火影、暗区之后,魔方第三款DAU破千万的产品,《洛克王国:世界》的成功,标志着魔方在动作、射击和大世界RPG三条赛道,都有了自己的扛鼎之作,也证明了魔方持续产出爆款产品的能力。

对于《洛克王国:世界》的爆火,我们之前已有文章分析()。无论通过精灵大世界的打造,突破传统捉宠品类的限制,还是商业化上的克制、对IP的深度理解,都是《洛克王国:世界》持续出圈的原因之一。

但在这些之外,还有一个很少为人知晓,但影响无数洛克玩家的存在:AI。在本次的腾讯财报中,就提到《洛克王国:世界》中,运用了 强化学习AI驱动NPC对战

过去两年,AI几乎成了游戏行业最炙手可热的关键词。但在技术热潮之外,真正值得追问的问题是:AI究竟改变了什么?这些技术红利,有多少是真正改善玩家体验的

为此,我们专访了腾讯魔方工作室AI负责人廖诗飏,深入拆解这款游戏背后的AI实践。在这次交流中,他详细拆解了魔方团队如何利用强化学习(Reinforcement Learning)等前沿技术,在《洛克王国:世界》中,面对 “300+选6”这种超大规模角色组合带来的计算爆炸挑战时,如何通过一套务实的工程化逻辑,构建出一个兼顾竞技深度与人情味的游戏生态。

对战AI:让NPC打得更像真人

作为魔方工作室运用AI技术最全面的产品之一,《洛克王国:世界》中最常见的AI 运用,藏在跟玩家对战的NPC当中:NPC的战斗决策,全部由强化学习AI驱动。

在内测期间,曾有玩家反映《洛克王国:世界》中的PVE对战不够智能,NPC喜欢根据属性克制、玩家阵容等因素来行动,甚至会出现NPC为了打属性克制,来回切宠物的现象。这是因为在传统行为树模式下,NPC的行为模式是写死的,一方面行为模式容易被玩家摸透,另一方面NPC也会出现机械的读指令现象,影响玩家对战时的趣味性。

强化学习AI的引入,其目的便是让NPC在战斗过程中更像真人,给到玩家丰富多样的对战体验。身为一款精灵大世界游戏,《洛克王国:世界》一直追求让玩家体验到真实生动的精灵世界,而让NPC更有活人感,自然对实现这一目标更有帮助。

从技术视角看,洛克所采用的强化学习对战AI并不算横空出世的新物种,而是早已被反复验证的成熟路径。

魔方工作室更是从《火影忍者》开始,就在这一方向上积累了数年经验。

但首要的问题是,当这套技术进入具体产品时,它究竟该怎么去优化玩家的体验。

在纯粹的强化学习逻辑下,最优策略往往指向绝对的理性,AI为了奖励最大化,会选择风险最低、收益最高的行为路径。廖诗飏举了个格斗游戏的例子:在街霸中,有些高手玩家会一直站着不动等待对手出招,再抓住破绽一击制胜。

这种决策在算法层面是无可挑剔的“正确答案”,但在实际游玩体验中却令玩家难以接受,因为它不仅显得不够真实,而且会迅速消耗掉玩家的耐心 。

廖诗飏直言,这正是早期AI常见的问题: 很强,但不像人。

因此,《洛克王国:世界》有意识地限制了AI的“正确性”,将对战AI的目标重新锚定在提供多样且合理的博弈体验上。

敏锐的玩家会发现,在《洛克王国:世界》中,AI并不会读取玩家的精灵信息,也不会基于固定规则进行克制判断,而是依赖训练过程中积累的统计经验来做决策。

换句话说,AI很像一个 打过大量对局、老道成熟的“玩家”,凭借丰富经验作战。

这种变化带来的影响是十分微妙的。在对战过程中AI不再总是做出最优选择。在拥有优势时,它可能选择直接攻击,也可能会继续叠buff,以更加保守的策略巩固优势;而在某些情况下,它甚至会判断失误。

这些看似不完美的行为,反而构成了更接近于真实玩家的对战体验。

其次,AI在游戏中落地还面临另一个问题:如何保证对局的多样化及不可预知性。

为此,魔方在训练中引入了 多模型对抗机制,让不同的AI挑选精灵组队对战,在博弈中互相对打拆解,从而确保策略池的深度与多样化。

同时,团队还通过“人类知识蒸馏”的方式,将策划的实战经验灌输给AI,让算法在保持泛化能力的同时,其行为逻辑始终贴合玩家所熟悉的策略常识。

类似的取舍也体现在阵容组合的处理上。《洛克王国:世界》的精灵体系本身就具备极高的复杂度,约300只精灵中选择6只组成队伍,双方共有12只精灵出战,每个精灵4个不同的技能,其中还有属性克制、buff、天气等要素,都会影响阵容配置。

如果完全依赖穷举训练,不仅成本不可控,也难以在项目周期内落地。

洛克的做法是“抓大放小”。一方面,团队会优先针对玩家常用阵容和策划设计阵容进行重点训练,保证主流对局的体验质量;另一方面,则依赖强化学习的泛化能力覆盖长尾情况。

这种策略服务于一个核心目标:让玩家在绝大多数时间里,都能遇到合理但不重复的对手。最终,这些能力并不会以“AI系统”的形式被玩家明确感知。

相反,它润物细无声地融入到一条更平滑的体验曲线中。从新手区域到高难挑战,不同场景下的NPC表现出明显的策略差异,而这种差异既来自AI本身,也来自策划对节奏的控制。

从玩家的反馈来看,这套AI对战系统的引入,确实解决了不少问题。就比如测试阶段常见的NPC对战时频繁切宠的问题,在正式上线后已经很少能看到玩家吐槽,说明这个问题至少在玩家侧,已经得到了不错的解决。

团队的经验表明,一个精心训练的AI不但要能精准应对玩家行为,还能通过多样化策略维持游戏节奏的自然感,让玩家感受到 “有人在对面思考”的真实体验。

这样一套聪明的AI对战系统,让对手显得更有人情味,让生态显得更加平衡,让整个游戏世界在算法的驱动下,呈现出一种自然且富有生命力的博弈美感。

魔方AI:从产品需求出发做AI

据廖诗飏介绍,在魔方内部,AI技术应用主要分为四大核心方向: 强化学习对战AI、利用大语言模型做的AI NPC、生成式AI、以及传统AI系统。

这四个方向互为支撑,使得AI不仅能解决单一技术问题,更能在产品节奏、玩法设计和运营策略上发挥价值。

这种体系化的能力,让魔方AI团队在面对不同项目时拥有 高度的灵活性和适应性:无论是策略偏向明显的回合制对战,还是对即时反应要求极高的动作竞技,亦或是自由度极高的开放世界,《火影忍者》《暗区突围》等项目都能得到定制化的AI解决方案。

在这当中, 强化学习是团队最成熟、最具竞争力的方向。这跟魔方AI团队的起源有关。魔方AI团队成立了五年,最开始做的就是《火影忍者》的强化学习技术。由于人力有限,他们只能集中去做这一件事,直到有了成功案例后,才逐渐拓展到人机交互、大模型等领域。

魔方早期在《火影忍者》中的AI训练

也因此,魔方的AI团队,很多时候会考虑,如何用有限的人力去完成具体的需求。这也是魔方AI团队跟主流的AI大模型团队之间的差别。

廖诗飏就曾跟我们强调, 希望技术能服务玩家体验,而非单纯追求技术指标。

如果说大模型团队的工作模式,是先打造好强力的工具,再给工具找到实际落地场景,那魔方的AI团队则是先找到靶子,再思考如何将箭准确射到靶子上。

一个具体的例子是天气系统。

洛克的对战中有天气机制,可以通过精灵释放,为双方添加buff,但这个机制并没有设置强制的新手教学环节——而是让AI在战斗中主动释放天气。玩家在这个过程中能够很明显地感受到天气技能的存在,继而主动去了解这个机制,并在后续的对战中学会运用。

技能:冬至,召唤雪天

随着魔方在强化学习方向上不断迭代,在《洛克王国:世界》的开发流程中,AI也介入了内容设计与平衡性验证的环节。这同样诞生于项目的实际需求。

在传统开发流程中,精灵强度、技能设计以及阵容平衡,主要依赖策划经验与内部测试。这也意味着,很多不平衡的阵容、精灵,往往是在上线后才被逐渐暴露出来的。

而魔方尝试改变这一点的方式,是 让强化学习提前介入测试阶段。

在实际流程中,AI会在大量模拟对局中进行互相博弈,通过数以百万计的战斗记录,统计不同精灵、技能与阵容的胜率表现。这些结果不会直接替代策划决策,但会作为一个额外视角为策划提供参考,并作为设计方案的重要补充。

游戏内存在多种技能配置

这让传统意义上的上线后迭代,开始前移到上线前验证。

不过,这种能力终究不能代替人的判断。廖诗飏在采访中强调,AI的分析本质上仍然是统计结果,它无法理解设计意图。在定调策略走向和判定玩家体感的关键环节,最后的决策始终握在人手中。

这一切背后,是团队对机器学习技术的深耕与对玩家体验的敏锐洞察。

从上述案例也能看出来,魔方的AI团队一直秉持着浓厚的务实精神。相较于追求一些前沿概念,他们更倾向于将精力投入到能够解决具体项目需求、具有高性价比的场景中。

廖诗飏提到,有时某项AI技术看起来可能很强,但是如果将它强行塞到游戏里,反而会起到反效果。

他为我们举了个例子,有的厂商想用机器学习做射击游戏,可能效果还不错,但整体算下来成本高。而用传统的行为树规则来做,也能得到大致的效果,成本却低出一大截。在这种情况下,使用行为树规则反倒是更好的选择。

在笔者看来,这种从实践中不断打磨技术,把技术和需求紧密结合的做法,能让魔方的AI团队在面对市场竞争时,能有更加灵活的应对和充足的底气。

结语

回到最初的问题:AI究竟改变了什么?

尤其是相较于玩家能够直接感知到的AI队友,强化学习对战AI离玩家的距离更远:如果不是本次的深入采访,连我们都不知道,在洛克中对战的NPC,背后其实藏着历经过数百万次战斗的强化学习AI。

但正是在玩家无法直接看到的地方,AI正深入改善玩家的底层体验。最直观的例子就是,在洛克内测期间被不少玩家吐槽的NPC切宠问题,在强化学习对战AI引入之后,已经基本上看不到踪影。

《洛克王国:世界》从一开始,就想要为玩家打造有真实感的精灵大世界。游戏上线后,确实也有不少玩家沉浸其中,他们与精灵的关系早已超越了游戏的界限。只要翻开各种社交平台,就能看到小洛克分享的各种精灵日常。玩家和精灵间的情感链接,早已超越了游戏的范围。

强化学习对战AI的运用,正是构成《洛克王国:世界》真实性和沉浸感的基础之一。玩家可能不知道背后运用了什么技术,但他们能感受到,对战有了博弈感,NPC有了活人感。

而只要玩家与精灵的羁绊在,《洛克王国:世界》的故事就将一直书写下去。

相关内容

热门资讯

《飞飞:无限宇宙》公测筹备进行... 自《飞飞:无限宇宙》6月26日公测消息公布以来,官方收到了无数新老玩家的热切关注与真挚建言,每一份期...
刚刚,这款游戏一小时突破百万销... 昨天 (5月14日),《Subnautica 2:异星水域》正式开启抢先体验。解锁一小时后,游戏的销...
三角洲行动手游国际服获取教程,... 《三角洲行动》国际服(Delta Force)是腾讯打造的跨平台战术射击手游,于2024年11月正式...
腾讯魔方再添千万DAU大作,专... 昨天(5月13日),腾讯游戏发布了2025年第一季度财报。 不出意外,《洛克王国:世界》登上了这次财...
泰国发现东南亚迄今最大恐龙 究...   泰国发现东南亚迄今最大恐龙  【泰国发现东南亚迄今最大恐龙】2016年,泰国东北部猜也蓬府的一位...
七彩虹iGame M16 Or... 七彩虹旗下高端电竞品牌 iGame 于5月15日正式开售,首发iGame M16 Origo 202...
原创 坐... 如果要给IP改编手游排一个难度榜,我感觉《怪物猎人》大概率会名列前茅。不是因为IP还不够大,恰恰相反...
原创 团... 大家好我是指尖,5月13日最新的营地数据更新,团战胜率最高的十个英雄你能猜到是谁吗?本文就来跟大家盘...
比算力先爆炸的,是米哈游AI的... 最近,米哈游《崩坏:星穹铁道》的“帕姆帮帮”(测试版)AI又怒刷了一波存在感。 据官方发布的“帕姆帮...
杨威一家六口挤香港40多平出租...   杨威一家六口挤香港40多平出租屋  【杨威一家六口挤香港40多平出租屋】5月14日,昔日的“体操...
歧路旅人大陆的霸者:黑咒之塔地... 《歧路旅人大陆的霸者》 内容正式开启,G哥进游戏之后都没仔细看,随便抽了几下卡就奔着 了;简单和朋友...
谁会成为未来的乐高满赠品套装?... 乐高 Ideas 又开始整新活了。 这次的作品征集主题叫“户外冒险”,评审团队将从玩家投稿作品中,选...
原创 L... 英雄联盟LPL第二赛段的比赛,于4月4日正式拉开序幕。基于2026年第一赛段的排名,14支队伍将划分...
《极限竞速:地平线6》获IGN... IT之家 5 月 14 日消息,开发商 Playground Games 旗下《极限竞速:地平线 6...
男子造谣张家界玻璃桥坍塌被抓 ...   那是一条让无数人打开短视频平台后心里猛揪一下的画面——桥头断裂,人群四散,背景中伴随着惊恐的呼喊...
Faker对位单杀Scout,... 大家好,S16赛季的比赛已经正式开始了,相信绝大多数的玩家都关注了最近一段时间的对抗,Lck赛区的比...
把机甲都搬进来的《地平线6》,... 也可以开着五菱宏光和新干线飙车。 你或许已经刷到过和《地平线6》相关的这段视频:一辆跑车在赛道上疾驰...
3000万红包发到炸服,逆水寒... 《逆水寒》上线快八年的时间,游戏内神豪大佬不计其数,每个拿出来都有一段传奇经历可以说道。尤其是去年上...
活动爆料丨天龙九周年惊喜不停!... 昨日九周年盛典正式拉开大幕,福利铺天盖地,但老赵要告诉各位——真正的惊喜才刚刚开始! 名动江湖活动 ...
魔方凑齐了三张王牌 在《洛克王国:世界》首月DAU均值破1300万之后。 《洛克王国:世界》终于公布自己的DAU了。 5...