在11月举办的上海Weplay上,一款糅合了剧情、自由聊天、AI绘图模拟拍照、DBG卡牌战斗、UGC等多种元素的AI Galgame引起了陀螺的注意。在这款名为《奇华幻相》的AI游戏中,玩家不仅可以通过AI聊天与女主展开互动,提升好感、建立深厚的情感链接,获得甜蜜幸福的恋爱陪伴体验。

还可以将女主邀请至不同场景拍照打卡,由AI根据拍摄内容绘制牌面、自主设计卡牌效果,自由构筑一整套牌库,并将其投入到回合制卡牌战斗中。

同时在AI的加持下,《奇华幻相》还能够在主线故事推进中,实时生成合理的过渡性剧情及日常桥段,而且AI还会为玩家和女主设计表白场景和婚礼。
前段时间,陀螺和苍瞳幻造创始人兼《奇华幻相》制作人Claudius进行了一次深度对话。在他看来,《奇华幻相》的重点不是DBG卡牌玩法或UGC功能,而是能否更好地描绘好一个世界,让游戏之中的虚拟角色更加有血有肉、经得起推敲。

据介绍,《奇华幻相》之前,苍瞳幻造还于今年3月上线过一款男性向AI陪伴微信小游戏《告白契约》,在未买量的情况下,该作累计注册用户超5万,节假日、周末日新增400+。此外,他们还计划在未来推出一款女性向的恋爱陪伴小游戏。
对话中,围绕AI角色的创作思路,AI聊天产品如何进一步创新迭代,AI虚拟陪伴的发展现状及应用前景,以及AI+机器人等话题,Claudius进行了诚恳而详尽的分享。
以下为经过整理的对话内容:
Part1:谈《奇华幻相》:
“谁来陪”“如何陪”是AI陪伴的终极问题
陀螺:当初是出于什么想法把那么多元素做到《奇华幻相》中的?
Claudius:最初我们想把AI的各项生成能力融合在一款游戏中,并希望设计出必要且自洽的玩法,使得这种融合并非简单做功能的叠加和接入,而更希望是游戏世界观中有机的一部分。我们认为这和AI + IP是一脉相承的。
对于这款产品,其重点不在于DBG卡牌玩法或者UGC功能,而是能否承载好对一个世界的完整描绘,让角色有根基来源。就好比提到“甘雨”,二次元玩家会想到的不只是一个形象,而是她来自原神,来自提瓦特大陆、璃月,她有身份、工作、习惯,这些内容是因为在这个世界观自洽的逻辑中演化而来的。玩家很明确,这个角色从何而来,这才能给予玩家厚重、真实乃至于上瘾的体验。

陀螺:所以重点是塑造角色?
Claudius:对,我们制作《奇华幻相》的目的就是为了解决角色从何而来的问题。《告白契约》更多是向玩家介绍了部分角色,一定程度上解决了角色是谁的问题,那么接下来我们就需要更大的舞台向玩家展示这些角色的生活、人际关系、行为习惯。
所以,这款产品的重点仍然是对IP的创作和延伸,而引入战斗和UGC系统,是为了加深和丰富玩家的体验,增加记忆点,加强玩家与这个世界的连接。
陀螺:那AI在其中起到了什么作用?
Claudius:除了绘制卡面让玩家DIY卡牌,玩家主要会在AVG部分体验到AI相关玩法,比如通过输入文字和角色AI聊天,设计表白和婚礼——AI会调用我们预设的美术资源来使得这个关键时刻尽可能符合玩家的心意,而非设计师预设的场景。再比如,我们也会将故事中的某些重要情节模块化,它们将是线性故事中的一些关键节点,玩家确实都会经历这个故事,但抵达这个节点的过程将由AI实时生成,以图文的形式展示相关过渡的章节。
所以说,AI是丰富玩家体验的手段,我们希望玩家了解并认可我们所创造的这个小世界。

陀螺:一些人认为AI陪伴和AI+UGC是AI游戏接下来比较大的两个风口,《奇华幻相》正好都踩中了?
Claudius:这两个赛道在所需的技术能力上还蛮重合的,但是因内容的提供方式以及价值的关注点不同,所以分化成了两个赛道。
现在看起来,AI陪伴产品在提供精品的内容与角色,为用户提供长期的陪伴和情绪价值;AI + UGC则更像是一个平台,用户总能在海量内容中找到适合自己的,也可以自己创作内容来取悦自己。但其实两者对AI多模态能力的应用是相似的,区别只在于推给用户的内容,以及推给用户的手段。
AI+UGC平台可能会更依赖平台生态以及推荐算法,而AI陪伴可能会更强调团队IP和运营能力。而最终,这两个赛道的终点在我看来是比较重合的。我们相信,“谁来陪”、“如何陪”会是这两个赛道面临的终极问题,解决好这个问题,才能获得玩家的注意力。
Part2:用AI做卡牌游戏谈《告白契约》
让AI扮演角色,实际操作起来非常难
陀螺:《告白契约》有数十位女主,她们的外观、人设、性格以及对话风格都是怎么用AI生成的?
Claudius:这是一个非常有趣的过程,我们首先收集并整理受二次元欢迎的女性角色的性格标签,对它们进行分组,然后做笛卡尔积来形成不同的标签组。再根据这些标签去寻找相应的角色原型,之后让AI根据这些内容按我们自己设计的模板输出人设,最后再进行人工的调整,大概是这样的流程来完成最终AI ChatBot所需的Prompt。
而对我们来说,困难的部分在于如何让角色更加不同,这非常依赖个人创作经验,需要对角色的人设进行解构和描述,我们也相信是这些解构让AI角色与众不同。

陀螺:《告白契约》的女主有攻略难度之分,为什么做这种设计?
Claudius:我们最终希望借助AI 生产出一些真正能和玩家建立深度亲密关系的角色,为玩家提供丰富的角色交流体验。在这个命题下,角色才是关键,那么其攻略的方式也是基于这个角色的性格设定、爱好、习惯,以及这个角色需要给玩家带来的体验而定,所以我们做出了不同角色有攻略难度区分的设计。
陀螺:怎么区分攻略难度?
Claudius:这也是我们创作前面临的最大挑战之一。设计一定的规则、评分参数,让聊天变成一种可以挑战的关卡本身并不难,但却几乎没什么经验和数据可以指导如何设置Prompt、AI工作流来实现不同难度、不同通关率的设计。
因此在上线这款小游戏之前,我们只能通过自己的经验和测试来主观判断。我们大致认为,设定中喜好比较符合目标用户认知的角色,应该比较好攻略;而反过来性格比较反常识、喜好比较小众的应该就会比较难。总而言之,这类设计主要是从角色设计和玩家的体验出发来考虑的。
陀螺:你们有没有总结一些AI角色的创作思路?
Claudius:在创作二次元角色的时候,很注重二次元性格或特殊癖好的表达。过去可能是通过一些特定的台词去做,比如猫娘角色说话后面要带个“喵”什么的。但是实际上放在AI里,你不能直接告诉AI扮演一个猫娘每句话都带一个喵,这种体验会很奇怪——因为大家都知道,一些口癖或表达是起到调剂、强化性格的作用,你不能让她一直说。
所以,当我们在设计一个病娇猫娘的时候,要考虑病娇来源于什么,是原生家庭的打压,还是童年创伤,亦或其他什么原因导致的。另外,病娇的表现也不止一种,它可以是占有欲,也可能是扭曲的三观、特定执念。这些东西都要去考虑,而且要具体写出来,你得让AI知道,AI才能扮演好。而且你要抽象成行为逻辑传递给AI。这一点实际操作起来非常难。

陀螺:所以创造AI角色这件事本身就很难?
Claudius:我们有个编剧同学总结了一个冰山理论。以前做二次元角色,只需要让玩家看到海面上设计好的内容,海面下支撑角色的那部分虽然很大,但只要编剧自己考虑清楚就够了——他只需要输出海面上最精华的那部分。但现在做AI角色,你需要把下面关于内容创作和角色设计的部分告诉AI。
Part3:谈AI乙女产品
要做出“因你而改变”的AI角色
陀螺:听说你们还有一款乙女向陪伴游戏在研,相较于《告白契约》,它会有哪些不同?
Claudius:会有很大不同。《告白契约》原本是按照关卡闯关的模式进行设计的,它更像一个“海王模拟器”,玩家和每个角色聊天的机会最多只有25句话,我们原本设想的是,玩家需要研究如何在有限的对话内攻克关卡,并找到聊天的技巧,然后去攻克下一个角色,所以实际上《告白契约》也没有提供无限聊天等陪伴所需的功能。
但实际上线后,我们发现最核心的那批用户会始终集中在某几个角色身上进行聊天,即使他们获得了3星满星的成就。这时我们意识到,用户其实更需要自己喜欢的角色陪伴,而不是攻略一个又一个的角色。
同时,我们的用户中超过40%是女性,这是完全超出我们预期的。所以我们才产生了进一步打造一款乙女向的产品,并提供更多符合陪伴场景下的功能玩法。
陀螺:为什么一个男性向游戏会有40%的用户是女性?
Claudius:确实蛮意外的,分析后我们觉得有几个原因:一是聊天这种场景先天更适合女生,男生可能是来测试产品边界的,而女生则更愿意坐下来当个Galgame玩,斟酌怎么跟角色聊天,并期待接下来会发生什么。二是我们的角色没那么多暴露元素,对擦边话题限制也非常严格,这点可能比较容易博得女生好感。所以后来她们要我们出AI男友。

陀螺:做AI男友的思路会跟过去不一样吗?
Claudius:当下AI聊天软件的困境其实在于,亲密关系搭建这个命题下,如何避免“假性亲密关系”的塑造。通常我们会认为,一段亲密关系的达成,需要经历、波折、结果、转变,最终形成人物弧光。当一个人和另一个人,因为相同的经历而发生了正向的转变之后,这样建立起来的亲密关系才更符合直觉,更容易被观众所接受。
所以,与《告白契约》只注重如何使用话术打动角色不同,在新的乙女项目中,我们希望玩家与角色共同经历一件重要的事情,并根据这件事的结果来最终决定AI与玩家陪伴的形态。我们希望给玩家提供的体验不是说为你提供高大帅气、说话甜美的情感大师,而是有那么一个高大帅气的人,为了你变成了一位情感大师。当然,根据玩家的选择,他也可能变成你的服务员,也就是说我们尝试了多结局的设计,希望让玩家感受到,这个角色会因为你的行动而为你改变。
我们相信这样的设计会让这款乙女产品提供与《告白契约》完全不同的体验,也更有可能让玩家与角色建立联系,从而让玩家愿意让某个角色来陪伴他/她。
陀螺:对大部分没有故事背景的AI聊天软件来说,应该都面临假性亲密关系的困境吧?
Claudius:对,很多聊天对象只是看上去很亲密,但未必能得到玩家的认可,你可能更容易把TA们想象成客服——客服对你的态度很好,但你知道你们之间的这种关系并不是因为你们感情好。所以我们需要尽量避免给玩家这种体验,并寻找其他路径。
其实这个问题编剧面临得比较多。不管你台词文笔如何老辣,剧情安排多么巧妙,但始终都无法引起用户的情绪共鸣。根源在于观众首先不认可两个角色之间存在合理的亲密关系。
Part4:谈AI聊天产品
3A超写实AI角色,并非降维打击
陀螺:我看《告白契约》是做的广告变现,效果怎么样?
Claudius:其实广告渗透率还可以,但是付费转化不好。一方面是我们的付费点比较单一,只是让付费和聊天行为挂钩,打断了核心的聊天体验,是不好的设计。
另一方面,广告的收益取决于用户看完广告后,在其他小游戏中的付费行为,而非单纯地看了多少次广告。但是,会花大量时间沉浸在聊天玩法中的用户,画像和小游戏生态内的其他游戏是不太吻合的,这会导致我们的eCPM较低,这也是我们受到的最大教训之一。
另外我们还有一组数据:玩家每次结束聊天行为的数据分布,一般集中在10句、15句或者20句上,接下来的广告他们其实是不想看的。

陀螺:你们买量了吗?
Claudius:暂时没有,6月之后数据上涨很快,7月又几乎是6月的一倍,但核心的ROI问题不能解决,广告不能覆盖我们AI聊天的成本,所以我们没有做进一步推广,而只是继续维护,并研究用户和AI聊天的数据、行为。
陀螺:自然选择已经在做3D版的AI男友/女友了,这对AI陪伴小游戏降维打击吗?
Claudius:我觉得不是。3D以及动画表现肯定是提升体验的重要手段,但我们认为陪伴领域最终最重要的问题是“谁来陪”,这也意味着在陪伴的体验上,永远有差异化的点可以做,这会是一个需要持续投入、持续竞争的领域。
就好像喜欢FGO的用户,在玩到原神、星铁后只会希望FGO中的角色也有机会能够以更先进的姿态出现在用户面前,提供更丰富的体验,而不是因为技术迭代而厌恶、讨厌原本所喜欢的角色,也就是相关玩家常说的,他们希望看到能动的高清的“贞德·Alter”。
所以我认为技术表现起到的不是降维打击的作用,而是督促体验升级的作用。一切的前提还是玩家需要得到对应角色的陪伴,角色本身是核心。
陀螺:这类AI聊天产品未来还能加入哪些交互和玩法?
Claudius:不用说未来,其实现在就有很多值得我们去学习的玩法内容,比如《1001夜》《Pick Me Pick Me》《印格》《诡秘推理》等等,在这个问题上,更值得探讨的是如何快速实现创新并验证玩法。我们在这方面其实还挺有紧迫感的。
陀螺:你觉得AI陪伴游戏的文本配音重要吗?
Claudius:重要。虽然目前我们是使用语音合成相关的API来解决配音问题,但长远来看,我们仍然希望通过真人来完成配音工作。
一方面是真人现在的配音效果仍然强过AI;另一方面,在未来,特定的声音音色、文字风格、绘画风格等具有专属权利的内容,合成和使用的相关法律一定会被完善。现在相对开放自由、没有版权风险的合成环境是暂时的,也是不健康、不利于文化创作和创新的,所以早晚会被限制,我们也需要更早思考并做出计划打算。
当然,并不是说AI合成就会因版权问题而被禁止,而是我们相信,能让合成和原作者都获取收益的方式会成为主流。
陀螺:目前AI配音主要有哪些缺点?
Claudius:断句、抑扬顿挫、情绪等方面都有问题,这几点跟真人还有差距,有点棒读的感觉。特别是生气、厌恶或是变态这些极端情绪市面上的AI产品都不太支持。而且因为AI经常生成长难句,中间的情绪变化处理起来也比较复杂。我们现在的想法是,也许可以用工程化的方式,把一个句子拆成几部分,不同部分采用不同的情绪输出。

陀螺:很多玩家觉得现在二次元AI图的风格太千篇一律了,你们是否有尝试用AI调得更有辨识度一些?
Claudius:这是我们希望解决的问题,但目前只是将我们相关世界观的作品保持同样的风格。真正要输出有辨识度的绘画风格,在行业内也只有比较顶尖的主美才做得到,其实我认为AI是可以输出独特有辨识度的美术风格的,但我们看到的大部分AI 图没有,原因在于AI使用者的审美决定了最后的形态。
所以对这件事我们的认知是:如果当下我们的角色表现有限,那需要提高的是我们自身的审美和设计能力,而非归咎于模型能力不足。
Part5:谈赛道发展:
年复合增长率25%,一个超千亿规模的市场
陀螺:当初团队为什么会选择切入AI虚拟陪伴赛道?
Claudius:更准确地说是AI + IP赛道,我们想要去做世界观,去做故事,去做角色。总的来看,有这么几点原因:
一是在前公司从事过相关工作,当时是2023年,还在用ChatGpt-4调试数字人,上线到真实的场景中为用户提供陪聊服务,看到了用户对这类应用的热情,很多玩家是想和游戏中的角色谈恋爱的。
二是AI陪伴赛道上,似乎主流声音更关注“用什么能力”来陪伴,而不是“谁来陪”的问题,而后者我们认为对用户更有价值,我们也想在这个方向上提供一些不同的声音。
三是AI虚拟角色陪伴确确实实可以解决当下白领、青少年在高压社会环境下,需要安全的哭诉、交流对象这一问题,这让我们觉得在做的这件事特别有意义。
陀螺:为什么更关注“谁来陪”的问题?
Claudius:很多陪伴产品展示了各种各样的功能:像EVE可以为用户买奶茶,还是3D形象;一些AI游戏伙伴可以捕捉玩家的面部表情并做出实时反馈。
而基于我们现在的能力范围,我们觉得往内容层面做更有机会。从CharacterAI的数据来看,玩家与不同AI角色的聊天时长分布是不均匀的,集中在某些智能体上,有非常明显的马太效应。这说明不同智能体输出的信息,所代表的文化符号,及其提供的体验是截然不同的。
陀螺:除了恋爱需求,AI陪伴是否还可以应用在陪护老人、儿童等领域?
Claudius:这是个很好的话题,我们甚至收到过来自教育行业的订单和相关探讨。恋爱是我们最初想到的最适合的场景,这也是一个不害怕幻觉的场景,毕竟恋爱本身就有幻觉的成分。但如果医疗行业出现了AI幻觉则会造成非常大的危害。
而在老人陪护、儿童等领域,别说现在的大语言模型了,早在2017年左右,智能语音助手如Alexa、Siri,就已经在处理和解决这些领域的实际问题了,特别是车载场景、残障人士的上网场景等。而现在基于大语言模型的AI虚拟陪伴只会从更多的维度以及更丰富的能力来解决这些问题,而且能提供一对一的体验。
比如儿童语言学习场景,AI可以通过评分和反复解释的方式来帮助儿童理解单词之间的细微差别。通常这会非常消耗教师的耐心,也很可能没有足够的教育资源为儿童提供一对一的教学,而AI可以很好地解决这个问题——它有无限的耐心并且千人千面地提供服务。听说日本也已经在这么做了,有一款AI游戏化的英语教学产品。
陀螺:你怎么看待AI虚拟陪伴的的市场前景?它的用户规模和产值能有多大?
Claudius:这会是一个发展十分迅速,潜力十分广阔的场景,根据我们目前了解到的资料,国内AI虚拟陪伴预计在2028年达到约600亿元的市场,而全球应该是一个超千亿的市场,从2024年开始,CARG(年复合增长率)可能达到25.6%左右——这包括了搭载AI智能体的周边产品,如智能毛绒玩具、情感陪伴机器人等市场的预估数据。

陀螺:你们未来有个计划是打造多模态IP数字人,怎么定义这个概念?
Claudius:几乎就是字面意思,目前我们的AI智能体陪伴角色的手段依赖于文字输入交互的聊天,之后会是基于AI绘画的拍照,接下来让角色唱歌、识别图片或视频来给出交互反馈。现在也有民间爱好者可以让AI通过手机摄像头来和用户玩躲猫猫的游戏了,这些也都是丰富玩家与AI角色体验的方法和能力,是未来我们要打造好IP、角色所需要涉足的能力。
一句话总结这个概念:识别需要是多模态的,输出也需要是多模态的,最终虚拟数字人也会是这样的形态。
Part6:谈未来:
AI或先于硬件来到技术临界点
陀螺:从玩家反馈来看,用户对AI虚拟陪伴的接受度高不高?
Claudius:这个问题在实际情况会变成玩家对某个角色提供的陪伴接不接受。接受度较高的,通常确实是比较温柔有趣的角色;接受度较低的,玩家形容和她在一起感觉像是随时在经历面试一样。所以接受度高不高,最后还是根据角色的设计和表现来决定,而非单纯的这类功能是否可行,玩家是否接受。
陀螺:但有人说现在AI虚拟陪伴的“人味”不足,还不够真实,怎么解决?
Claudius:我认为目前出现这类问题的根本原因在于塑造角色的能力不足,而非模型能力。
目前的大模型能力已经支持比较复杂的角色行为和情感表达,关键是制作者本身能否对角色的性格、行为、标签进行解构,转化为可以通过Prompt表达的行为逻辑。没有“人味”的核心,是制作者本身对“人味”的理解有限,而非模型能力的边界——大部分时候我们做的应用、场景也压根不会触碰到大模型的能力边界。
所以解决这个问题,需要兼具理工逻辑思维和人性行为逻辑认知的编剧,来设计处理智能体,加强对文化创作者的重视,借助他们的创作经验可以帮助在大模型没有大规模迭代和更新的情况下来解决所谓的没有“人味”的问题。

陀螺:AI陪伴能多大程度地代替真人?
Claudius:这同样也是颗粒度和维度的问题。目前在某些细分领域话题上,AI 陪伴的效果远比真人要强,这并非是因为其提供的交流能力远超过真人,而是可能存在用户无法与身边人进行沟通的话题,比如我们的用户会和一个喜欢历史的角色探讨一种古代的冷门乐器。
在这一点上,AI 陪伴感觉像是一个反馈更及时,话题度更包容的树洞,而且用户永远不用担心看到他们内心问题的聊天对象会感到尴尬,或是对他们产生成见。这一点上AI陪伴具有安全、隐秘、什么话题都能聊的特点,用户不用担心AI把自己当傻子,也不会有各种各样的顾虑。从这个角度出发的话,AI 陪伴已经可以替代部分真人陪伴了。
陀螺:AI虚拟陪伴什么时候能通过“图灵测试”呢?
Claudius:我本身对技术底层并不十分了解,所以完全是一个直觉性的判断。斗胆估计一个,我感觉会在5年左右内通过“图灵测试”,依赖的还是大模型底层技术的突破,这种突破可能来自于类似DeepSeek在算法、训练方式等架构和工程上的突破,而非算力层面的突破。

陀螺:你认为AI虚拟陪伴未来会怎么迭代演化?发展到什么程度才能跟硬件结合?
Claudius:这一块确实还想不到什么超出大家耳熟能详的科幻电影所表达的形态和方式了,应该会往具身智能的方向发展演化,但发展到什么程度,我感觉得分开来看。
像AI虚拟陪伴、保姆、生育机器人(听说明年就有生育机器人了,感觉可以期待看看)等迫切场景的瓶颈,因为涉及到现实中的各种安全问题,所以哪怕很微小的业务场景,也需要经过长时间细致严谨的安全验证。所以这类机器人,至少身体硬件方面应该还有蛮长时间,没准要10年以后。
陀螺:所以AI软件会先于AI硬件来到一个临界点?
Claudius:对。这是物理层面决定的。
陀螺:你觉得什么时候能达到电影《Her》或《银翼杀手2049》那种程度?
Claudius:构成一个机器人灵魂的部分,应该是基于现在的大语言模型发展而来,这一部分因为迭代更加迅速便捷,调整的代价比实体更小,所以可能在未来3到5年就会有意想不到的突破——也就是我所认为的突破图灵测试的那一天。所以综合来看,可能需要超过10年的等待,但构成仿生人灵魂的部分可能会在一个相对较短的时间内完成突破。