全球AI产业正经历深刻的技术范式转变,行业不仅关注基于通用模型的应用搭建,也愈发关注如何构建真正符合产业需求的模型能力体系,其中,“后训练”技术(Post-Training)至关重要。2025云栖大会《大模型后训练:打造企业专属智能引擎》论坛汇聚行业顶尖后训练专家,聚焦Data、Evaluation、Reward、Scaling、Infra五大关键要素,深入探讨后训练在真实场景中的关键技术瓶颈、方法论演进与行业实践范式。
会上,网易伏羲语言智能组负责人张荣升带来题为 《网易伏羲在游戏智能交互场景的应用实践》的演讲,系统展现了大模型后训练技术如何打破传统NPC(Non-Player Character,非玩家角色)的交互局限,为游戏世界注入更具生命力的智能交互体验。
1、游戏智能NPC:从“提线木偶”到“有灵魂的居民”
NPC作为游戏交互的关键载体,不仅承担推动剧情发展、丰富游戏世界的功能,还能提升玩家的游戏沉浸感。传统NPC依赖策划预设的固定脚本运行,行为逻辑单一、交互深度有限,虽然开发成本低,但游戏体验易陷入同质化;而智能NPC能依据游戏环境的动态变化自主决策,让玩家每一次交互都充满新鲜感,其主要开发成本集中于模型推理环节。张荣升认为,传统NPC是游戏里的提线木偶,智能NPC则是游戏世界里有灵魂的居民。
智能NPC背后,是一套以AI为核心驱动的Agent技术架构。智能NPC被定义为具备感知、认知、决策与记忆能力的Agent,通过跟游戏环境不断交互,来影响游戏世界。这些能力的打造离不开AI后训练。例如,结合不同游戏的专属设定进行后训练,确保NPC行为与游戏场景高度契合;针对高表现力NPC的个性化需求,团队为定制NPC做模型的后训练;面对海量玩家带来的服务部署压力,团队综合考量全链路部署成本等因素,通过“大模型蒸馏小模型+后训练”的策略满足服务性能。
2、《新倩女幽魂》端游:会“讨价还价”的家臣系统
在《新倩女幽魂》端游的家臣系统中,玩家可招募家园NPC作为家臣,NPC则会综合参考自身基准薪资、与玩家的关系亲疏及自身出身背景等信息,最终判断是否接受玩家报价。例如,NPC基准薪资为1000文,若玩家出价900文会被明确拒绝,而出价950文则会经过思考后应允。招募完成后,玩家与NPC的交互进一步深化:既可以开展日常对话,也能向NPC索要游戏道具,但NPC并非 “有求必应”,其回应会根据玩家态度、双方实时关系等游戏状态动态调整。这种“讨价还价”背后,是针对游戏场景的AI预训练与后训练在精准调控。
该系统涵盖意图识别、任务分发、决策生成以及对话生成等核心能力,围绕游戏智能NPC场景,在基座大模型上做后训练以满足智能体交互的需求。以意图识别为例,训练数据覆盖《新倩女幽魂》中索要物品、交易协商等行为,团队在数据构建中既注重不同场景的均衡性,又根据模型Bad Case持续迭代优化,同时通过 “模型标注+人工标注” 的方式确保数据的准确性。
此外,团队在决策环节创新性地引入了CoT(思维链),不仅让NPC的决策过程更易被玩家理解,还能为对话场景提供支撑。比如,当玩家试图用“双倍薪资”策反其他玩家的NPC时,NPC会思考决策,并通过对话模型和心理状态描写呈现给玩家,让玩家清晰感知到NPC的“权衡”与“妥协”。为避免小模型对话与决策 “言行不一”,团队采用对比训练:相同上下文给定不同决策结果,由能力更强的基座模型生成对应回复,再通过对比训练强化小模型的言行一致性。
3、《永劫无间》手游:会聊又能打的AI队友
如果说家臣系统侧重“深度交互”,《永劫无间》手游的AI队友则聚焦“实时陪伴”。在《永劫无间》手游的 AI 队友系统中,玩家不仅可通过语音指令让AI队友执行集火敌人、捡装备等操作,还能获得即时情绪反馈。这种带有情感温度的交互,大幅提升了玩家的游戏陪伴感。其背后是各技术模块围绕《永劫无间》手游进行的场景化后训练:
- 语音识别。团队需解决多机型硬件适配(如iPhone、华为、小米等)、复杂环境噪音过滤,以及游戏专业话术理解(如跑毒、吃花)等问题。为此,团队建立了覆盖游戏术语与指令的标准测试集,在基座模型上持续开展游戏话术训练,并通过数据闭环对SFT(监督微调)数据进行迭代优化;
- 指令理解。将玩家语音输入解析为战斗模块所需的核心要素(如动作类型、目标队友、目标物品),后训练重点强化了游戏领域指令与多轮指令的理解能力;
- 人设打造。团队采用两阶段后训练策略:第一阶段基于伏羲沉淀数据打造文娱知识增强模型,提升其文娱知识储备;第二阶段在SFT环节引入多源对话数据(真人创作数据、文娱领域语料、人机交互数据等),增强角色扮演能力;
- 记忆感知。团队专门针对记忆抽取进行后训练,让AI队友抓取玩家感知更强的记忆点,为玩家带来意外惊喜;
- 语音合成。通过基座模型持续训练实现音色与情感的精准把控,并借助网易有灵众包平台形成 “数据标注-模型迭代” 的闭环,让交互更自然。
最后,张荣升特别致谢通义开源生态,其提供的多尺寸、多模态的模型选型,为智能NPC的技术研发提供了重要基础。
在AI与游戏产业深度融合的趋势下,网易伏羲以智能NPC为突破口,推动游戏交互从“功能实现”向“情感联结”升级,为玩家构建更鲜活、更沉浸的虚拟世界,助力游戏产业打开“有灵魂的交互”新篇章。