腾讯TiG框架让AI在《王者荣耀》中学会战略性思考的简单介绍

2025-12-20 01:29:01 国际足球 1℃ 0

1、大语言模型通过腾讯提出的ThinkInGamesTiG框架实现王者荣耀游戏操作，其核心在于将强化学习决策转化为语言建模任务，结合监督微调SFT与在线强化学习RL，使模型具备宏观战略推理能力，最终以14B参数模型击败671B参数模型，动作精准度达9091%一TiG框架的核心机制边玩边学的语言建模TiG框架突破传统大语言模型LLM。