博客 | Linpeng Tang

Agentic RL Cover

2026-04-26

Agentic RL: 自我进化的大模型新范式 (Part I)

探讨智能体模型（Agentic Models），剖析强化学习的必要性、奖励工程的演进，以及强化学习算法的发展历程。