博客 | Linpeng Tang

2026-06-06

物理世界的数据飞轮：分层视觉 AI 系统设计与优化

在物理 AI 实际落地中，全天候视频流处理面临端侧算力瓶颈与长程时序语义识别的挑战。我们设计并实现了一套分层视觉感知与推理级联系统，底层初筛定位与顶层 VLM 按需核验协同工作，在显著降低端侧算力开销的同时，实现高安全召回与高精度识别。

2026-05-16

与 LLM 发展类似的浪潮正在物理 AI 中发生：VLA 让机器人第一次真正接上了互联网语义；World Model 则让机器人开始真正理解世界，并建模动作如何改变物理世界。

2026-05-05

从系统与算法协同的视角，探讨如何构建高效、稳定的 Agentic RL 训练闭环，分析 Verl 的 HybridFlow 架构与 SkyRL 的模块化设计，并介绍 Retool-RL 的实践经验。

2026-05-02

《大模型数据原理技术与实战》新书速递，以及探讨大模型数据工程的主战场，如何从处理静态语料库，走向构建能让智能体通过交互学习的经验飞轮和闭环数据流。

2026-04-28

探讨如何通过环境工程、验证器和数据飞轮，将金融预测、科学发现等真实世界开放任务改造成可训练的强化学习环境。

2026-04-26

探讨智能体模型（Agentic Models），剖析强化学习的必要性、奖励工程的演进，以及强化学习算法的发展历程。