
2026-06-06
物理世界的数据飞轮:分层视觉 AI 系统设计与优化
在物理 AI 实际落地中,全天候视频流处理面临端侧算力瓶颈与长程时序语义识别的挑战。我们设计并实现了一套分层视觉感知与推理级联系统,底层初筛定位与顶层 VLM 按需核验协同工作,在显著降低端侧算力开销的同时,实现高安全召回与高精度识别。
阅读全文
2026-05-16
物理 AI 的建模:从 VLA 到 World Model
与 LLM 发展类似的浪潮正在物理 AI 中发生:VLA 让机器人第一次真正接上了互联网语义;World Model 则让机器人开始真正理解世界,并建模动作如何改变物理世界。
阅读全文
2026-05-05
Agentic RL (Part III):Verl、SkyRL 架构分析到 Retool-RL 案例实践
从系统与算法协同的视角,探讨如何构建高效、稳定的 Agentic RL 训练闭环,分析 Verl 的 HybridFlow 架构与 SkyRL 的模块化设计,并介绍 Retool-RL 的实践经验。
阅读全文
2026-05-02
从语料加工到经验飞轮:大模型数据工程的下一站
《大模型数据 原理技术与实战》新书速递,以及探讨大模型数据工程的主战场,如何从处理静态语料库,走向构建能让智能体通过交互学习的经验飞轮和闭环数据流。
阅读全文
2026-04-28
Agentic RL (Part II):面向真实世界任务的 RL 系统
探讨如何通过环境工程、验证器和数据飞轮,将金融预测、科学发现等真实世界开放任务改造成可训练的强化学习环境。
阅读全文
2026-04-26
Agentic RL (Part I): 自我进化的大模型新范式
探讨智能体模型(Agentic Models),剖析强化学习的必要性、奖励工程的演进,以及强化学习算法的发展历程。
阅读全文