分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

2026/04/15

12:29【小红书开源大模型强化学习训练引擎Relax】小红书AI平台团队今日正式开源Relax —一款面向全模态与Agentic场景设计的大模型强化学习训练引擎。

Relax基于Megatron-LM 和SGLang高性能后端构建,将全模态数据支持、服务化容错架构和异步训练流水线三个维度统一解决。在Qwen3-Omni-30B上,Relax 验证了图像、文本、音频和视频四种模态的RL 训练稳定收敛;在16xH800多机下,训练全异步相比Colocate基线端到端提速76%,相比veRL的全异步端到端提速20%。

举报
点击关闭