首页 > 新闻 > 资讯

分享到微信

打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。

小红书开源大模型强化学习训练引擎Relax

第一财经 2026-04-15 12:29:59

责编:殷晴妍

小红书开源大模型强化学习训练引擎Relax

小红书AI平台团队今日正式开源Relax —一款面向全模态与 Agentic 场景设计的大模型强化学习训练引擎。

Relax 基于 Megatron-LM 和 SGLang 高性能后端构建,将全模态数据支持、服务化容错架构和异步训练流水线三个维度统一解决。在Qwen3-Omni-30B上,Relax 验证了图像、文本、音频和视频四种模态的RL 训练稳定收敛;在16xH800 多机下,训练全异步相比Colocate基线端到端提速76%,相比veRL的全异步端到端提速20%。

举报
第一财经广告合作,请点击这里
此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。
如需获得授权请联系第一财经版权部:banquan@yicai.com
一财最热
点击关闭