ROCm (共1篇)

ROCm支持Miles：AMD GPU上的大规模RL后训练

强化学习（RL）已成为现代基础模型开发的核心阶段。通过ROCm对Miles的支持，AMD GPU用户可以在MI300/350级集群上运行现代RL管道，包括分布式rollout和GRPO训练。