swift

Get Started

SWIFT安装
快速开始
Web-UI

Instruction

命令行参数
预训练与微调
GRPO
GKD
人类对齐
推理和部署
采样
评测
导出与推送
ray的支持
强化微调
Agent支持
支持的模型和数据集
使用Tuners
常见问题整理

Megatron-SWIFT

快速开始
命令行参数
LoRA训练
多模态模型
Mcore-Bridge
GRPO
GKD
Ascend NPU
自定义Megatron模型

Customization

架构介绍
自定义模型
自定义数据集

Best Practices

GRPO完整实验流程
多模态GRPO完整实验流程
GRPO代码训练
Qwen3最佳实践
Qwen3-VL最佳实践
Qwen3.5 最佳实践
DeepSeek-V4 训练支持
注册多模态模型最佳实践
Embedding训练
Reranker训练
快速训练VL模型
NPU支持
Metax支持
AMD GPU 支持
更多最佳实践

swift

GRPO
View page source

GRPO

Get Started

Get Started
- GRPO

Developer Guide

Developer Guide

Advanced Research

Advanced Research

Previous Next

© Copyright 2022-2025, Alibaba ModelScope.

Built with Sphinx using a theme provided by Read the Docs.