From 1e503a982d51ba5716f3eaf2295d61e1f57e58b6 Mon Sep 17 00:00:00 2001 From: simulikeit <63486284+simulikeit@users.noreply.github.com> Date: Thu, 7 May 2026 00:42:01 +0800 Subject: [PATCH] [assets] correct typo in examples/README_zh.md (#10462) --- examples/README_zh.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/examples/README_zh.md b/examples/README_zh.md index 95f292838..324a52be3 100644 --- a/examples/README_zh.md +++ b/examples/README_zh.md @@ -96,7 +96,7 @@ FORCE_TORCHRUN=1 NNODES=2 NODE_RANK=1 MASTER_ADDR=192.168.0.1 MASTER_PORT=29500 ### 支持弹性和容错的多机指令监督微调 -要启动一个支持弹性节点和容错的多机指令微调,在每个节点上执行以下命令。弹性节点数量范围为 `MIN_NNODES:MAX_NNODES`,每个节点最多允许因为错误重启 `MAX_RESTARTS` 次。`RDZV_ID` 应设置为一个唯一的作业 ID(由参与该作业的所有节点共享)。更多新可以参考官方文档 [torchrun](https://docs.pytorch.org/docs/stable/elastic/run.html)。 +要启动一个支持弹性节点和容错的多机指令微调,在每个节点上执行以下命令。弹性节点数量范围为 `MIN_NNODES:MAX_NNODES`,每个节点最多允许因为错误重启 `MAX_RESTARTS` 次。`RDZV_ID` 应设置为一个唯一的作业 ID(由参与该作业的所有节点共享)。更多细节可以参考官方文档 [torchrun](https://docs.pytorch.org/docs/stable/elastic/run.html)。 ```bash FORCE_TORCHRUN=1 MIN_NNODES=1 MAX_NNODES=3 MAX_RESTARTS=3 RDZV_ID=llamafactory MASTER_ADDR=192.168.0.1 MASTER_PORT=29500 llamafactory-cli train examples/train_full/qwen3_full_sft.yaml