fix #809

Former-commit-id: e2bf7c3bad
2026-06-18 13:18:57 +08:00 · 2023-09-07 19:04:32 +08:00
parent f74b980650
commit e6fa0229f4
1 changed files with 1 additions and 1 deletions
--- a/src/llmtuner/tuner/dpo/trainer.py
+++ b/src/llmtuner/tuner/dpo/trainer.py
@@ -42,7 +42,7 @@ class DPOPeftTrainer(PeftModelMixin, DPOTrainer):

        if ref_model is not None:
            if self.is_deepspeed_enabled:
-                self.ref_model = self.accelerator._prepare_deepspeed(self.ref_model)
+                self.ref_model, = self.accelerator._prepare_deepspeed(self.ref_model)
                self.ref_model.eval()
            else:
                self.ref_model = self.accelerator.prepare_model(self.ref_model, evaluation_mode=True)