fix #3238

Former-commit-id: 232642a621
2026-01-02 12:10:34 +08:00 · 2024-04-12 14:28:11 +08:00
parent 1ae6f0a5f3
commit c9d3cc181a
2 changed files with 6 additions and 3 deletions
--- a/src/llmtuner/hparams/parser.py
+++ b/src/llmtuner/hparams/parser.py
@@ -277,6 +277,10 @@ def get_infer_args(args: Optional[Dict[str, Any]] = None) -> _INFER_CLS:
    _verify_model_args(model_args, finetuning_args)
    if model_args.export_dir is not None:
        model_args.device_map = {"": "cpu"}
        model_args.compute_dtype = torch.float32
    else:
        model_args.device_map = "auto"
    return model_args, data_args, finetuning_args, generating_args
--- a/src/llmtuner/train/tuner.py
+++ b/src/llmtuner/train/tuner.py
@@ -65,8 +65,7 @@ def export_model(args: Optional[Dict[str, Any]] = None):
    if getattr(model, "quantization_method", None) is None:  # cannot convert dtype of a quantized model
        output_dtype = getattr(model.config, "torch_dtype", torch.float16)
        setattr(model.config, "torch_dtype", output_dtype)
-        for param in model.parameters():
+        model = model.to(output_dtype)
            param.data = param.data.to(output_dtype)
    model.save_pretrained(
        save_directory=model_args.export_dir,