fix export format

Former-commit-id: 7c82bd396b9e6ff395850ad544d95cbf1b7557cd
2026-01-12 00:50:36 +08:00 · 2023-12-28 18:40:46 +08:00
parent 53d7c5109f
commit af3f5b6e16
3 changed files with 29 additions and 1 deletions
--- a/src/llmtuner/data/template.py
+++ b/src/llmtuner/data/template.py
@@ -758,6 +758,26 @@ register_template(
 )


+register_template(
+    name="yuan",
+    prefix=[
+        "{{system}}"
+    ],
+    prompt=[
+        "{{query}}",
+        {"token": "<sep>"}
+    ],
+    system="",
+    sep=[
+        "\n"
+    ],
+    stop_words=[
+        "<eod>"
+    ],
+    replace_eos=True
+)
+
+
 register_template(
    name="zephyr",
    prefix=[
--- a/src/llmtuner/hparams/model_args.py
+++ b/src/llmtuner/hparams/model_args.py
@@ -102,6 +102,10 @@ class ModelArguments:
        default=1024,
        metadata={"help": "The maximum length of the model inputs used for quantization."}
    )
+    export_lecacy_format: Optional[bool] = field(
+        default=False,
+        metadata={"help": "Whether or not to save the `.bin` files instead of `.safetensors`."}
+    )

    def __post_init__(self):
        self.compute_dtype = None
--- a/src/llmtuner/train/tuner.py
+++ b/src/llmtuner/train/tuner.py
@@ -47,7 +47,11 @@ def export_model(args: Optional[Dict[str, Any]] = None):

    model.config.use_cache = True
    model = model.to("cpu")
-    model.save_pretrained(model_args.export_dir, max_shard_size="{}GB".format(model_args.export_size))
+    model.save_pretrained(
+        save_directory=model_args.export_dir,
+        max_shard_size="{}GB".format(model_args.export_size),
+        safe_serialization=(not model_args.export_lecacy_format)
+    )

    try:
        tokenizer.padding_side = "left" # restore padding side