fix #1176 #1177

Former-commit-id: 01d8cb1ca76e1d599fa5e970b2fcaa3ceedbfffd
2025-08-04 20:52:59 +08:00 · 2023-10-14 20:00:17 +08:00 · 2023-10-14 20:00:17 +08:00 · 1faba4b704
commit 1faba4b704
parent e585c789ce
1 changed files with 2 additions and 0 deletions
--- a/src/llmtuner/tuner/core/loader.py
+++ b/src/llmtuner/tuner/core/loader.py
@ -71,6 +71,7 @@ def load_model_and_tokenizer(
    tokenizer = AutoTokenizer.from_pretrained(
        model_args.model_name_or_path,
        use_fast=model_args.use_fast_tokenizer,
        split_special_tokens=model_args.split_special_tokens,
        padding_side="right", # training with left-padded tensors in fp16 precision may cause overflow
        **config_kwargs
    )
@ -184,6 +185,7 @@ def load_model_and_tokenizer(
    model = AutoModelForCausalLM.from_pretrained(
        model_to_load,
        config=config,
        torch_dtype=getattr(config, "torch_dtype"),
        low_cpu_mem_usage=(not is_deepspeed_zero3_enabled()),
        **config_kwargs
    )