support Qwen-7B, fix InternLM-7B inference

2025-12-15 19:30:36 +08:00 · 2023-08-03 15:53:32 +08:00
parent 53d6dc396d
commit 87f8f830e2
8 changed files with 89 additions and 25 deletions
--- a/src/llmtuner/tuner/core/loader.py
+++ b/src/llmtuner/tuner/core/loader.py
@@ -67,7 +67,7 @@ def load_model_and_tokenizer(
        **config_kwargs
    )
    if tokenizer.pad_token_id is None or tokenizer.pad_token_id == 64000: # 64000 for baichuan model (older version)
-        tokenizer.pad_token_id = 0 # set as the <unk> token
+        tokenizer.pad_token = tokenizer.eos_token

    config = AutoConfig.from_pretrained(model_args.model_name_or_path, **config_kwargs)
    is_mergeable = True