fix qwen eos token

Former-commit-id: 770830c67886f5872b39b9608949ec62d4616b27
2026-07-30 20:56:10 +08:00 · 2023-08-06 13:31:17 +08:00
parent a70d56864e
commit fe3b12d900
1 changed files with 3 additions and 1 deletions
--- a/src/llmtuner/tuner/core/loader.py
+++ b/src/llmtuner/tuner/core/loader.py
@@ -68,7 +68,9 @@ def load_model_and_tokenizer(
        padding_side=model_args.padding_side,
        **config_kwargs
    )
-    if tokenizer.pad_token_id is None or tokenizer.pad_token_id == 64000: # 64000 for baichuan model (older version)
+    if tokenizer.eos_token_id is None: # fix qwen tokenizer
+        tokenizer.eos_token = "<|endoftext|>"
+    if tokenizer.pad_token_id is None: # add pad token
        tokenizer.pad_token = tokenizer.eos_token

    config = AutoConfig.from_pretrained(model_args.model_name_or_path, **config_kwargs)