[train] fix adjusting logits size after adding special tokens (#8823)

2025-11-08 14:24:47 +08:00 · 2025-08-05 20:35:07 +08:00 · 2025-08-05 20:35:07 +08:00 · 48615ddb07
commit 48615ddb07
parent b3445a75f0
1 changed files with 1 additions and 0 deletions
--- a/src/llamafactory/model/model_utils/embedding.py
+++ b/src/llamafactory/model/model_utils/embedding.py
@ -67,4 +67,5 @@ def resize_embedding_layer(model: "PreTrainedModel", tokenizer: "PreTrainedToken
            _noisy_mean_initialization(model.get_input_embeddings().weight.data, num_new_tokens)
            _noisy_mean_initialization(model.get_output_embeddings().weight.data, num_new_tokens)

+        model.config.vocab_size = new_embedding_size
        logger.info_rank0(f"Resized token embeddings from {current_embedding_size} to {new_embedding_size}.")