fix bug in packed sft dataset

Former-commit-id: 51d26b2af6612e65a91c576da5270028da27b322
2026-01-11 00:20:35 +08:00 · 2023-09-28 01:16:46 +08:00
parent 21a454fa6c
commit e49f7f1afe
1 changed files with 1 additions and 1 deletions
--- a/src/llmtuner/dsets/preprocess.py
+++ b/src/llmtuner/dsets/preprocess.py
@@ -116,7 +116,7 @@ def preprocess_dataset(
        # split by chunks of cutoff_len
        for i in range(0, total_length, block_size):
            model_inputs["input_ids"].append(input_ids[i: i + block_size])
-            model_inputs["attention_mask"].append([1] * len(block_size))
+            model_inputs["attention_mask"].append([1] * block_size)
            model_inputs["labels"].append(labels[i: i + block_size])

        return model_inputs