[misc] fix packing and eval plot (#7623)

2025-12-18 04:40:35 +08:00 · 2025-04-07 18:20:57 +08:00
parent c0079ab9fd
commit fb46193364
70 changed files with 288 additions and 194 deletions
--- a/src/llamafactory/hparams/model_args.py
+++ b/src/llamafactory/hparams/model_args.py
@@ -23,7 +23,7 @@ import torch
 from transformers.training_args import _convert_str_dict
 from typing_extensions import Self

-from ..extras.constants import AttentionFunction, EngineName, RopeScaling
+from ..extras.constants import AttentionFunction, EngineName, QuantizationMethod, RopeScaling


@dataclass
@@ -184,8 +184,8 @@ class BaseModelArguments:
 class QuantizationArguments:
    r"""Arguments pertaining to the quantization method."""

-    quantization_method: Literal["bitsandbytes", "hqq", "eetq"] = field(
-        default="bitsandbytes",
+    quantization_method: QuantizationMethod = field(
+        default=QuantizationMethod.BNB,
        metadata={"help": "Quantization method to use for on-the-fly quantization."},
    )
    quantization_bit: Optional[int] = field(