add hint for freeze #2412

Former-commit-id: 6545c02790
2025-12-15 19:30:36 +08:00 · 2024-02-03 23:38:56 +08:00
parent a9e58740f5
commit 0fc8612b97
2 changed files with 11 additions and 0 deletions
--- a/src/llmtuner/hparams/finetuning_args.py
+++ b/src/llmtuner/hparams/finetuning_args.py
@@ -17,6 +17,7 @@ class FreezeArguments:
                  BLOOM & Falcon & ChatGLM choices: ["mlp", "self_attention"], \
                  Qwen choices: ["mlp", "attn"], \
                  Phi choices: ["mlp", "mixer"], \
                  InternLM2 choices: ["feed_forward", "attention"], \
                  Others choices: the same as LLaMA.'
        },
    )
--- a/src/llmtuner/model/adapter.py
+++ b/src/llmtuner/model/adapter.py
@@ -52,8 +52,18 @@ def init_adapter(
        else:  # fine-tuning the first n layers if num_layer_trainable < 0
            trainable_layer_ids = [k for k in range(-finetuning_args.num_layer_trainable)]  # noqa: C416
        freeze_modules = set()
        for name, _ in model.named_modules():
            if "0." in name:
                freeze_modules.add(name.split("0.")[-1].split(".")[0])
        trainable_layers = []
        for module_name in finetuning_args.name_module_trainable:
            if module_name not in freeze_modules:
                raise ValueError(
                    "Module {} is not found, please choose from {}".format(module_name, ", ".join(freeze_modules))
                )
            for idx in trainable_layer_ids:
                trainable_layers.append("{:d}.{}".format(idx, module_name))