refactor mm training

2025-12-18 04:40:35 +08:00 · 2024-08-30 02:14:31 +08:00
parent 727e184840
commit 3382317e32
32 changed files with 505 additions and 472 deletions
--- a/src/llamafactory/model/model_utils/misc.py
+++ b/src/llamafactory/model/model_utils/misc.py
@@ -36,11 +36,14 @@ def find_all_linear_modules(model: "PreTrainedModel", freeze_vision_tower: bool)
        forbidden_modules.add("output")
    elif model.config.model_type in ["llava", "paligemma"]:
        forbidden_modules.add("multi_modal_projector")
-    elif model.config.model_type in ["qwen2_vl"]:
+    elif model.config.model_type == "qwen2_vl":
        forbidden_modules.add("merger")

    if freeze_vision_tower:
-        forbidden_modules.add("vision_tower")
+        if model.config.model_type == "qwen2_vl":
+            forbidden_modules.add("visual")
+        else:
+            forbidden_modules.add("vision_tower")

    module_names = set()
    for name, module in model.named_modules():