[model] add qwen3-vl/qwen3-omni (#9196)

Co-authored-by: kingsley <kingsleydodonow@gmail.com>
2026-03-08 04:35:58 +08:00 · 2025-09-27 01:21:47 +08:00
parent abc3b1e1c4
commit 0761a4448f
5 changed files with 268 additions and 2 deletions
--- a/src/llamafactory/model/model_utils/moe.py
+++ b/src/llamafactory/model/model_utils/moe.py
@@ -105,7 +105,7 @@ def add_z3_leaf_module(model: "PreTrainedModel") -> None:

        _set_z3_leaf_modules(model, [Qwen2MoeSparseMoeBlock])

-    if model_type == "qwen3_moe" or text_architectures == "Qwen3MoeForCausalLM":  # for internvl_3_5
+    if model_type == "qwen3_moe" or text_architectures == "Qwen3MoeForCausalLM":
        from transformers.models.qwen3_moe.modeling_qwen3_moe import Qwen3MoeSparseMoeBlock

        _set_z3_leaf_modules(model, [Qwen3MoeSparseMoeBlock])