From 10a446e37375ee3a02b7eb83f6913a73bbba993f Mon Sep 17 00:00:00 2001
From: Pory <porykid@gmail.com>
Date: Thu, 13 Nov 2025 20:09:44 +0800
Subject: [PATCH] [model] ktransformers qwen3 support (#9485)

Co-authored-by: unknown <xiongchenhui@hisense.ad>
---
 src/llamafactory/model/model_utils/ktransformers.py | 2 ++
 1 file changed, 2 insertions(+)

diff --git a/src/llamafactory/model/model_utils/ktransformers.py b/src/llamafactory/model/model_utils/ktransformers.py
index d123edc2..26c413ca 100644
--- a/src/llamafactory/model/model_utils/ktransformers.py
+++ b/src/llamafactory/model/model_utils/ktransformers.py
@@ -34,6 +34,7 @@ if KT_AVAILABLE:
     from ktransformers.models.modeling_llama import LlamaForCausalLM
     from ktransformers.models.modeling_mixtral import MixtralForCausalLM
     from ktransformers.models.modeling_qwen2_moe import Qwen2MoeForCausalLM
+    from ktransformers.models.modeling_qwen3_moe import Qwen3MoeForCausalLM
     from ktransformers.optimize.optimize import optimize_and_load_gguf
     from ktransformers.server.config.config import Config
     from ktransformers.sft.lora import inject_lora_layer
@@ -71,6 +72,7 @@ def load_kt_pretrained_model(config: "PretrainedConfig", model_args: "ModelArgum
         "DeepseekV2ForCausalLM": DeepseekV2ForCausalLM,
         "DeepseekV3ForCausalLM": DeepseekV3ForCausalLM,
         "Qwen2MoeForCausalLM": Qwen2MoeForCausalLM,
+        "Qwen3MoeForCausalLM": Qwen3MoeForCausalLM,
         "LlamaForCausalLM": LlamaForCausalLM,
         "MixtralForCausalLM": MixtralForCausalLM,
     }