[v1] add batch generator (#9744)

2026-02-27 08:15:59 +08:00 · 2026-01-10 04:24:09 +08:00
parent d7d734d54c
commit b2effbd77c
26 changed files with 604 additions and 850 deletions
--- a/tests_v1/plugins/model_plugins/test_init_plugin.py
+++ b/tests_v1/plugins/model_plugins/test_init_plugin.py
@@ -21,7 +21,7 @@ from llamafactory.v1.core.model_engine import ModelEngine
 def test_init_on_meta():
    _, model_args, *_ = get_args(
        dict(
-            model="llamafactory/tiny-random-qwen2.5",
+            model="llamafactory/tiny-random-qwen3",
            init_config={"name": "init_on_meta"},
        )
    )
@@ -32,7 +32,7 @@ def test_init_on_meta():
 def test_init_on_rank0():
    _, model_args, *_ = get_args(
        dict(
-            model="llamafactory/tiny-random-qwen2.5",
+            model="llamafactory/tiny-random-qwen3",
            init_config={"name": "init_on_rank0"},
        )
    )
@@ -46,7 +46,7 @@ def test_init_on_rank0():
 def test_init_on_default():
    _, model_args, *_ = get_args(
        dict(
-            model="llamafactory/tiny-random-qwen2.5",
+            model="llamafactory/tiny-random-qwen3",
            init_config={"name": "init_on_default"},
        )
    )
--- a/tests_v1/plugins/model_plugins/test_kernel_plugin.py
+++ b/tests_v1/plugins/model_plugins/test_kernel_plugin.py
@@ -43,7 +43,7 @@ def test_apply_kernel(mock_get_accelerator: MagicMock):
    reload_kernels()
    from llamafactory.v1.plugins.model_plugins.kernels.interface import apply_default_kernels

-    model = AutoModelForCausalLM.from_pretrained("llamafactory/tiny-random-qwen2.5")
+    model = AutoModelForCausalLM.from_pretrained("llamafactory/tiny-random-qwen3")
    original_rmsnorm_forward = model.model.layers[0].input_layernorm.forward
    original_swiglu_forward = model.model.layers[0].mlp.forward
    model = apply_default_kernels(model=model, include_kernels="npu_fused_rmsnorm")
@@ -62,7 +62,7 @@ def test_apply_all_kernels(mock_get_accelerator: MagicMock):
    reload_kernels()
    from llamafactory.v1.plugins.model_plugins.kernels.interface import apply_default_kernels

-    model = AutoModelForCausalLM.from_pretrained("llamafactory/tiny-random-qwen2.5")
+    model = AutoModelForCausalLM.from_pretrained("llamafactory/tiny-random-qwen3")

    original_rmsnorm_forward = model.model.layers[0].input_layernorm.forward
    original_swiglu_forward = model.model.layers[0].mlp.forward