[v1] Add FlashAttention selection and implement normal / padding-free / dynamic batching (#10469)

2026-07-28 19:56:13 +08:00 · 2026-05-21 17:14:19 +08:00
parent 7e20db5735
commit bdcb92d035
23 changed files with 507 additions and 105 deletions
--- a/tests_v1/plugins/model_plugins/test_init_plugin.py
+++ b/tests_v1/plugins/model_plugins/test_init_plugin.py
@@ -52,12 +52,3 @@ def test_init_on_default():
    )
    model_engine = ModelEngine(model_args=model_args)
    assert model_engine.model.device == DistributedInterface().current_device
-
-
-if __name__ == "__main__":
-    """
-    python tests_v1/plugins/model_plugins/test_init_plugin.py
-    """
-    test_init_on_meta()
-    test_init_on_rank0()
-    test_init_on_default()