fix #4022

Former-commit-id: 24e1c0e2ee
2026-06-20 06:08:57 +08:00 · 2024-06-03 18:38:36 +08:00
parent af7748139a
commit d0ceb1b091
3 changed files with 3 additions and 5 deletions
--- a/src/llamafactory/chat/vllm_engine.py
+++ b/src/llamafactory/chat/vllm_engine.py
@@ -158,12 +158,10 @@ class VllmEngine(BaseEngine):
        )

        result_generator = self.model.generate(
-            prompt=None,
+            inputs={"prompt_token_ids": prompt_ids, "multi_modal_data": multi_modal_data},
            sampling_params=sampling_params,
            request_id=request_id,
-            prompt_token_ids=prompt_ids,
            lora_request=self.lora_request,
-            multi_modal_data=multi_modal_data,
        )
        return result_generator

--- a/src/llamafactory/hparams/parser.py
+++ b/src/llamafactory/hparams/parser.py
@@ -94,7 +94,7 @@ def _check_extra_dependencies(
        require_version("mixture-of-depth>=1.1.6", "To fix: pip install mixture-of-depth>=1.1.6")

    if model_args.infer_backend == "vllm":
-        require_version("vllm>=0.4.1", "To fix: pip install vllm>=0.4.1")
+        require_version("vllm>=0.4.3", "To fix: pip install vllm>=0.4.3")

    if finetuning_args.use_galore:
        require_version("galore_torch", "To fix: pip install galore_torch")