[BugFix] Fix initialization of draft model. (#29319)

halyavin · tlrmchlsmth · web-flow · commit de75b0bb701c · 2025-11-25T18:45:58.000-05:00
Signed-off-by: Andrey Khalyavin &lt;halyavin@yandex-team.ru&gt;
Signed-off-by: Tyler Michael Smith &lt;tlrmchlsmth@gmail.com&gt;
Co-authored-by: Tyler Michael Smith &lt;tlrmchlsmth@gmail.com&gt;
diff --git a/vllm/v1/worker/gpu_model_runner.py b/vllm/v1/worker/gpu_model_runner.py
@@ -3460,6 +3460,10 @@ def load_model(self, eep_scale_up: bool = False) -> None:
             scope="local",
         )
         prepare_communication_buffer_for_model(self.model)
+        if (drafter := getattr(self, "drafter", None)) and (
+            drafter_model := getattr(drafter, "model", None)
+        ):
+            prepare_communication_buffer_for_model(drafter_model)
         mm_config = self.model_config.multimodal_config
         self.is_multimodal_pruning_enabled = (
             supports_multimodal_pruning(self.get_model())