Create README.md

vkuzo · web-flow · commit 3dcb9581bbe4 · 2025-10-02T13:54:36.000-04:00
diff --git a/hf_torchao_vllm/README.md b/hf_torchao_vllm/README.md
@@ -0,0 +1,11 @@
+# HF -> torchao -> vLLM convenience scripts
+
+Example
+
+```bash
+# save a quantized model ot data/nvfp4-Qwen1.5-MoE-A2.7B
+python quantize_hf_model_with_torchao.py --model_name "Qwen/Qwen1.5-MoE-A2.7B" --experts_only_qwen_1_5_moe_a_2_7b True --save_model_to_disk True --quant_type nvfp4
+
+# run the model from above in vLLM
+python run_quantized_model_in_vllm.py --model_name "data/nvfp4-Qwen1.5-MoE-A2.7B" --compile False
+```