@@ -2380,7 +2380,7 @@ class TestDeepSeekV32(LlmapiAccuracyTestHarness):
23802380 (8 , 1 , 8 , 0 , False , True , True , True , 24 , "_DEFAULT" ),
23812381 (8 , 1 , 8 , 1 , False , True , True , True , 24 , "_DEFAULT" ),
23822382 (8 , 1 , 8 , 0 , True , True , True , True , 24 , "_DEFAULT" ),
2383- (8 , 1 , 8 , 1 , False , False , True , True , 1 , "TRTLLM" ),
2383+ (8 , 1 , 8 , 3 , False , False , True , True , 1 , "TRTLLM" ),
23842384 ],
23852385 ids = ["baseline" , "baseline_mtp1" , "baseline_fp8kv" , "latency" ])
23862386 def test_fp8_blockscale (self , tp_size , pp_size , ep_size , mtp_nextn , fp8kv ,
@@ -2448,7 +2448,7 @@ def test_fp8_blockscale(self, tp_size, pp_size, ep_size, mtp_nextn, fp8kv,
24482448 (8 , 1 , 8 , 0 , False , True , True , True , 24 , "CUTLASS" ),
24492449 (8 , 1 , 8 , 1 , False , True , True , True , 24 , "CUTLASS" ),
24502450 (8 , 1 , 8 , 0 , True , True , True , True , 24 , "CUTLASS" ),
2451- (8 , 1 , 8 , 1 , False , False , True , True , 1 , "TRTLLM" ),
2451+ (8 , 1 , 8 , 3 , False , False , True , True , 1 , "TRTLLM" ),
24522452 ],
24532453 ids = ["baseline" , "baseline_mtp1" , "baseline_fp8kv" , "latency" ])
24542454 def test_nvfp4_multi_gpus (self , tp_size , pp_size , ep_size , mtp_nextn , fp8kv ,
0 commit comments