|
5 | 5 |
|
6 | 6 | typedef InfiniopDescriptor *infiniopMatmulGptqDescriptor_t; |
7 | 7 |
|
8 | | -__C __export infiniStatus_t infiniopCreateMatmulGptqDescriptor( |
9 | | - infiniopHandle_t handle, |
10 | | - infiniopMatmulGptqDescriptor_t *desc_ptr, |
11 | | - infiniopTensorDescriptor_t c_desc, |
12 | | - infiniopTensorDescriptor_t a_desc, |
13 | | - infiniopTensorDescriptor_t b_desc, |
14 | | - infiniopTensorDescriptor_t b_scale_desc, |
15 | | - infiniopTensorDescriptor_t zero_desc); |
| 8 | +__C __export infiniStatus_t infiniopCreateMatmulGptqDescriptor(infiniopHandle_t handle, |
| 9 | + infiniopMatmulGptqDescriptor_t *desc_ptr, |
| 10 | + infiniopTensorDescriptor_t c_desc, |
| 11 | + infiniopTensorDescriptor_t a_desc, |
| 12 | + infiniopTensorDescriptor_t packed_weights_desc, |
| 13 | + infiniopTensorDescriptor_t b_scale_desc, |
| 14 | + infiniopTensorDescriptor_t zero_desc); |
16 | 15 |
|
17 | 16 | __C __export infiniStatus_t infiniopGetMatmulGptqWorkspaceSize(infiniopMatmulGptqDescriptor_t desc, size_t *size); |
18 | 17 |
|
| 18 | +__C __export infiniStatus_t infiniopMatmulQuant(infiniopMatmulGptqDescriptor_t desc, |
| 19 | + void *workspace, |
| 20 | + size_t workspace_size, |
| 21 | + void *packed_weights, |
| 22 | + void *b_scale, |
| 23 | + void *zero, |
| 24 | + const void *a, |
| 25 | + const void *b, |
| 26 | + void *stream); |
| 27 | + |
19 | 28 | __C __export infiniStatus_t infiniopMatmulGptq(infiniopMatmulGptqDescriptor_t desc, |
20 | 29 | void *workspace, |
21 | 30 | size_t workspace_size, |
22 | 31 | void *c, |
23 | 32 | const void *a, |
24 | | - const void *b, |
25 | | - const void *b_scale, |
26 | | - const void *zero, |
| 33 | + void *packed_weights, |
| 34 | + void *b_scale, |
| 35 | + void *zero, |
27 | 36 | void *stream); |
28 | 37 |
|
29 | 38 | __C __export infiniStatus_t infiniopDestroyMatmulGptqDescriptor(infiniopMatmulGptqDescriptor_t desc); |
|
0 commit comments