Update
d297277 unverified | { |
| "fp16": {}, |
| "q8": { |
| "per_model_config": { |
| "model": { |
| "op_types": [ |
| "Add", |
| "Cast", |
| "Concat", |
| "Constant", |
| "Div", |
| "Erf", |
| "Gather", |
| "MatMul", |
| "Mul", |
| "Pow", |
| "ReduceMean", |
| "Reshape", |
| "Shape", |
| "Slice", |
| "Softmax", |
| "Sqrt", |
| "Sub", |
| "Transpose", |
| "Unsqueeze" |
| ], |
| "weight_type": "QInt8" |
| } |
| }, |
| "per_channel": true, |
| "reduce_range": true |
| }, |
| "int8": { |
| "per_model_config": { |
| "model": { |
| "op_types": [ |
| "Add", |
| "Cast", |
| "Concat", |
| "Constant", |
| "Div", |
| "Erf", |
| "Gather", |
| "MatMul", |
| "Mul", |
| "Pow", |
| "ReduceMean", |
| "Reshape", |
| "Shape", |
| "Slice", |
| "Softmax", |
| "Sqrt", |
| "Sub", |
| "Transpose", |
| "Unsqueeze" |
| ], |
| "weight_type": "QInt8" |
| } |
| }, |
| "per_channel": true, |
| "reduce_range": true |
| }, |
| "uint8": { |
| "per_model_config": { |
| "model": { |
| "op_types": [ |
| "Add", |
| "Cast", |
| "Concat", |
| "Constant", |
| "Div", |
| "Erf", |
| "Gather", |
| "MatMul", |
| "Mul", |
| "Pow", |
| "ReduceMean", |
| "Reshape", |
| "Shape", |
| "Slice", |
| "Softmax", |
| "Sqrt", |
| "Sub", |
| "Transpose", |
| "Unsqueeze" |
| ], |
| "weight_type": "QUInt8" |
| } |
| }, |
| "per_channel": true, |
| "reduce_range": true |
| }, |
| "q4": { |
| "block_size": 32, |
| "is_symmetric": true, |
| "accuracy_level": null |
| }, |
| "bnb4": { |
| "block_size": 64, |
| "quant_type": 1 |
| } |
| } |