posts/modelquantization/quantization-impact-on-model-accuracy/

# Quantization Impact on Model Accuracy | Slightwind

Mistral-7B’s performance on 5-shot MMLU 如果对测试细节不感兴趣，只需要看下面给出的汇总表格即可。
Overview 量化/非量化版本的 Mistral-7B-v0.1 模型在 5-shot MMLU 上的表现：
Quant Type Compute Dtype Double Quant Group Size Avg (%) Total Time (s) BF16 BF16 N/A N/A $61.00$ $312.79$ INT8 BF16&INT8 N/A N/A $60.87$ $614.43$ FP4 FP16 False 64 $59.37$ $347.00$ FP4 FP16 True 64 $59.17$ $353.22$ FP4 FP32 False 64 $59.50$ $1061.27$ NF4 FP16 False 64 $59.04$ $361.19$ NF4 FP16 False 128 $58.78$ $352.65$ A

[https://slightwind.cn/posts/modelquantization/quantization-impact-on-model-accuracy/](https://slightwind.cn/posts/modelquantization/quantization-impact-on-model-accuracy/)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

posts/modelquantization/quantization-impact-on-model-accuracy/ #1

Quantization Impact on Model Accuracy | Slightwind

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

posts/modelquantization/quantization-impact-on-model-accuracy/ #1

Description

Quantization Impact on Model Accuracy | Slightwind

Metadata

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Issue actions