删除冗余连接或神经元以压缩模型的方法。
网络剪枝像给月季修枝:枯弱枝下剪,花架清爽,照样开得旺。
用于模型压缩和端侧部署,省算力,剪狠会掉分。
Model Compression网络剪枝是模型压缩的典型做法,直接缩小网络。
Quantization量化改数字精度,剪枝改网络结构,常一起用。
Parameter剪枝常按参数重要性,删掉贡献小的权重。
Inference删掉冗余计算后,推理通常更快更省。