用最短总编码选择模型的原则。
最小描述长度像记外语语法:规则要背,例外也要背,两本账加起来最薄的才是好规则。
用于模型选择,也防过拟合:模型加误差,一起算总长。
Information TheoryMDL 用编码长度统一模型复杂度和拟合误差。
Regularization正则化常把“短解释”思想写进损失函数。
Bias-Variance Tradeoff它提醒模型别为降低误差,把噪声也背下来。
Statistical Learning Theory它是模型选择中偏好简单解释的一种原则。