一种按误差平方最小化更新权重的监督学习规则。
它像数学老师批卷:不只画叉,还按差几分把学生一点点掰回来。
用于早期神经网络和滤波,启发梯度下降训练。
Supervised Learning它依赖标准答案计算误差,再据此更新权重。
Gradient Descent它本质上沿误差平方的下降方向调整参数。
Perceptron它推动了早期线性神经元从犯错中学习。
SGD它的逐样本小步更新,预示了后来的 SGD。