AI Rookies

Samuel Checkers Program — 塞缪尔跳棋程序

事实

会通过自我对弈改进棋力的早期跳棋程序。

人话

塞缪尔跳棋就是武馆学徒:没人喂招,天天复盘,挨打越多越会打。

它证明机器能从经验变强,是游戏 AI 早期路标。

相关概念

Reinforcement Learning
它用输赢经验改进棋力,是强化学习的早期雏形。

Minimax Search
它靠向前看几步,比较不同走法的好坏。

Game AI
它证明游戏能当 AI 学习能力的试验田。

TD-Gammon
后来的 TD-Gammon 延续了自我对弈学棋路线。