AI Rookies

Synthetic Data — 合成数据

事实

由程序或模型生成、用于训练或测试的数据。

人话

合成数据像驾校模拟路考:真马路不够练,先摆雪糕筒造场景。

用于训练、测试和隐私保护,造偏了模型也跑偏。

相关概念

Data Augmentation
合成数据常被用来扩充稀缺样本。

Generative Model
生成模型能批量造出合成数据。

Data Privacy
合成数据可减少暴露敏感原始数据。

AI Bias
合成数据仿歪时,会把偏见喂进模型。