从文档词频中发现潜在主题的概率模型。
LDA像中医闻药渣:不问病历,凭药味估这方子几分清热、几分补气。
用于文章聚类、舆情分析,先给文本打主题底色。
Latent ModelLDA 把“主题”当作看不见的潜变量。
PGMLDA 可表示成文档、主题、词的概率图。
Unsupervised LearningLDA 不靠人工标签,从文本里自己找主题。
Bag-of-WordsLDA 通常把文档先看成词袋来统计。