Tag Archives: LDA

LDA的实现

首先要感谢Wang Yi的帮助,我之前对统计模型总是没有深入的了解,最近仔细研究了LDA之后,发现这个模型具有很多矩阵模型没有的优点。而且这个算法的实现很简单。下面的图片就是主要代码。 同时利用openmp实现了一个简单的并行版本,可以充分一下利用我机器的4个核。 轻松一下

多个用户共用一个id?

之前在Netflix Prize的时候,我们Ensemble组内部讨论过,如果很多人共用一个账号,而他们的兴趣不同,这可能会造成推荐结果的不准确。那么如何能够分开共用一个账号的用户呢? 当时我们的组员Lester Mackey提出过一些idea,但是当时因为时间紧张,没有能实现这个model。 最近Lester Mackey在ICML上发表了一篇文章”Mixed Membership Matrix Factorization“,详细讨论这个idea。他将LDA和SVD结合了起来,认为每个user id可能对应了好几个人,所以一开始用多项式分布采出一个id对应的人,而每个人对应一个latent factor。他的方法在RMSE上的提高是比较明显的 0.9 => 0.896 这个model很有意思,大家可以看看,也许我理解的不是那么准确。