之前在Netflix Prize的时候,我们Ensemble组内部讨论过,如果很多人共用一个账号,而他们的兴趣不同,这可能会造成推荐结果的不准确。那么如何能够分开共用一个账号的用户呢? 当时我们的组员Lester Mackey提出过一些idea,但是当时因为时间紧张,没有能实现这个model。

最近Lester Mackey在ICML上发表了一篇文章”Mixed Membership Matrix Factorization“,详细讨论这个idea。他将LDA和SVD结合了起来,认为每个user id可能对应了好几个人,所以一开始用多项式分布采出一个id对应的人,而每个人对应一个latent factor。他的方法在RMSE上的提高是比较明显的 0.9 => 0.896
这个model很有意思,大家可以看看,也许我理解的不是那么准确。
Related Posts
- LDA的实现 (0.578)
- SVD and KNN top-N system with binary data (0.386)
- A trick of doing SVD on binary data (0.386)
- 到目前为止的进度 (0.036)
- 时间信息在推荐系统中的作用 (0.036)
Post a Comment