之前在Netflix Prize的时候,我们Ensemble组内部讨论过,如果很多人共用一个账号,而他们的兴趣不同,这可能会造成推荐结果的不准确。那么如何能够分开共用一个账号的用户呢? 当时我们的组员Lester Mackey提出过一些idea,但是当时因为时间紧张,没有能实现这个model。 最近Lester Mackey在ICML上发表了一篇文章”Mixed Membership Matrix Factorization“,详细讨论这个idea。他将LDA和SVD结合了起来,认为每个user id可能对应了好几个人,所以一开始用多项式分布采出一个id对应的人,而每个人对应一个latent factor。他的方法在RMSE上的提高是比较明显的 0.9 => 0.896 这个model很有意思,大家可以看看,也许我理解的不是那么准确。
Follow Me
Tag Cloud
accuracy algorithms blending collaborative filtering conference contest crawler data mining dataset diversity douban firefox github contest google google reader graph html IBM ideas item-based KDD2010 knn linux long tail netflixprize netflixprize2 pagerank parser personal RBM recommender system resource resys svd temporal recsys time model twithunter twitter user-based web graph yahoo youtube 推荐 生活 闲话友情链接
博客搜索
-
最近文章
功能
文章归档
- 2010 年 九月 (2)
- 2010 年 八月 (6)
- 2010 年 七月 (9)
- 2010 年 六月 (3)
- 2010 年 五月 (8)
- 2010 年 四月 (11)
- 2010 年 三月 (15)
- 2010 年 二月 (7)
- 2010 年 一月 (15)
- 2009 年 十二月 (13)
- 2009 年 十一月 (8)
- 2009 年 十月 (15)
- 2009 年 九月 (24)
- 2009 年 八月 (14)
- 2009 年 七月 (6)
- 2009 年 五月 (2)
- 2009 年 四月 (13)
- 2009 年 三月 (13)
- 2009 年 二月 (5)
- 2009 年 一月 (7)
- 2008 年 十二月 (3)
- 2008 年 十一月 (1)
- 2008 年 十月 (7)
- 2008 年 九月 (2)
- 2008 年 八月 (1)
- 2008 年 五月 (3)
- 2008 年 四月 (1)
- 2008 年 二月 (1)
- 2008 年 一月 (1)
- 2007 年 十月 (2)
- 2007 年 九月 (7)
- 2007 年 八月 (1)
- 2007 年 六月 (5)
- 2007 年 五月 (9)
- 2007 年 四月 (6)
- 2007 年 三月 (6)
- 2007 年 二月 (3)
- 2007 年 一月 (17)
- 2006 年 十二月 (14)
- 2006 年 十月 (9)
- 2006 年 九月 (1)
- 2006 年 八月 (6)
GoogleReader 共享
