在传统的推荐算法中,有两个基本算法,也就是所谓的user-based和item-based。其实,前一种算法的观点是认为用户的行为比较受舆论的影响,而后一种认为用户的行为受自己喜好的影响。当然这两者算法都是偏于极端的,现实社会中用户的行为往往受两种的共同影响,而两种影响的大小主要取决于用户和舆论谁更强势。 就比如拿最近的孔子来说,其实本人自从来了北京之后,每个月都会看一部电影,不管好还是烂,反正我个人看电影的习惯就是放松,不管多烂的电影,只要能放松就行了。而且我个人还是比较有主见的,不大受社会太多的影响(当然这也是相比较而言)。但是,有的时候舆论的影响却是潜移默化的,鉴于我的社会圈子里的舆论都认为孔子不怎么样,首先这就降低了我的期望,也就是说我去看孔子也不抱大希望了,但因为我的习惯,我还是觉得去看孔子,也就是说,在我到电影院之前,我的行为还是受我的习惯影响,舆论虽然有影响,但还没有大到改变我决定的地步。 不过当我到了电影院,发现孔子打折票还买50,这时我犹豫了,身在价格和舆论的双重context下,再强的人也不得不改变习惯了,于是经过激烈的思想斗争,我放弃了看孔子,用8元钱去买了个面包(现烤的,味道很不错)吃了一下,算是本周末奢侈了一把。 由此可见,舆论和个性的博弈在我看孔子这件事情上体现的非常的明显,当一个个人还在如此犹豫的时候,去追求推荐的精度还有什么意义了?也许我明天又后悔了,而这个事情推荐系统拿到了我没看孔子的数据,还在沾沾自喜着准备利用这个信息来调整精度。
Follow Me
Tag Cloud
accuracy algorithms blending collaborative filtering conference contest crawler data mining dataset diversity douban firefox github contest google google reader graph html IBM ideas item-based KDD2010 knn linux long tail netflixprize netflixprize2 pagerank parser personal RBM recommender system resource resys svd temporal recsys time model twithunter twitter user-based web graph yahoo youtube 推荐 生活 闲话友情链接
博客搜索
-
最近文章
功能
文章归档
- 2010 年 九月 (2)
- 2010 年 八月 (6)
- 2010 年 七月 (9)
- 2010 年 六月 (3)
- 2010 年 五月 (8)
- 2010 年 四月 (11)
- 2010 年 三月 (15)
- 2010 年 二月 (7)
- 2010 年 一月 (15)
- 2009 年 十二月 (13)
- 2009 年 十一月 (8)
- 2009 年 十月 (15)
- 2009 年 九月 (24)
- 2009 年 八月 (14)
- 2009 年 七月 (6)
- 2009 年 五月 (2)
- 2009 年 四月 (13)
- 2009 年 三月 (13)
- 2009 年 二月 (5)
- 2009 年 一月 (7)
- 2008 年 十二月 (3)
- 2008 年 十一月 (1)
- 2008 年 十月 (7)
- 2008 年 九月 (2)
- 2008 年 八月 (1)
- 2008 年 五月 (3)
- 2008 年 四月 (1)
- 2008 年 二月 (1)
- 2008 年 一月 (1)
- 2007 年 十月 (2)
- 2007 年 九月 (7)
- 2007 年 八月 (1)
- 2007 年 六月 (5)
- 2007 年 五月 (9)
- 2007 年 四月 (6)
- 2007 年 三月 (6)
- 2007 年 二月 (3)
- 2007 年 一月 (17)
- 2006 年 十二月 (14)
- 2006 年 十月 (9)
- 2006 年 九月 (1)
- 2006 年 八月 (6)
GoogleReader 共享
