我做的关于协作推荐的实验——为这个小组做些贡献

咚咚咚

2009-02-14 19:48:26 来自: 咚咚咚(领略豆瓣)

这是去年10月做的实验,篇幅有限,不能实验结果。若需要更多的实验数据和源程序可与我联系,希望能抛砖引玉,与有相同爱好和兴趣的朋友多交流,共同进步。

实验目的:

1、 设计并实现基于协作的项目评分预测系统

2、 用户相似程度计算分别采用

a) 修正余弦相关度计算方法

b) 泊松相关性计算方法

3、 根据实验结果论证各参数(相似度阙值,邻居共有项数目阙值,加权平均相似项阙值)对于推荐结果(MAE)的影响,分析原因

注:数据集由MovieLens提供

实验步骤:

1、 根据 训练集 构造 “用户/推介项/评分” 矩阵

a) 输入:训练集 MovieLens 提供的训练样本文件 un.base 如下:

1 6 5 887431973

1 10 3 875693118

1 12 5 878542960

1 14 5 874965706

每行依次为:用户id,推荐项id,评分项,时间戳

b) 输出:U/I/R 矩阵

2、 计算用户间相似性,获得用户相似性矩阵

a) 应用“修正的余弦”相似性计算方法

b) 应用“泊松相关系数”计算方法



3、 用户相似性矩阵排序(根据相似性由高到低排序)

4、 测试集录入

5、 对每一条测试值进行估计,计算偏差

6、 计算预测效果(MAE,有效推介个数)

实验数据和结果:

1, 参数说明:

a) 选择用户900名,推荐项1600个;

b) 共有项阙值:计算用户相似度时,两用户间至少要对多少个推荐项进行评价

c) 相似度阙值:大于该值才能归为该用户的邻居

d) 相似选择个数:在估计推荐值时选择的用户个数,加权平均时使用

e) 估计值总数:符合条件的估计值总数

实验结果部分(略)


实验结果分析

相似度阙值,共有项数目阙值,加权平均推介项个数对推介的结果有比较显著的影响,相似度阙值越高,共有项数目阙值越大,加权平均推介项个数越多,推介的估计值就会越准确,但同时满足以上较好参数的用户及项目却不多。随着各参数的提高,符合推介条件的项会减少,应该设计多策略选择各个参数,以保证每个推介项对每个用户都有推介,且有较好的推介效果。




  • mei

    2009-05-09 23:20:46 mei

    你好,我在做一篇电子商务个性化推荐服务研究的论文,需要MovieLens网站的数据集,请问能提供给我吗? 我的email是lmm_5181964@qq.com,或者QQ:359039851,如果可以的话,请联系我,谢谢!

  • 2009-08-25 11:32:34 考虑中

    你好,不知道能不能得到你的数据集和程序的源代码。
    如果可以的话请发到我的信箱里,谢谢!!
    我的EMAIL:jixiaosheng@126.com

  • yangyang

    2009-09-26 21:44:02 yangyang (不要搜索,为我推荐吧~)

    你好,希望能够得到你的源代码,我的信箱wang.yangyang@stu.xjtu.edu.cn。多谢 O(∩_∩)O~

  • Charlie

    2009-10-11 22:04:50 Charlie

    你好,我正打算深入这一领域,希望能够得到你的源代码和数据集,我的信箱是charlie.sdu@gmail.com。谢谢了!

  • 2009-12-10 16:05:34 traition

    你好,我正在作这方面的研究,能否联系一下?谢谢!traition@126.com

  • Walter

    2009-12-16 23:06:15 Walter

    您们好,最近在做这方面的东西,希望得到你的源代码和数据集。邮箱:423526911@qq.com 谢谢~~


这个小组的成员也喜欢去   · · · · · · 

数据挖掘
数据挖掘 (2332)
关注豆瓣douban的智能化社会化进展
关注豆瓣douban的智能化社... (490)
潘多拉
潘多拉 (69)
RDF
RDF (18)
语义web
语义web (38)
用户行为分析
用户行为分析 (3003)