我做的关于协作推荐的实验——为这个小组做些贡献
2009-02-14 19:48:26 来自: 咚咚咚(领略豆瓣)
这是去年10月做的实验,篇幅有限,不能实验结果。若需要更多的实验数据和源程序可与我联系,希望能抛砖引玉,与有相同爱好和兴趣的朋友多交流,共同进步。
实验目的:
1、 设计并实现基于协作的项目评分预测系统
2、 用户相似程度计算分别采用
a) 修正余弦相关度计算方法
b) 泊松相关性计算方法
3、 根据实验结果论证各参数(相似度阙值,邻居共有项数目阙值,加权平均相似项阙值)对于推荐结果(MAE)的影响,分析原因
注:数据集由MovieLens提供
实验步骤:
1、 根据 训练集 构造 “用户/推介项/评分” 矩阵
a) 输入:训练集 MovieLens 提供的训练样本文件 un.base 如下:
1 6 5 887431973
1 10 3 875693118
1 12 5 878542960
1 14 5 874965706
每行依次为:用户id,推荐项id,评分项,时间戳
b) 输出:U/I/R 矩阵
2、 计算用户间相似性,获得用户相似性矩阵
a) 应用“修正的余弦”相似性计算方法
b) 应用“泊松相关系数”计算方法
3、 用户相似性矩阵排序(根据相似性由高到低排序)
4、 测试集录入
5、 对每一条测试值进行估计,计算偏差
6、 计算预测效果(MAE,有效推介个数)
实验数据和结果:
1, 参数说明:
a) 选择用户900名,推荐项1600个;
b) 共有项阙值:计算用户相似度时,两用户间至少要对多少个推荐项进行评价
c) 相似度阙值:大于该值才能归为该用户的邻居
d) 相似选择个数:在估计推荐值时选择的用户个数,加权平均时使用
e) 估计值总数:符合条件的估计值总数
实验结果部分(略)
实验结果分析
相似度阙值,共有项数目阙值,加权平均推介项个数对推介的结果有比较显著的影响,相似度阙值越高,共有项数目阙值越大,加权平均推介项个数越多,推介的估计值就会越准确,但同时满足以上较好参数的用户及项目却不多。随着各参数的提高,符合推介条件的项会减少,应该设计多策略选择各个参数,以保证每个推介项对每个用户都有推介,且有较好的推介效果。
> 我来回应
这个小组的成员也喜欢去 · · · · · ·

- 数据挖掘 (2332)

- 关注豆瓣douban的智能化社... (490)

- 潘多拉 (69)

- RDF (18)

- 语义web (38)

- 用户行为分析 (3003)
> 回个性化推荐小组
最新话题:
我做的关于协作推荐的实验——为这个小组做些贡献 (咚咚咚)
依据模式的分类别预测推荐方法 (咚咚咚)
推荐系统——帮助我们认识自我 (咚咚咚)
有实际工作做这方面的吗? (shawn)
请大家关注这里 http://groups.google.com/group/resy... (clickstone)
BellKor's Pragmatic Chaos 在 Netflex Prize 改进原... (咚咚咚)
豆瓣可以给每个人推荐“我的小组”的话题 (marc)
SNS 里的推荐 (clickstone)