我做的关于协作推荐的实验——为这个小组做些贡献
来自: 咚咚咚(John,一路走好)
这是去年10月做的实验,篇幅有限,不能实验结果。若需要更多的实验数据和源程序可与我联系,希望能抛砖引玉,与有相同爱好和兴趣的朋友多交流,共同进步。 实验目的: 1、 设计并实现基于协作的项目评分预测系统 2、 用户相似程度计算分别采用 a) 修正余弦相关度计算方法 b) 皮尔森相关性计算方法 3、 根据实验结果论证各参数(相似度阈值,邻居共有项数目阈值,加权平均相似项阈值)对于推荐结果(MAE)的影响,分析原因 注:数据集由MovieLens提供 实验步骤: 1、 根据 训练集 构造 “用户/推介项/评分” 矩阵 a) 输入:训练集 MovieLens 提供的训练样本文件 un.base 如下: 1 6 5 887431973 1 10 3 875693118 1 12 5 878542960 1 14 5 874965706 每行依次为:用户id,推荐项id,评分项,时间戳 b) 输出:U/I/R 矩阵 2、 计算用户间相似性,获得用户相似性矩阵 a) 应用“修正的余弦”相似性计算方法 b) 应用“泊松相关系数”计算方法 3、 用户相似性矩阵排序(根据相似性由高到低排序) 4、 测试集录入 5、 对每一条测试值进行估计,计算偏差 6、 计算预测效果(MAE,有效推介个数) 实验数据和结果: 1, 参数说明: a) 选择用户900名,推荐项1600个; b) 共有项阈值:计算用户相似度时,两用户间至少要对多少个推荐项进行评价 c) 相似度阈值:大于该值才能归为该用户的邻居 d) 相似选择个数:在估计推荐值时选择的用户个数,加权平均时使用 e) 估计值总数:符合条件的估计值总数 实验结果部分(略) 实验结果分析 相似度阈值,共有项数目阈值,加权平均推介项个数对推介的结果有比较显著的影响,相似度阈值越高,共有项数目阈值越大,加权平均推介项个数越多,推介的估计值就会越准确,但同时满足以上较好参数的用户及项目却不多。随着各参数的提高,符合推介条件的项会减少,应该设计多策略选择各个参数,以保证每个推介项对每个用户都有推介,且有较好的推介效果。
你的回应
回应请先 登录 , 或 注册相关内容推荐
最新讨论 ( 更多 )
- 今日头条个性化推荐问卷调研 ('Skyler)
- 非技术型产品经理如何着手学习个性化推荐? (王小杰在地球)
- 如果豆瓣提供这样一个服务,大家会选用吗? (clickstone)
- 北京知名互联网公司招聘资深推荐算法工程师 (船长)
- 刚工作几个月的毕业生的吐槽 (我不是马甲)