sns里面的负面反馈
妹夫最近在想论文,想做一个sns相关的东西,要我找一个理论模型。
sns目前的理论模型很多,小世界,六度分隔,等等。我提出的是一个和小世界模型有关的,也就是人群聚集不是平均的,你的大部分朋友在空间或者兴趣特征上是高度集中的。如何通过标签云快速找到可能和你有关的朋友,而不是随便推荐几个网络红人?我提出了一个预先分类+快速搜索的算法,和我以前算空间结构的一个模型很类似。
这里面又涉及到辨认训练的一个问题。我们知道贝叶斯算法,神经网络算法都需要一套训练机制,有正面的样本,也有负面的样本。但是现在我们从公开网络扒下来的信息大多是正面样本(他看过哪些作品,他有哪些朋友),而很难得到负面样本(他坚决不看哪些),训练起来实在是……照理说网站应该同时有正面和负面样本,但是我看除了google reader的feed推荐里面考虑了这个问题外,其他网站几乎没有专门搜集用户的负面兴趣样本的。
难怪现在各个sns,甚至推特推荐给我的感兴趣用户都是完全不靠谱。甚至可以说,推荐给我苍井空的那个算法,甚至根本没考虑贝叶斯里面的原本存在系数,也就是减少热门对象的权重。sns的推荐,就是广告推送的类似物,这东西关系钱途,却真没人上心啊
sns目前的理论模型很多,小世界,六度分隔,等等。我提出的是一个和小世界模型有关的,也就是人群聚集不是平均的,你的大部分朋友在空间或者兴趣特征上是高度集中的。如何通过标签云快速找到可能和你有关的朋友,而不是随便推荐几个网络红人?我提出了一个预先分类+快速搜索的算法,和我以前算空间结构的一个模型很类似。
这里面又涉及到辨认训练的一个问题。我们知道贝叶斯算法,神经网络算法都需要一套训练机制,有正面的样本,也有负面的样本。但是现在我们从公开网络扒下来的信息大多是正面样本(他看过哪些作品,他有哪些朋友),而很难得到负面样本(他坚决不看哪些),训练起来实在是……照理说网站应该同时有正面和负面样本,但是我看除了google reader的feed推荐里面考虑了这个问题外,其他网站几乎没有专门搜集用户的负面兴趣样本的。
难怪现在各个sns,甚至推特推荐给我的感兴趣用户都是完全不靠谱。甚至可以说,推荐给我苍井空的那个算法,甚至根本没考虑贝叶斯里面的原本存在系数,也就是减少热门对象的权重。sns的推荐,就是广告推送的类似物,这东西关系钱途,却真没人上心啊
还没人赞这篇日记