万古长空的日记
来自:豆瓣日记
这期广告外投针对抄底流量进行了一期优化,最终的技术方案使用MinHash聚类。Minhash计算得到的相似度逼近Jaccard相似度sim(A, B)=k/(m+n-k), m是A的特征个数,n是B的特征个数,k是A与B交叉的特征个数。一般使用时,会设置100个不同Hash函数进行计算,这100个Hash函数...
什么是豆列 · · · · · ·
豆列是收集好东西的工具。
在豆瓣上看到喜欢的内容,都可以收到你自己的豆列里,方便以后找到。
你还可以关注感兴趣的豆列,看看其他人收集的好东西。