白夜行的日记  · · · · · ·  ( 全部 )

label re-weight & data leakage
2018-09-23 10:02:13
正负例样本分布不均匀时,常用做法是重采样、欠采样、代价函数等(更多参考Learning from Imbalanced Data)。但有时候在实际中会有这种想法,正样本之间的价值不同,是否可以构建不同价值呢?就像解决正负例样本分布不均匀一样,不同价值的正样本分布也是不一致的,是不是可以根据过往经验重构正样本呢? 答案是否定的...
1)对于特征数量、特征权重有惩罚的算法来说,是负向的。loss=predict_error + f_error(weigths),增加特征,一般是增加了f_error,导致模型variance变大。 2)对特征权重有依赖的场景,会导致不可解释性增多。 3) 如果线性特征导致了curse of dimensionality,是另外一个问题。 4)否则没什么影响。

白夜行的移动应用  · · · · · ·  ( 用过1 )

用过
  • 洋葱淘 (Android)

白夜行的评论  · · · · · · · · · ·  ( 评论2 )

  • 零售行业的购物行为分析
  • 顾客为什么购买
  • 白夜行  评论: 顾客为什么购买
    一般对比电商和线下零售时会认为电商具备分析用户的行为的制高点,具备洞 察用户的优势,这种认识在电商入门课上都被加强。在做了一年多技术分析后发现不是那么回事,线下零售虽比不上电商高效,但在理解用户上仍...
  • 《程序设计语言 第三版》
  • 程序设计语言
  • 白夜行  评论: 程序设计语言
    不知道是翻译问题还是出版社的问题,随便看了几章,发现很多语句不通的地方。 例如p527"下面我们使用Haskell的标准IO单体重新上面的例子",这句话的本意估计是"下面使用Haskell的标准IO单体重写上面的例子"。这样...

白夜行的书  · · · · · ·  ( 32本在读 · 24本想读 · 127本读过 )

在读
  • 美国纽约摄影学院摄影教材(上)
  • 专业投机原理
  • 期权、期货及其他衍生产品
  • 个人理财
  • 策略思维
想读
  • 货币、银行信贷与经济周期
  • 凸优化
  • 世界土地所有制变迁史
  • 权力
  • 国王、贤臣和弄臣

白夜行的电影  · · · · · ·  ( 124部看过 )

白夜行关注的小站  · · · · · ·

落叶无风

白夜行的广播  · · · · · ·  ( 全部 )

白夜行常去的小组(52)  · · · · · ·  ( 全部 )

约伴旅行-摄影聊天交友搭车旅游
约伴旅行-摄影聊天交友... (473788)
智慧旅行箱:旅游生活省钱专家团
智慧旅行箱:旅游生活... (134378)
互联网创业2.0
互联网创业2.0 (140110)
创 想 国 ☆ 原创联盟&创意资源
创 想 国 ☆ 原创联盟&... (127316)
我是测试狂
我是测试狂 (283475)
国际设计杂志交流馆
国际设计杂志交流馆 (128316)
创意生活
创意生活 (180861)
豆瓣排行榜
豆瓣排行榜 (203061)

本页永久链接: http://www.douban.com/people/lkqy/

订阅白夜行的收藏:
feed: rss 2.0