年终总结 & 算法数据的思考 & 结尾彩蛋

飞林沙 飞林沙 2014-12-18 05:49:43
Ruby姐姐
2014-12-18 07:08:45 Ruby姐姐

lz肤白貌美,按女友数量算处于工程师鄙视链最高塔尖,而且是年终奖之前就离职的人生赢家,欢迎各位HR前来勾搭~#彩蛋我认为就是变相约HR的,出来约也不留个微信,差评!#

就是想改个名字
2014-12-18 07:31:58 就是想改个名字 (我真的要减肥了)

mark~新人表示帮助很大

饭团
2014-12-18 07:45:23 饭团 (forever alone.)

「对于小部分用Clojure的初创公司」

真爱。

Breakthen
2014-12-18 08:34:48 Breakthen

虽然没读,但是觉得写的挺好,毕竟这么多字儿呢。撸主不在珍爱网了?

红色有角F叔
2014-12-18 08:59:43 红色有角F叔 (次元の呪い)

「对于小部分用Clojure的初创公司」

233

207
2014-12-18 09:09:25 207 (已注销)

我以为我会看到。第一,宫斗的战略总结 第二,上峰对职业的帮助 第三,娶谁都不要娶HR 第四,title和offer的balance关系

Silvery
2014-12-18 09:15:02 Silvery (autumn leaves)

face++就是以deep learning为主力工具的..

white
2014-12-18 09:18:19 white (diaper changer)

沙沙对大数据和深度学习的理解深得我的共鸣!!
还有好多其他理解也应该是好多坑以后的体会吧,现在还不能理解,加油!!

liupc
2014-12-18 09:23:53 liupc (造化徒设庸人计)

我们是不是有希望在回归贝叶斯学派,利用先验信息+小数据完成对大数据的反击呢?
——————————————————————————————————————
抛开技术和业务细节不说,个人认为相比较于频率学派,套用一个时下已经被庸俗化的词来讲,贝叶斯学派要『优雅』得多。大数据主要依赖机器干活,小数据要想把事情干好,对人有更高的要求。数据的工作,只要还要人来做,迟早都是贝叶斯学派的天下。

飞林沙
2014-12-18 09:45:39 飞林沙 (此账号吐槽的方法已被注释)
face++就是以deep learning为主力工具的.. face++就是以deep learning为主力工具的.. Silvery

IR领域我是赞同的

Shawn
2014-12-18 09:51:50 Shawn (处世若大梦,胡为劳其生)

9. ........

考虑实际影响,已经删除彩蛋


————————————————就是冲着彩蛋来的啊啊啊!!!

1030
2014-12-18 09:55:22 1030 (鱼会哭)

lighting lda给个出处吧~~搜索不到啊~~

飞林沙
2014-12-18 09:58:59 飞林沙 (此账号吐槽的方法已被注释)
lighting lda给个出处吧~~搜索不到啊~~ lighting lda给个出处吧~~搜索不到啊~~ 1030

http://arxiv-web3.library.cornell.edu/pdf/1412.1576v1.pdf LightLDA,打错,抱歉

1030
2014-12-18 10:01:23 1030 (鱼会哭)

哈哈,多谢!

严酷的魔王
2014-12-18 10:10:58 严酷的魔王 (少年心事当拿云)

lab就有人在做deep learning对推荐的尝试

yoyo
2014-12-18 10:12:34 yoyo

没看到彩蛋,不开心 (>.<)

masque
2014-12-18 10:24:55 masque (哈?)

写得真棒!

p.s.Twitter换到了java和scala,主要确实就是为了效率和稳定性

Ruby姐姐
2014-12-18 10:25:11 Ruby姐姐

竟然删了彩蛋!所以你根本不是要找工作的!

北京卖盘的
2014-12-18 10:39:30 北京卖盘的 (Make Douban Great Again)

yp贴,鉴定完毕~

lanhero
2014-12-18 10:44:24 lanhero (闲来山上看野水,忽于水底见青山)

1 推荐系统:关于推荐系统。我觉得推荐系统和很多机器学习算法的不同的地方,就是他极其依赖于产品,没有产品就没无法谈推荐系统。至于推荐算法,往往并没有外人想象的那么复杂。几个简单的算法就可以满足大多数推荐产品80%的需求,怎样把简单的算法适应于产品的数据,适用于产品的需求,也许才是最重要的。推荐系统只是整个产品的一部分,像淘宝等电商我觉得是适合做个性化的,只不过是个性化应该处于产品的什么位置而已。

2 大数据:我并不认为大数据和贝叶斯之间有什么必然联系,更不是说大数据了就是频率学派的天下,贝叶斯和频率的争论一直都在。贝叶斯为模型赋予了漂亮的概率解释。大数据后,仍然有不少贝叶斯的方法很流行,比如LDA.

Idealism
2014-12-18 12:24:28 Idealism (Serenity)

撸主,我就是拉下来看彩蛋的!!差评!!

nelson.MKⅡ
2014-12-18 12:26:38 nelson.MKⅡ (我很烦)

楼主听说过TX GDT么?(安利式推销。

王实
2014-12-18 12:52:40 王实

淘宝搜索也是个性化的,主要是在一下宽泛搜索词上,举一个简单的例子,比如你搜索“大衣", 女性用户看到的搜索结果都是女式的大衣,男性用户看到的都是男式大衣,当然还有跟复杂的场景。

超元气魔法少女
2014-12-18 13:05:15 超元气魔法少女 (点笔书命。)

还没看到彩蛋就删了。。

CodeDog
2014-12-18 13:05:51 CodeDog (信仰是你为之服务)

我勒个去,说好的彩蛋呢!伐开心啊...

叶卡捷琳娜
2014-12-18 13:17:58 叶卡捷琳娜 (Brave.)

mark

睡沙发の小禹
2014-12-18 13:45:49 睡沙发の小禹 (职业睡沙发)

我是文中那个Clojure的!黑我吧!我们还有Erlang!

懒惰啊我
2014-12-18 13:57:57 懒惰啊我

其实用CTR做商品推荐我觉得算是个主流趋势吧 主要在于商品和电影本质的区别导致其不适用CF?
今年的recsys比赛给的数据,就连用户都没给,只给了session,得,活脱脱一个CTR特征大赛。

另外deep learning这个我给大家讲个小插曲。开会Kai Yu问Eric Xing,deep learning能不能代表大数据,Eric Xing说DL充其量只是ML众多方法的一种,而大数据是我们的研究对象,怎么能拿到一起说事。
然后就看到Eric Xing的长文访谈,把weibo机器学习公知对deep learning的吹捧以及对其他机器学习研究领域的打压现象黑了一遍。

暖言巷陌
2014-12-18 14:46:18 暖言巷陌 (无穷远方 无数的人 都和你我有关)

只为了彩蛋而来的同学表示受到了伤害……

蓝颜爱
2014-12-18 18:09:55 蓝颜爱

卤煮的蛋蛋呢

横渠居士
2014-12-18 19:39:49 横渠居士 (机器学习 优化 并行计算)

年底了,给个好评!

村有大树
2014-12-18 21:18:24 村有大树 (一步一莲花。)

学生党不能感受再多,谢分享!

kidult
2014-12-19 02:47:09 kidult

Deep Learning 的模型不是只是处理特征提取工作。DNN模型也不只是有处理图像的CNN一种。涉及到推荐系统我不懂,但只要数据量够大就可以找出来人发现不了的特征。

我
2014-12-19 10:57:33 (庸人)

我是来看彩蛋的。

UB
2014-12-19 15:00:22 UB (那又如何)

呵呵,跟我的感觉大多数相同。稍作补充,
1,你辛辛苦苦做了算法模型,搞出Top20的推荐项,结果产品经理说,给我留15个广告位,谁给钱谁上。
2,深度学习对于非传统的ML研究领域,不一定适用,我也做过些实验。因为Deep Learning为什么能work,至今还是个迷。另外,我认为深度学习的能力还未完全发挥出来。
3,大数据本身是个伪命题,怎么严格区分大数据与小数据?对于一个严谨的技术人员来说,基本无意义。
4,对于机器学习的同行,技术方面建议考虑一下函数式编程,比如Scala,代码量可以比传统方法少一倍以上。
5,我很看好互联网模式在医疗健康行业的发展,我相信未来几年的会有很大变化,也会造就很厉害的公司,现在腾讯,阿里等已经出手了,别的公司现在上还不晚。这个行业的变化会超过你说的O2O,互联网金融,互联网教育等行业。原因在我的新浪微博上有说明。

Aron
2014-12-19 21:26:43 Aron (呵呵呵呵)

度厂实习几个月,深有同感~~

ps,说好的彩蛋呢~

camino
2014-12-21 17:49:20 camino (吾爱真理,但吾更爱吾喵)

诚恳的好文章,深以为然

海中枫叶
2014-12-23 17:28:09 海中枫叶 (弱到爆时呆,二到深处萌)

整体很棒的文章,对于数据工程师的现状和未来,总结得很好,分析得很透。就是在deep learning那里关于特征数的说法感觉不太赞同,原始特征可能不多,但是特征各种线性非线性的组合就可以无数种了,更多的还是有没有足够的样本来支撑这么多特征的训练,所以deep learning和大数据是相辅相成的。

刚洗了热水澡
2014-12-25 17:24:49 刚洗了热水澡 (你心里暖洋洋,我背后凉飕飕)

恩,lz在哪里工作呢。
我也在学推荐系统,是算法比较重要还是啥呢,对于推荐系统,算法也不外乎降维、cf罢了。
可能数据挖掘和机器学习算法更多吧,lz觉得推荐系统的算法最近会有啥大的突破吗?

飞林沙
2014-12-25 18:23:43 飞林沙 (此账号吐槽的方法已被注释)
恩,lz在哪里工作呢。 我也在学推荐系统,是算法比较重要还是啥呢,对于推荐系统,算法也不外乎 恩,lz在哪里工作呢。 我也在学推荐系统,是算法比较重要还是啥呢,对于推荐系统,算法也不外乎降维、cf罢了。 可能数据挖掘和机器学习算法更多吧,lz觉得推荐系统的算法最近会有啥大的突破吗? ... 刚洗了热水澡

其实对于算法重不重要这个东西我觉得是看个人爱好,总能找到推荐算法重要的公司,也总能找到产品重要的公司。诚然如楼上@lanhero所说,简单的推荐算法就能满足80%的需求,但是总有些公司是值得做剩下20%的。

我觉得本质突破不会有,细节的调整还是一直在的.....

jzyer
2014-12-27 15:57:07 jzyer

推荐算法是因为信息过剩才出现的,淘宝那么多商品,为了解决曝光率问题必然会做推荐;
实际上个性化推荐出现的初衷就是为了解决长尾问题。因此,不能说不合适,只是在利益面前妥协了,只是作为一个辅助的手段,没有发挥太大的价值。

马孔多
2014-12-27 22:05:55 马孔多 (Cedar 直待凌云始道高)

很诚恳,大部分同意

亚里士多多
2014-12-27 22:43:48 亚里士多多 (香蕉不那呢)

虽然看不明白,感觉很厉害的样子

天妒奉孝
2014-12-31 08:28:19 天妒奉孝

东拼西凑的抄这么多也是辛苦你了,只是你真的以为逛豆瓣的都是不上CSDN这些网站的么?要点脸吧,否则我举报你了

飞林沙
2014-12-31 14:30:57 飞林沙 (此账号吐槽的方法已被注释)
东拼西凑的抄这么多也是辛苦你了,只是你真的以为逛豆瓣的都是不上CSDN这些网站的么?要点脸吧, 东拼西凑的抄这么多也是辛苦你了,只是你真的以为逛豆瓣的都是不上CSDN这些网站的么?要点脸吧,否则我举报你了 ... 天妒奉孝

我还真不上CSDN,不用否则啦,欢迎举报

marsmars
2015-01-12 15:29:10 marsmars (走着,看着,想着~)

文章写的很落地,赞一个

绿野萍踪
2015-08-23 16:41:30 绿野萍踪

小生在这里留言,本人想从雷达目标识别转机器学习,希望各位大牛推荐学习进阶路线。感激不尽

我不是马甲
2015-09-04 00:09:53 我不是马甲 (晚来天欲雪,能饮一杯无。)

表示最近在看项亮的推荐系统,想找推荐系统的工作,获过数学建模国奖,可是依然压力山大

笑笑
2015-10-01 07:23:34 笑笑 (时间慢点走)

沒看得太惡魔

除你武器
2015-10-20 18:11:30 除你武器

然而淘宝现在确实在首页做了个性化推荐


飞林沙
飞林沙 (广东深圳)

记录一些话以随时警醒自己: A 看起来很有力的吐槽,其实真的会很有力地...

热门话题  · · · · · ·  ( 去话题广场 )