数据分析

养鸭专业户
来自: 养鸭专业户 (长春) 2017-12-14创建   2021-02-04更新
2 人关注
1
来自:www.zhihu.com
0人喜欢
题主是个web程序员,最近想转去做数据分析,先练习的爬虫(python),各种爬取技巧以及多网站爬取等已经掌握,但发现转方向最无奈的是方向(要抓什么数据来干什么)比较迷茫,希望有前辈给予指导,哪些网站的数据抓取下来能获得有分析价值的数据,或者前辈的经验。 ...
2
来自:www.zhihu.com
0人喜欢
准备学习python爬虫。各位大神都会用爬虫做哪些有趣的事情? 今天突然想玩玩爬虫,就提了这个问题。跟着YouTube上的一个tutor写了个简单的程序,爬了一点豆瓣的数据。主要用到request和bs4(BeautifulSoup)模块。虽然简陋,毕竟是人生中的第一只爬虫啊……以示纪念...
3
来自:豆瓣读书
8.6 (70人评价)
作者: (新加坡) Sau Sheong Chang
出版社: 人民邮电出版社
出版年: 2013-3
4
来自:豆瓣读书
9.4 (279人评价)
作者: Jake VanderPlas
出版社: 人民邮电出版社
出版年: 2018-1-20
5
来自:豆瓣读书
(10人评价)
作者: Osvaldo Martin
出版年: 2018-2-1
6
来自:豆瓣读书
7.2 (115人评价)
作者: 唐亘
出版社: 人民邮电出版社
出版年: 2018-5-8
7
来自:豆瓣读书
9.0 (149人评价)
作者: Wes McKinney
出版社: O'Reilly Media
出版年: 2017-9-25
8
来自:豆瓣读书
9.3 (23人评价)
作者: Rob J Hyndman / George Athanasopoulos
出版社: OTexts; 2 edition
出版年: 2018-5-6
10
来自:豆瓣读书
8.9 (52人评价)
作者: Marcos Lopez de Prado
出版社: John Wiley & Sons
出版年: 2018-2-22
11
来自:opendata.pku.edu.cn
0人喜欢
现在就开始 搜索 37 个数据空间和 236 个数据集
12
来自:github.com
0人喜欢
A topic-centric list of HQ open datasets in public domains. PR ☛☛☛ - awesomedata/awesome-public-datasets
评语:免费的公共数据集汇总
回复
13
来自:豆瓣读书
8.7 (16人评价)
作者: Gilbert Strang
出版社: Wellesley-Cambridge Press
出版年: 2019-1-31
14
来自:豆瓣日记
王凿 828人喜欢
一晃眼,那场大火和那次行动已经是前年的事情了。一开始,我的确是有应该做点什么的愿望,但随着一些事情对信心的打击,也便陷入了沉默,最后只是在附近的清退点走了走、看了看。与那相关的诸多事情,已经没有什么好说的了,蹭冷点并不能令人愉快。 但一个关于事实的问题——到底请走了多少人——却在任何地方都找不到准确说法。有的媒体称上百万人受到影响,有的媒体说十几万人,而官方公布的数据主要是针对火灾隐患,因此而疏解离京的人口一直没有准确统计。 对于当时仍然在读大二的我来说,非首都功能疏解、流动人口、城中村之类的问...
15
来自:豆瓣日记
不服不忿 20人喜欢
经济学关注因果推断,机器学习有一部分任务是预测,两者结合,经济学里叫机器学习在经济学中的应用,机器学习领域叫因果机器学习,当然causal本身就是bayes领域的。总之,两部分内容混在一起了,有新的方向了。另外要注意,要加上text mining这个领域,也叫NLP。(这段里的术语就能看出刚有这个方向,术语混乱,浑水好摸鱼)查文献过程中,发现了还有个词儿计算社会科学,还有图(网络) 因果推断,接着又发现一个词儿 text as data ,有两本杂志可能有有趣的文章 : JASA, Journal of Causal Inference 。敏感政治学作者: Margaret E. Roberts 重要经济学作者 : Susan Athey 05.27.2019增加 1. Heterogeneous Effects of Poverty on Cognition 这篇用了异质性因果森林,...
16
来自:豆瓣读书
(4人评价)
作者: Judea Pearl / Dana Mackenzie
出版社: Penguin
出版年: 2019-5-2
17
来自:豆瓣日记
飞龙 1人喜欢
内容来自 [DataSciComp],人工智能/数据科学比赛整理平台。 Github:[iphysresearch/DataSciComp] 本项目由 [ApacheCN] 强力支持。 [微博] | [知乎] | [CSDN] | [简书] | [OSChina] | [博客园] [全球城市计算AI挑战赛] 3月19日 - 4月11日, 2019 // Host by [天池] // Prize: ¥300000 Note: 大赛以“地铁乘客流量预测”为赛题,参赛者可通过分析地铁站的历史刷卡数据,预测站点未来的客流量变化,帮助实现更合理的出行路线选择,规避交通堵塞,提前部署站点安保措施等,最终实现用大数据和人工智能等技术助力未来城市安全出行。 [Histopathologic Cancer Detection] Novenber 16, 2018 - March 30, 2019 // H...
18
来自:豆瓣读书
(10人评价)
作者: 罗炳森
出版社: 人民邮电出版社
出版年: 2018-4-1
19
来自:豆瓣读书
(7人评价)
作者: Charu C. Aggarwal
出版社: 机械工业出版社
出版年: 2018-7-24
20
来自:豆瓣读书
8.0 (208人评价)
作者: [美] 马特·厄普森 / [美] C.迈克尔·豪尔 / [美] 凯文·坎农
出版社: 后浪丨四川文艺出版社
出版年: 2019-7
21
来自:jalammar.github.io
0人喜欢
The Illustrated BERT, ELMo, and co. (How NLP Cracked Transfer Learning)The year 2018 has been an inflection point for machine learning models handling text (or more accurately, Natural Language Processing or NLP for short). Our conceptual understa...
22
来自:slides.yihui.name
0人喜欢
class: center, middle, inverse, title-slide # Presentation Ninja ## ⚔ with xaringan ### Yihui Xie ### 2016/12/12 (updated: 2019-02-07) --- background-image: url(https://upload.wikimedia.org/wikipedia/commons/b/be/Sharingan_triple.svg) ??? Image credit: [Wikimedia Commons](https://commons.wikimedia.org/wiki/File:Sharingan_triple.svg) --- class: center, middle # xaringan ### /ʃaː.'riŋ...
评语:PPT - Ninja
回复
23
来自:豆瓣读书
9.2 (25人评价)
出版年: 2016-8-11
24
来自:豆瓣读书
9.2 (23人评价)
作者: 刘健 / 邬书豪
出版社: 机械工业出版社
出版年: 2019-7-1
25
来自:豆瓣日记
飞龙 1人喜欢
内容来自 [apachecn/awesome-data-comp-solution],由 ApacheCN 团队维护。 欢迎任何人参与和完善:一个人可以走的很快,但是一群人却可以走的更远 [ApacheCN 学习资源] [ApacheCN 机器学习交流群 629470233] 结构化数据/时间序列 2019 CCF 乘用车细分市场销量预测 EDA: [http://lambda-xmu.club/2018/08/27/2019CCF-Car-Sales-EDA/] Baseline 0.488: [https://zhuanlan.zhihu.com/p/79940352] Baseline 0.511: [https://blog.csdn.net/weixin_43593330/article/details/100175414] 2019 CCF 离散制造过程中典型工件的质量符合率预...
<前页 1 2 后页>

什么是豆列  · · · · · ·

豆列是收集好东西的工具。

在网上看到喜欢的,无论它是否来自豆瓣,都可以收到你自己的豆列里,方便以后找到。

你还可以关注感兴趣的豆列,看看其他人收集的好东西。

这个豆列的标签  · · · · · ·

养鸭专业户的其它豆列  · · · · · ·  ( 全部 )