转行数据分析真难,终于入职了,被裁了!
来自: Ooo〇~
7月初入职本地互联网大厂,颤颤巍巍去上班,大小周,为了上岸拼了! 我是如何进入数据分析岗,在家学sql增删改查,碰上初创公司招聘,hr迷迷糊糊就招了我。一边工作一边学习,再把知识用到工作中,用到sql连接两张数据表,Python处理百万行数据,思路就是做大型数据透视表。工作没有人带,自己一步一步摸索出来的工作方法,所以特别想进入团队跟着大佬。初创公司快倒闭了,我就裸辞出来了。 裸辞后认真学了mysql二级,就是要多写多练,以前连select group by都不会拼,碰上手写代码笔试就死翘翘,再认真捋了一遍Python基础。我发现不管做什么行业先打牢基础,初级岗位要求不会很高,基础牢才能继续升级打怪。 面试数据分析岗要求会使用sql和python,由于我之前的工作使用过sql和Python面试很快通过了,不要求笔试,过几天就拿到offer了。 入职一个多星期,前辈都是些刚毕业的小年轻,我已经毕业好几年了,转行一年,要虚心学习。前辈先让我熟悉一下报表,用sql做多表连接,给了几次练习作业,难度暴增。第一个是简单报表,写了一个下午,挺简单的;第二个是日报,分为好几个模块,每个模块查出6张表再连接,总共写了300行代码,再导出Excel做图,为了赶时间后面几个模块没有做多表连接,做图调格式也很费劲。sql基本上是select join on,同事没有教我写sql,因为前几次练习写得不错没必要教了。 Python还没开始用……
2021.7.14
------------------------------------------分割线
开始写Python了,用plt写周报图,sql代码前辈已经分享给我了不用自己写,直接导表就行。有条形图、散点图、环形图三种,组合成十几页的周报。写日报用Excel来展示调格式太时间,所以要求用Python做图。唉,一天下来才写了一张条形图和散点图的组合图,可以作为模板写后面的图,明天写环形图,再把它们组合子图。
来了个数据开发实习生,很年轻像是00后,组长亲自指导,我瞄到了实习生写Python,具体写什么没仔细看。有机会抓她来盘问盘问。数据开发好像是DBA。
2021.7.15
分分分分割割割割线线线线一一一一一一
好多人了问我怎么学怎么找工作,那就详细说说吧。学了7个月
sql:学基础select,还有计算机二级mysql,里面包含了数据库基础知识,建表建库、视图、触发器、函数、PHP,面试可以说学过但不常用。有条件的可以考个全国计算机三级数据库或者软考。面试前去做一遍sql面试50问,手写代码。
Excel:vba,power query,地图,数组,动态图表,仪表盘。
bi:powerbi或者findbi,有公司招聘要求会这两个软件,但是我没拿到面试机会不了解怎么面试。
Python:小甲鱼基础课程,搭配课后练习,想死的心都有了,太难了。数据分析三部曲np、pd、plt上网学,再看《利用Python进行数据分析》,我看了两百多页。同样可以去考Python的证
统计学:大家都忽视了统计学,面试一定会问到的,问题比较简单不用怕,平均数中位数方差标准差。我在mooc上完了统计学基础课程,并且复习了一轮。
找工作:我没有特意去找互联网大厂的工作,只要有公司叫我去上班我一定会去的。互联网中小公司招聘有做大数据分析的,大数据就很难了用到算法,基本上不会有面试机会。也有传统企业岗位,企业有线下连锁店或者网店,每天产生数据但是不是非常庞大,就需要有人做整理汇报,这种门槛比较低,更偏向于经营分析。互联网电商大厂会机会比较多,离职率高,招挺多实习生的,年轻人可以去试一试。
分割线——————————————————————————
大小周终于结束了,周报拿了同事的脚本直接导出数据,一头闷plt做表,时间来不及,拿了同事的Excel模板来做图,核对数据眼睛都要瞎了,还是自己写的好。
同事问我为什么不上Python刷数据,会更快。我……连过数据库,可是好复杂啊,于是上网学习搞了几个库pymysql,sqlalchemy,pandas,测试一下能导出表。这是最简单的导出方法了,不用关闭游标之类的啰啰嗦嗦。
问同事怎么在Python刷数据库,他说写个for循环一条条读出来成一个个元组。我才懒得写for循环呢,数据分析就应该用pandas。前辈用Python的需求就是办公自动化,自动导表生成日报周报这些经常性事务,可以实现,只是要费点心思。
2021.7.17
-----------------------------------------------------------------------------------
真是炸裂,尴尬得脚趾抓地,组长看了我写的sql运行太慢了,教我优化,还把我写的sql发到群里公之于众,拉出来鞭尸。我就是套娃套娃,没用上索引,查表能花10分钟。别人写的sql都点了美化,我看着晕。上网搜sql套娃,第一张表受尽折磨,哈哈哈真实。
2021.7.21
————————————————————————————
组长突然跑来问我怎么用Python查一年的数据,被问懵逼了,还好我以前做过类似的合并数据。用Python写for循环,把变量套进sql里面挨个运行,再挨个合并,不知道这么写对不对,够不够简便。sql不能直接查整年的数据,数据量太大要运行很久,查一个月才用几十秒,查一年一个小时都查不出来。在Python查过一次大的表被强制退出了。
还问我是否了解数据仓库,真不了解,答非所问,只是感觉同类的表哪个数据库都要它,是不是数据冗余?今天上网搜了数据仓库ods、dw、dm的意思,数据库就是这么命名的,居然到现在才发现,仔细翻了里面的表确实是这个结构。大多数教sql的课程都不会涉及这个理论。ods是最简单直接的业务数据,dw是数据的整合拓展,dm库大多是统计数据(计算订单量销售额求和计数)。
2021.8.18
工作危,裁员,快下岗了,抓紧时间刷技能。
2021.8.29
------------—————————————————————————
一个同事辞职了,还得缩一个,危险。9月工作运势不好,与领导关系也不好,具体怎么不好我也说不上来,就是占卜运势不好。
数据越来越多,导出数据有时候连一个月的都查不出来,要分上半月下半月查,数据汇总又不能分拆上下月,只能全部导出拉到本地Python处理。sql脚本已经写好,就是运行不出来。没用Python写过两层合并订单信息,平常都是用sql写的,摸了好久,紧张着急,一惊一乍的,终于在下班前做好数据了。
领导安排我做一张大表,一个劲问我什么时候做好,好怕返工,导出数据要几个小时。Excel的最大行都放不下一个月的数据,需要分表,捣鼓了390M的数据,领导的电脑打不开,哈哈哈,换了一台勉强打开。一天下载了4百万条数据,真怕组长拉我出来鞭尸,还好鞭的是其他同事。最后数据通过了!
2021.9.3
转正了。有问题问同事得到的答案都很笼统,不能解答,不想再问了,不知道是他们不想回答还是本来表达不清,直接去问组长更快。
脚本写得多,处理数据更得心应手,还是得多练。
10.12
~~~~~~~~~~~~~~~~~~~~~~~~~
同事被裁员了,同期就剩我一个人了,交接给我几个月报表。天呐,11月1号还是星期一要出周报,最怕数据库没更新完,写报表写到一半发现更新了我的数不对。每天沉浸在自己的世界里,时间过得很快。
下个月出报表,需要在2天内做完二十几张报表,不知道以前其他部门写这些表需要多久,反正对我来说挑战巨大。从8号左右接到任务要做,晚上回家再复习Python基础和学vba。目前要写三套程序大概有1000行,一个是导数的,一个是本地整理数据,一个是Excelvba改数改格式。每天都很头晕,要对数整理前几个月的数据,因为报表用到环比,前几个月的数据翻车整份报表都会翻车。还有跟领导确定取数逻辑,天天来问我写得完吗?哦嚯,还有1天时间,Python部分写完了,还在折腾vba。
导数部分就是sql,有个sql特别头疼,查一个月查不出来,需要按天查,再合并。本地部分特别繁琐连表merge写了28个,把sql的表合并,生成大表来检查,发现有错就改下载的数据,绝对不能改生成的大表,因为下个月不会引用大表的数,改了也是白搭。拆分成二十几个城市表,数据基本上取完了,vba用来美化和改一点Python难改的地方。不推荐用openxlpy操作Excel,一是看不见表的样子,二是功能太少。
从刚入职写Python憋好久写不出几句,到现在能处理各种报错。报表的Python代码没有太多嵌套,能运行就不错了,以后有时间再优化代码吧。
2021.10.31
入职半年了,11月初换了新领导,磨合中,领导交代的事情能顺利做完,挺满意的。日常工作越来越多,表格越来越琐碎,时常忘记发报表,所以简单的日报周报表交给Python自动生成,再自动发邮件。
最近在重学Python,常学常新,感概当时不理解的知识现在有点开窍了,阅读代码没有以前那么吃力。建议大家入门后去看官方文档,转中文版基本能看懂。pandas官方文档是英文,配合翻译软件食用。
准备招新,招聘要求是工作能力跟我一样的,我去当面试官了,刚刚出好面试题(不要问我题目是什么,但凡你们把知识学完都能答对),基本上是我工作中遇到的难题,全部答对就能做数据运营了。题目分Excel、sql、Python三大块,基本上是上面说的“我如何学数分”用到的知识,基础要扎实。
我总觉得自己会的别人也理所当然地会,面试看看是不是这样。
2022.3.11
公司高层对数据分析认知不足和狭隘,无法认同有代码+统计学+财务的人出现,他们天然地认为会分析和会处理数据的不能是同一个人。分析手段仅关注如何利用做财务分析。其实报表的财务分析大而粗,时间滞后,不适用公司内部的精准运营。真正做到精准运营的是经营分析,对公司全方位多角度深入观察,提出建议。AARRR模型、RFM模型、漏斗模型这些经典模型都没做过。所以,我在公司是无法出头,无法升职加薪。在数据处理方面已经得心应手,在分析方面是一片空白,我变成一个孤岛,没有人能交流,心里很压抑,有一股怨气无法发泄。公司的薪资福利待遇休假全部跟不上,我就是个可有可无的高级取数工具人,打算在今年离开。
入职一年后有新的感悟,数据分析不仅仅是写代码数据处理,还要结合统计学、经济学、线性代数、高数。如果你学习一个领域的知识很迅速,那就深耕下去。一年里我的成长很快,越学感觉越无知,有更广阔的领域等待我去探索。
非常感谢大家收藏。
2022.6.9
最赞回应
你的回应
回应请先 登录 , 或 注册相关内容推荐
最新讨论 ( 更多 )
- 什么工作适合比较单纯内向、不喜欢发生矛盾的人 (云吸昀)
- 把前男友挂了,不知道他工作会不会受影响? (momo)
- 大环境不好是真的吗? (momo)
- 今天被同事开黄腔了 (momo)
- 腾讯非技术岗内推,感兴趣的uu来投 (coco)