老李最近在后台看到很多想进入数据分析领域的朋友私信我,让我帮忙解答一些职业问题。在跟他们的交流中,我发现他们之中70%都是一无所知或刚入门的数据小白,但是都特别积极主动,是真心想学习数据分析。
他们中大部分人都不是为了转行才想学,而是觉得多学一点数据分析的技能在身上,对自己的业务是有帮助的。
问的人很多,我也没时间去一一回答,索性今天就针对数据分析中的应会工具来个盘点。
从基础到进阶,跟着老李一步步学习,哪个阶段学哪个工具,怎么学,需要学到哪种程度,让你一目了然。
入门阶段(适合数据小白)
- 1、Excel
Excel不用说了,数据分析领域入门级的工具,也是日常工作时最常用的工具。
掌握程度:
函数和公式:常用函数(逻辑、统计、查找、引用、文本、日期、数学函数等)
数据透视表:分类汇总、取平均、最值、自动筛选、会分析占比、同比、环比、定比。
*VBA程序开发:加分项,有能力的可以先学,如果时间精力不够可以到进阶阶段再学
学习书籍/网站:
《你早该这样玩Excel》、Excelhome论坛
Excelhome论坛
建议:
先跟着教程过一遍基础,知道每个函数怎么用,了解数据透视表大概怎么做,然后再去网上找几个案例跟着做,在练习中边学边练,这样效率最高。
- 2、SQL
做数据分析,SQL也是必会的工具,因为我们要利用SQL语句来取数、清洗数据。
掌握程度:
了解常用的数据库类型,学会基础的增删改查(会用 select 语句加字段,找数据;alter语句减字段;update更新数据等);熟悉掌握主键的用法;理解SQL中各种join的异同
学习书籍/网站:
《SQL必知必会》/自学SQL网(强烈推荐,不爱看书的同学可以直接在网站边学边练)
建议:
两点建议。
1、选定1-2本书和网站教程后就不要再在网上找学习资料了,这些教材足够你用,不要浪费时间在这上面
2、学完一遍后,要学会自己总结,制作自己的思维导图(像上图),加深记忆,不要用别人的总结去复习,这样学习效果不好。
- 3、Python
一般来说,有关数据分析的编程语言有Python和R语言,其中R语言倾向于统计分析、绘图,而Python偏向数据处理,实用性更高一点,所以对于新手来说,入门学Python是比较好的选择。
掌握程度:
了解学习Python基本概念
掌握并熟练使用三个库 Numpy、Pandas、Matplotlib
学习书籍/网站:
建议:
这几年Python大热,导致全网都是卖课的广告,但其实网络上有很多Python资源都够你学,不用去花那冤枉钱。按照我给你建议的学习书籍/网站去学Python完全足够。
进阶阶段(适合有一定数据基础)
- 1、BI工具
数据最终是要呈现给业务/管理层查看的,因此到进阶阶段,BI工具也是必须要掌握的一个技能。
掌握程度:
懂得如何利用BI工具去连接数据库;了解仪表盘 Dashboard 的概念,知道绝大多数图表适用的场景;明白维度和指标的区分以及一些数据的清洗。
学习工具/网站:
FineBI:FineBI帮助文档、帆软社区
PowerBI:《Power BI 权威指南》
Tableau:《人人都是数据分析师:Tableau应用实战》`
建议:
现在市面上BI工具很多,国内企业一般是用FineBI,外国企业大多数是用PowerBI和Tableau两款元老级软件,但由于是国外产品,所以对于我们国人来说有两个不方便的地方:1、帮助文档是英文的,汉化过后的意思不准备,理解和学习成本高 ; 2、无法实现国内企业复杂式报表的需求,本地化服务不佳。但不可否认,Tableau的可视化和power bi的数据处理和建模,还是很牛的。
- 2、R语言
在前文提过,R语言是倾向于统计分析、绘图,到了进阶阶段,能掌握R语言是必须的,并且这几年求职大厂时会R语言已经成了一项基本技能,需要数据分析师熟练掌握。
掌握程度:
了解R的基本使用,掌握基本数据结构,数据导入导出,简单的数据可视化。
学习书籍/网站:
《Learning R》:牢牢掌握第一章到第五章的数据基本入门,这是R最基本的东西,反复熟读都不为过。别觉得自己看懂就行了,只有自己敲出来运行正确才行。至于第六章环境和函数这一章建议先直接跳过,比较抽象,等回头R学差不多了,再回头看学习效果比较好。
建议:
R和Python都比较容易学习,但在很多地方它们非常相似,如果你同时学习两者,就会很容易混淆,所以建议不要同时学习它们。等其中一个掌握到一定的程度,再着手学习另外一个会比较好。
总结
工欲善其事必先利其器,工具的确是数据分析师的利器,但刚入门的小白很容易陷入一种误区,即我学会了这些工具,我就能成为数据分析师,这显然是理解有误。在实际工作中,想要成为一名优秀的数据分析师,光学会这些工具是远远不够的。
让自己数据分析后的结论能够落地,实际推动业务增长才是成为一名优秀数据分析师的关键。