起薪50万+就业缺口大? 快速上车这个专业!
很多从网络或者公众号收集到的相关信息,也是非常零散不成体系。
今天,就让小编给你详细解析一下,数据分析到底是学什么的!
这里,小编将跟你们共同探讨以下话题:
-
什么是数据分析?
-
数据分析专业的就业前景如何?
-
什么样的人适合学数据分析?
-
数据分析需要学习哪些工具?
拿好你们的小本本都记下来吧!
/ 什么是数据分析 /
简单来说,数据分析就是利用数据和工具来理性思考和决策的过程。
举个例子,这就像是你在沙里淘金,含金的沙子就好比大数据(Big Data),首先要用筛子不停地筛(Extract),同时用水不断地冲洗沙子(Cleaning),然后将淘剩下的金沙炼成块(Transform),最后才能得到真正有用的(Load),这也是我们常说的数据ETL过程。
/ 数据分析专业的就业前景如何 /
作为一个新兴产业,大数据正以惊人的速度增长,每天产生近2.3亿兆字节的数据,并且数据每两年至少翻一番。
麦肯锡(McKinsey)早几年前就预测过,到2020年数据工作者的岗位需求将激增,其中对于懂得如何利用大数据做决策的分析师和经理的岗位缺口将达到150万!
无论在国外还是国内,数据分析的就业前景都是非常好的,而且涉及的领域非常广,例如:市场分析、消费者行为、社会网络和情绪分析、软件系统、欺诈和犯罪检测、卫生保健、基因工程、供应链、金融、图书馆和网络安全等。
根据2020年ZipRecruiter最新职位发布,弗吉尼亚州数据分析师的年收入中位数为94,662美元,但范围差距较大,通常在20,553美元至171,278美元之间。
/ 什么样的人适合学习数据分析 /
首先,本科是计算机科学CS方面的同学,是最符合申请条件的,因为大多数像统计、微积分、编程语言等基础课都是相同的;
其次,具有工程,商业,计算机科学,统计,生物,医学,或者信息技术背景的同学都可以申请,编程零基础亦可。
/ 数据分析需要学习哪些工具 /
随着市场对数据分析的需求不断增长,开发出了许多用于数据科学目的的编程语言,其中最受专业分析人员欢迎的是Python,R,和SQL。
根据JetBrains数据科学调查显示,有近57%的受访者认为Python在未来5年内将保持领先地位。
关于数据分析的工具就是个见仁见智的事情,实在是因为专用工具太多了,从 Excel 到各式各样的编程语言。
以下是小编个人认为一个合格的数据分析师需要掌握的几种技能(其中黄色标签为必学且需熟练掌握):
Excel,BI工具,Tableau Public;
SQL,MySql,MongoDB;
机器学习(ML)
Python:尽管Python是作为通用编程语言而设计和使用的,但它仍是机器学习中最受欢迎的语言。
原生数据科学家青睐Python,因为Python具有简约,直观,易读的特点,并且拥有用于特定用途的大量的库。
在Kaggle的2017年机器学习和数据科学调查中, Python被称为最常用的工具。
R语言:R是一种统计计算语言,受到了进入ML世界的数据分析人员和统计学家的青睐。尽管以预测准确性而著称的Python在人工智能(AI)圈子中更受欢迎,但R具有统计推断的优势,仍然是数据分析师的Mjolnir!
实际上,美国银行经常使用R进行财务建模,另外前Facebook数据科学家Paul Butler就用R建立了他著名的Facebook世界地图。
SQL数据库:分析人员从关系数据库和非关系数据库中提取数据最常用的工具就是SQL。
对于数据分析师来说,能够编写结构化查询以提取数据是一项基本技能,且面试必考!
Hadoop平台:Apache Hadoop是一款软件实用程序,可帮助跨集群分布式处理大量数据。它将数据分解成文件,然后分布在群集中的各个节点上—存储由Hadoop分布式文件系统(HDFS)处理,继而再进行MapReduce。
尽管不是必需的,但了解Hadoop平台仍然是该领域的首选,且如果你拥有Hive或Pig的经验将会是面试的一个巨大卖点。
除了以上介绍的几个开源工具外,还有很多专有工具,例如用于数值计算的MATLAB,用于数据可视化分析的Tableau和Power BI。
此外,数据科学家还必须能够处理非结构化数据,像是社交媒体的视频源或者音频源啊等等,都至关重要。
不同的ML应用程序和所处的云环境,所需要的工具也会不同,这里小编就不一一阐述。