可能对于很多同学来说,数据分析还只是个模糊的概念,甚至并不了解这个专业具体是做什么的。
今天,就让小编给你详细解析一下,数据分析到底是学什么的!
· 什么是数据分析?
· 数据分析专业的就业前景如何?
· 什么样的人适合学数据分析?
· 数据分析需要学习哪些工具?
/ 什么是数据分析 /
简单来说,数据分析就是利用数据和工具来理性思考和决策的过程。
举个例子,这就像是你在沙里淘金,含金的沙子就好比大数据(Big Data),首先要用筛子不停地筛(Extract),同时用水不断地冲洗沙子(Cleaning),然后将淘剩下的金沙炼成块(Transform),最后才能得到真正有用的(Load),这也是我们常说的数据ETL过程。
/ 数据分析专业的就业前景如何 /
“在快速逼近的技术新时代,核心是数据。与数据有关的能力,将变得非常有价值。”
-- 马云在美国财经媒体CNBC采访时说
作为一个新兴产业,大数据正以惊人的速度增长,每天产生近2.3亿兆字节的数据,并且数据每两年至少翻一番。
麦肯锡(McKinsey)早几年前就预测过,到2020年数据工作者的岗位需求将激增,其中对于懂得如何利用大数据做决策的分析师和经理的岗位缺口将达到150万!
无论在国外还是国内,数据分析的就业前景都是非常好的,而且涉及的领域非常广,例如:市场分析、消费者行为、社会网络和情绪分析、软件系统、欺诈和犯罪检测、卫生保健、基因工程、供应链、金融、图书馆和网络安全等。
根据2020年ZipRecruiter最新职位发布,弗吉尼亚州数据分析师的年收入中位数为94,662美元,但范围差距较大,通常在20,553美元至171,278美元之间。
/ 什么样的人适合学习数据分析 /
首先,本科是计算机科学CS方面的同学,是最符合申请条件的,因为大多数像统计、微积分、编程语言等基础课都是相同的;
其次,具有工程,商业,计算机科学,统计,生物,医学,或者信息技术背景的同学都可以申请,编程零基础亦可。
/ 数据分析需要学习哪些工具 /
随着市场对数据分析的需求不断增长,开发出了许多用于数据科学目的的编程语言,其中最受专业分析人员欢迎的是Python,R,和SQL。
根据JetBrains数据科学调查显示,有近57%的受访者认为Python在未来5年内将保持领先地位。
关于数据分析的工具就是个见仁见智的事情,实在是因为专用工具太多了,从 Excel 到各式各样的编程语言。
以下是小编个人认为一个合格的数据分析师需要掌握的几种技能(其中黄色标签为必学且需熟练掌握):
统计分析
相关性,线性和多元回归,时间序列分解,A/B testing,抽样推测规律,秩和检验,预测等;
可视化工具
Excel,BI工具,Tableau Public;
数据处理框架
Hadoop,Spark,Flink,Storm,Samaza;
4
数据库
SQL,MySql,MongoDB;
5
数据库服务
SSIS,SSAS;
6
编程语言
R语言,Python,Java;
7
人工智能
机器学习(ML)
Python:尽管Python是作为通用编程语言而设计和使用的,但它仍是机器学习中zui受欢迎的语言。
原生数据科学家青睐Python,因为Python具有简约,直观,易读的特点,并且拥有用于特定用途的大量的库。
在Kaggle的2017年机器学习和数据科学调查中, Python被称为最常用的工具。
R语言:R是一种统计计算语言,受到了进入ML世界的数据分析人员和统计学家的青睐。尽管以预测准确性而著称的Python在人工智能(AI)圈子中更受欢迎,但R具有统计推断的优势,仍然是数据分析师的Mjolnir!
实际上,美国银行经常使用R进行财务建模,另外前Facebook数据科学家Paul Butler就用R建立了他著名的Facebook世界地图。
SQL数据库:分析人员从关系数据库和非关系数据库中提取数据最常用的工具就是SQL。
对于数据分析师来说,能够编写结构化查询以提取数据是一项基本技能,且面试必考!
Hadoop平台:Apache Hadoop是一款软件实用程序,可帮助跨集群分布式处理大量数据。它将数据分解成文件,然后分布在群集中的各个节点上—存储由Hadoop分布式文件系统(HDFS)处理,继而再进行MapReduce。
尽管不是必需的,但了解Hadoop平台仍然是该领域的首xuan,且如果你拥有Hive或Pig的经验将会是面试的一个巨大卖点。
除了以上介绍的几个开源工具外,还有很多专有工具,例如用于数值计算的MATLAB,用于数据可视化分析的Tableau和Power BI。
此外,数据科学家还必须能够处理非结构化数据,像是社交媒体的视频源或者音频源啊等等,都至关重要。
不同的ML应用程序和所处的云环境,所需要的工具也会不同,这里小编就不一一阐述。
/ 为什么乔治梅森值得选择?/
如果你正在考虑攻读数据分析硕士专业,那么梅森绝对值得选择。
首先,梅森的数据分析工程硕士学位课程面向那些想要成为数据科学家和专业数据分析人才的学生。
申请梅森的数据分析硕士学位不需要同专业的本科背景,大家不要一看到自己的本科专业不搭边就觉得是转专业申请。
▫ 2020年QS全美排名第100名;
▫ 梅森的Volgenau工程学院致力于大数据和网络安全已有25年以上;
▫ 2014年梅森已经成为美国仅有的五所提供数据分析工程硕士学位课程的大学之一;
▫ 83%的梅森毕业生在毕业后六个月内顺利就业;
▫ 2016年3月被TechRepublic评为“研究大数据分析的20所zui佳学校”之一;
▫ 2018年被Value Colleges评为“最ju价值的50个大数据研究生课程”之一;
如需进一步了解,或有任何相关疑问,欢迎在线咨询留学。如果您对自己是否适合留学还有疑虑,欢迎参与前途出国免费评估,以便给您进行准确定位。