可能对于很多同学来说,数据分析还只是个模糊的概念,甚至并不了解这个专业具体是做什么的。
很多从网络或者公众 号收集到的相关信息,也是非常零散不成体系。
今天,就给你详细解析一下,数据分析到底是学什么的!
这里,将跟你们共同探讨以下话题:
l 什么是数据分析?
l 数据分析专业的就业前景如何?
l 什么样的人适合学数据分析?
l 数据分析需要学习哪些工具?
拿好你们的小本本都记下来吧!
/ 什么是数据分析 /
简单来说,数据分析就是利用数据和工具来理性思考和决策的过程。
举个例子,这就像是你在沙里淘金,含金的沙子就好比大数据(Big Data),首先要用筛子不停地筛(Extract),同时用水不断地冲洗沙子(Cleaning),然后将淘剩下的金沙炼成块(Transform),最后才能得到真正有用的(Load),这也是我们常说的数据ETL过程。
/ 数据分析专业的就业前景如何 /
“在快速逼近的技术新时代,核心是数据。与数据有关的能力,将变得非常有价值。”
-- 马云在美国财经媒体CNBC采访时说
作为一个新兴产业,大数据正以惊人的速度增长,每天产生近2.3亿兆字节的数据,并且数据每两年至少翻一番。
麦肯锡(McKinsey)早几年前就预测过,到2020年数据工作者的岗位需求将激增,其中对于懂得如何利用大数据做决策的分析师和经理的岗位缺口将达到150万!
无论在国外还是国内,数据分析的就业前景都是非常好的,而且涉及的领域非常广,例如:市场分析、消费者行为、社会网络和情绪分析、软件系统、欺诈和犯罪检测、卫生保健、基因工程、供应链、金融、图书馆和网络安全等。
根据2020年ZipRecruiter最新职位发布,弗吉尼亚州数据分析师的年收入中位数为94,662美元,但范围差距较大,通常在20,553美元至171,278美元之间。
/ 什么样的人适合学习数据分析 /
首先,本科是计算机科学CS方面的同学,是最符合申请条件的,因为大多数像统计、微积分、编程语言等基础课都是相同的;
其次,具有工程,商业,计算机科学,统计,生物,医学,或者信息技术背景的同学都可以申请,编程零基础亦可。
/ 数据分析需要学习哪些工具 /
随着市场对数据分析的需求不断增长,开发出了许多用于数据科学目的的编程语言,其中最受专业分析人员欢迎的是Python,R,和SQL。
根据JetBrains数据科学调查显示,有近57%的受访者认为Python在未来5年内将保持领先地位。
关于数据分析的工具就是个见仁见智的事情,实在是因为专用工具太多了,从 Excel 到各式各样的编程语言。
以下是个人认为一个合格的数据分析师需要掌握的几种技能(其中黄色标签为必学且需熟练掌握):
1统计分析
相关性,线性和多元回归,时间序列分解,A/B testing,抽样推测规律,秩和检验,预测等;
2可视化工具
Excel,BI工具,Tableau Public;
3数据处理框架
Hadoop,Spark,Flink,Storm,Samaza;
4数据库
SQL,MySql,MongoDB;
5数据库服务
SSIS,SSAS;
6编程语言
R语言,Python,Java;
7人工智能
机器学习(ML)
Python:尽管Python是作为通用编程语言而设计和使用的,但它仍是机器学习中最受 欢迎的语言。
原生数据科学家青睐Python,因为Python具有简约,直观,易读的特点,并且拥有用于特定用途的大量的库。
在Kaggle的2017年机器学习和数据科学调查中, Python被称为最常用的工具。
R语言:R是一种统计计算语言,受到了进入ML世界的数据分析人员和统计学家的青睐。尽管以预测准确性而著称的Python在人工智能(AI)圈子中更受欢迎,但R具有统计推断的优势,仍然是数据分析师的Mjolnir!
实际上,美国银行经常使用R进行财务建模,另外前Facebook数据科学家Paul Butler就用R建立了他著名的Facebook世界地图。
SQL数据库:分析人员从关系数据库和非关系数据库中提取数据最常用的工具就是SQL。
对于数据分析师来说,能够编写结构化查询以提取数据是一项基本技能,且面试必考!
Hadoop平台:Apache Hadoop是一款软件实用程序,可帮助跨集群分布式处理大量数据。它将数据分解成文件,然后分布在群集中的各个节点上—存储由Hadoop分布式文件系统(HDFS)处理,继而再进行MapReduce。
尽管不是必需的,但了解Hadoop平台仍然是该领域的首 选,且如果你拥有Hive或Pig的经验将会是面试的一个巨大卖点。
除了以上介绍的几个开源工具外,还有很多专有工具,例如用于数值计算的MATLAB,用于数据可视化分析的Tableau和Power BI。
此外,数据科学家还必须能够处理非结构化数据,像是社交媒体的视频源或者音频源啊等等,都至关重要。
不同的ML应用程序和所处的云环境,所需要的工具也会不同,这里就不一一阐述。
/ 为什么乔治梅森值得选择?/
如果你正在考虑攻读数据分析硕士专业,那么梅森绝对值得选择。
首先,梅森的数据分析工程硕士学位课程面向那些想要成为数据科学家和专业数据分析人才的学生。
申请梅森的数据分析硕士学位不需要同专业的本科背景,大家不要一看到自己的本科专业不搭边就觉得是转专业申请。
▫ 2020年QS全美排名第100名;
▫ 梅森的Volgenau工程学院致力于大数据和网络安全已有25年以上;
▫ 2014年梅森已经成为美国仅有的五所提供数据分析工程硕士学位课程的大学之一;
▫ 83%的梅森毕业生在毕业后六个月内顺利就业;
▫ 2016年3月被TechRepublic评为“研究大数据分析的20所最 佳学校”之一;
▫ 2018年被Value Colleges评为“最 具价值的50个大数据研究生课程”之一;
此外,你还可以在梅森找到适合你的研究领域:
应用分析(APAN)
生物工程(BIOE)
商务分析(BUSA)
网络分析(CYBA)
数据挖掘(DTM)
金融工程(FNNE)
医疗健康数据分析(HDAN)
物联网分析(INOT)
预测分析(PRAN)
统计数据分析(STLA)
应用分析 -- 着重于大数据方面的常见问题分析和政府运营的实际要素,此外你还将精通涉及个人身份信息(PII)时出现的法律问题。可选课程有:数据库管理系统,自然语言处理,应用机器学习等。
生物工程 -- 侧重于从医疗设备/传感器收集数据以及进行调节,过滤,提取和准备数据。可选课程有:生物工程研究方法,数字信号处理,医学影像,神经工程等。
商务分析 -- 学生将通过使用决策模型和软件工具的相关技术来学习如何有效地分析数据,以及如何从数据收集,组织,报告和挖掘到为决策者提取有用和可操作的信息。可选课程有:营销分析,市场调查,商业欺诈等。
网络分析 -- 通过收集和呈现数据以作为法庭证据来帮助确定司法公正。其中,数字取证是刑事,民事,情报和反恐事务中的关键组成部分。
学生将数据分析应用于数字媒体,拦截(网络)数据,移动媒体,未知代码等领域,并利用该分析来确定意图和背景。可选课程有:操作系统和实验室,数字取证分析,恶意软件逆向工程等。
数据挖掘 -- 面向对数据挖掘,高级数据库系统,MapReduce编程,模式识别,决策指导系统以及贝叶斯推理感兴趣的学生。可选课程有:使用MapReduce挖掘海量数据集,人工智能概论,网络搜索引擎和推荐系统等。
金融工程 -- 重点强调财务和计量经济数据分析的分析和实践方面。培养学生在定量建模学科上表现出熟练水平,了解与投资和对冲决策,衍生品估值和风险分析的实践方面相关的问题,以及制定有效的业务和缓解风险策略,合理的财务,营销和投资决策。可选课程有:金融工程和计量经济学分析,金融系统工程I:期权,期货和衍生工具简介,决策与风险分析等。
医疗健康数据分析 -- 专注于医疗保健的分析。它涵盖了医疗保健领域的特定应用,以及多个数据分析领域。可选课程有:健康数据整合,卫生保健数据库,医疗决策与决策支持系统等。(具体地说,就是学习如何从医院的电子病例系统中提取数据,会学到XML编码和电子病历数据库等)
物联网分析 -- IOTA从物联网和传感器的角度看待数据分析。模拟和数字感测设计和部署,硬件选件,功耗,安全性,采样和量化,傅立叶变换,时间分析和同步是必学的几个主题。可选课程有:数码电子,人工智能概论,传感器工程等。
预测分析 -- 公司和组织希望在采取行动或做出决策之前先了解未来的发展;预测分析使这种预测更加准确。该计划为学生做好了大数据分析职业的准备,重点是金融应用,医疗保健,运输和情报等实际应用中的战略决策。可选课程有:决策与风险分析,体育分析,统计图形与数据探索I等。
统计数据分析 -- 众所周知,“大数据”包含高度的不确定性以及复杂的交互作用和关系。为了从这些数据中获取知识并为决策提供依据,必须以一种确认不确定性的计算方式来阐明核心交互作用和关系,以便最大程度地减少错误信号。该方向重点将放在统计建模和数据可视化两个领域培养深厚的分析人才。可选课程有:线性代数,多元统计方法,数据分析研究项目等。
不仅如此,梅森的地理也很优越哦!由于邻近美国首都华盛顿特区,很多美国同学都是在附近的政府部门,智库,或者Amazon这样的大公司工作,你可以第一时间获取最新资讯。
要知道梅森的数据分析专业是STEM项目,基本上大厂都会招,只要工作与专业相关,OPT还可以延长至3年,留美工作机会大大增加。
通过以上福州新东方前途出国小编的介绍,如需进一步了解,欢迎在线咨询出国留学专家;或有任何相关疑问,请进入答疑中心留言,会有留学专家为您解答。如果您对自己是否适合出国留学还有疑虑,欢迎参与前途出国免费评估,以便给您进行准确定位。