近几年,大数据的兴起为众多领域带来了全新的变革。在美国,大数据工程师平均年薪达17.5万美元。国内第一梯队的互联网公司里,大数据工程师的薪酬也比同级别的其他职位高出30%左右。马云在演讲中就提到,未来的时代将不是IT时代,而是DT(Data Technology)的时代。而目前大数据相关的人才仍非常地紧缺,在未来若干年内都将供不应求。
很多人不禁会疑惑,大数据为什么这么火?
途姐带你一起深挖下大数据的那些事儿
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
通俗地讲,是在海量的数据中找出数据的规律和价值。我们常用的网购APP的推荐商品模块,都是根据我们日常的购物习惯、消费情况来进行推荐。这其中就包含了数据的采集及分析。
数据科学主要研究内容有以下三类:
1. Predictive Analytics:分析数据来预测未来可能发生的事情。
2. Descriptive Analytics:分析数据找出过去事件的特征和正在发生事件的趋势。
3. Prescriptive Analytics:分析数据来找出最佳措施、取得最优化的结果。
一、数据科学和统计的比较
统计学和数据科学这两个专业都要求一定的数学和计算机能力。部分DS专业开设在统计或者数学系下面。但是两个专业也有一定区别。
先修课:统计专业要求学过除了线性代数、微积分、概率论等等基础课外,还要求掌握统计的高阶课程,比如回归分析、多元统计、时间序列等。而数据科学对计算机背景和技能要求更高,同时要有数学背景,先修课程包括计算机导论,SQL数据库,C++等,数学要求微积分、数学建模、线性代数、概率论等等以及最好有一定工作经验。
从申请角度,统计学大多有自己独立的院系,而DS多数没有,多数在工学院或计算机学院,少数在统计学院。
深入学习角度,统计学比较偏科研,也设有博士学位;而DS则应用导向,如果要读博士一般转到CS。
从就业上差别也不小,统计学家侧重统计和分析数据,进行统计推断。研究重点是对统计方法进行研究和改良,用在计算机建模之后对数据进行描述和解释。而数据科学家则是通过科学的方法,用数据挖掘工具寻找新的数据。数据科学家要求掌握数据库、软件开发等等,对于程序语言R, Python、C++,SQL和Hadoop等都要了解,对技能要求更综合。
二、申请要求
1
专业背景
常见的专业名称有Data Science,Data Analytics,Big Data等,各大学对申请学生有较为明确而统一的要求,大多数倾向录取数学、统计等计量学科背景的学生,同时希望申请人有软件编程基础等。仅仅上过高数、线性代数和概率统计这三门基础课是不够的。如果没有非常强的数理基础,建议申请BA等要求没有这么强的专业。
除此之外,希望申请人有比较强的解决问题和交流沟通能力。工作经验在申请的时候会是加分项。文书中需要注意结合工作,表达对这个专业的理解和看法。如果没有工作经验,建议文书中相关内容强调背景和能力可以胜任这个专业。
2
先修课
美国大多数院校的数据科学硕士要求:
l 修过计算机基础
l 数学基础(比如微积分、线性代数)
l 熟悉概率论或者统计
转专业的同学可以通过辅修学位、暑期课程、网课等方式尽可能的多学习以上课程,提升自己的竞争力。或者多参与相关科研也对申请数据科学有很大帮助。
三、常申院校和梯度参考
第一梯度:要求学生GPA3.7+,托福105,GRE320+
Harvard: 2017开始第一届,录取率5%,女神校,喜欢海本/清北大神
Stanford: M.S. in Statistics: Data Science 女神校
Columbia & NYU: 地理位置优越,录取率6-7%左右
第二梯度:要求学生GPA3.5+,托福100+,GRE320+
USC: M.S. in Applied Data Science (背景可多样, T 90+)
M.S. in Computer Science – Data Science (推荐CS背景, T 90+)
Duke: Master in Interdisciplinary Data Science (MIDS) 不强制要求数学、CS背景, T 90+
第三梯度:要求学生GPA3.5+,托福90+,GRE310+
NEU, RPI, IUB, GWU
大数据是最近几年来发展最快的行业之一,而且迅速变成主流,有大量的职业缺口和需求。因此数据科学近年来的就业非常理想。FLAG(Facebook, Linkedin, Amazon和Google)以及阿里巴巴、腾讯、京东等国内高科技企业对于专业的大数据人才也都有非常高的需求。北上广大数据工程师平均薪资在17k-20K之间,具体薪资根据个人能力会有不同的程度的浮动。小编身边就有求职时意向20K,HR开出24K的真实案例。
如此优异的的就业前景和“钱景”,使得数据科学的申请要求一直不低。小编也建议大家提早准备,除了专业课和先修课的学习,也可以通过参与优质的科研项目,快人一步。
这个暑假,新东方与哈佛大学研究员团队强强联合,数据分析方向重磅推出3个热门课题:
课题一 分析和预测美国影视和文学作品中人物的网络
课题二 全球疾病分布与全球贸易之间的关系
课题三 分析美国医疗保险数据与疾病分布之间的关系
以课题二为例
导师背景:
任职导师为现任哈佛大学医学院研究员,GeneTank联合创始人。至今在Journal of Machine learning Research、Nucleic Acids Research等国际权威期刊以第一作者身份发表机器学习,生物信息学相关领域论文多篇。
项目形式:
线上, 3-6人滚动开班,面试+笔试筛选(中文)
项目安排:
1)从WTO,联合国等国际组织数据库收集,处理,整理全球的疾病分布与贸易信息
2)深入学习数据分析中的基本概念与应用,并在R环境下动手操作
3)使用ggplot, dyplyr等软件包,将数据分析结果整理成“全球贸易疾病图”并对重点地区,如非洲,中国,印度,做各疾病的单独分析
4)找出全球疾病分布规律,并对未来趋势进行预测,与专业机构的预测进行对比
适合学生:
数据分析、统计学、经济学、应用数学、人工智能,计算机,金融信息
欲了解项目详情及更多科研机会,可随时拨打老师的免费咨询热线:0371-53300885!
赶快拨打0371-53300885,会有专业的老师为你提供咨询!