美研专业分析-数据科学
专业概念
数据科学是一门涉及到统计,数据分析及其相关方法的科学,借用数据去“理解和分析实际现象”。数据科学使用到数学、统计、信息科学和计算机科学等各个学科的技术和理论,特别是以下分支:机器学习,分类,聚类分析,数据挖掘,数据库和可视化。大多数院校的Data Science属于STEM学科。
数据科学主要研究内容有以下三类:
1. Predictive Analytics:分析数据来预测未来可能发生的事情。
2. Descriptive Analytics:分析数据找出过去事件的特征和正在发生事件的趋势。
3. Prescriptive Analytics:分析数据来找出最佳措施、取得最优化的结果。
常见的专业名称:Data Science,Data Analytics,Big Data,Computer Science/Statistics/Analytics (with concentration in Data Science)
数据科学和商业分析的区别:
很多学生会选择同时申请两个专业,但是实际上,两个专业还是有区别的:
DS一般在工学院或者文理学院, BA一般在商学院
DS的课程设置一般偏向于计算机和数学, BA的课程一般还有商科
应用的技能不一样
职业岗位不一样

数据科学和统计的比较:
统计学和数据科学这两个专业都要求一定的数学和计算机能力。部分DS专业开设在统计或者数学系下面。但是两个专业也有一定区别。
先修课:统计专业要求学过除了线性代数、微积分、概率论等等基础课外,还要求掌握统计的高阶课程,比如回归分析、多元统计、时间序列等。而数据科学对计算机背景和技能要求更高,同时要有数学背景,先修课程包括计算机导论,SQL数据库,C++等,数学要求微积分、数学建模、线性代数、概率论等等以及最好有一定工作经验。
从申请角度,统计学大多有自己独立的院系,而DS多数没有,多数在工学院或计算机学院,少数在统计学院。
从深入学习角度,统计学比较偏科研,也设有博士学位;而DS则应用导向,如果要读博士一般转到CS。
从就业上差别也不小,统计学家侧重统计和分析数据,进行统计推断。研究重点是对统计方法进行研究和改良,用在计算机建模之后对数据进行描述和解释。而数据科学家则是通过科学的方法,用数据挖掘工具寻找新的数据。数据科学家要求掌握数据库、软件开发等等,对于程序语言R, Python、C++,SQL和Hadoop等都要了解,对技能要求更综合。

项目设置
数据科学项目主要是面向职业培训、侧重工业界需求,所以设置博士学位的学校比较少。为了符合工业界需求,专门的数据科学项目课程都很实际,侧重培养学生分析数据、解决问题的实际动手能力,课程一般不涉及理论知识。
如果要读博士,申请统计和生物统计专业最对口,其次是计算机或者电子工程做机器学习数据挖掘这些相关方向的。另外数学、IEOR、经济等专业也有少数博士生做的方向可以转到数据科学上。
课程设置
核心课程有 (以哥伦比亚大学数据科学项目为例):
统计和计算机课程
Introduction to Data Science
Computer Systems for Data Science
Machine Learning for Data Science
Algorithms for Data Science
Probability Theory
Exploratory Data Analysis & Visualization
Statistical Inference & Modeling
专业背景
常见的本科专业有 Computer Science/Technology; Engineering; Business Management; Finance; Math; Statistics, etc.
各大学对申请学生有较为明确而统一的要求,数学背景包括微积分、线性代数、概率论、统计学、数学建模等等;计算机背景包括计算机导论、SQL、Database和编程等。
大多数项目倾向录取数学、统计等计量学科背景的学生,同时希望申请人有软件编程基础、会写程序分析数据。仅仅上过高数、线性代数和概率统计这三门基础课是不够的。如果没有非常强的数理基础,建议申请BA等要求没有这么强的专业。
除此之外,希望申请人有比较强的解决问题和交流沟通能力。如果有工作经验,申请时候会是加分项。文书中注意结合工作体现对这个专业的理解和看法。如果没有工作经验,建议文书中设计相关内容强调背景和能力可以胜任这个专业。
1. 先修课要求
以Harvard的Master of Science in Data Science为例:
Prerequisites we expect from applicants include knowledge of calculus and linear algebra, familiarity with probability and statistical inference, fluency in at least one programming language such as python or R, and an understanding of basic computer science concepts.
Columbia的 Data Science要求:
Prior quantitative coursework (calculus, linear algebra, etc.)
Prior introductory computer programming coursework (Python, Java, R, C++, etc.)
美国大多数院校的数据科学硕士要求:
(1)修过计算机基础
(2)数学基础(比如微积分、线性代数)
(3)熟悉概率论、或者统计
(4)如果没有这些先修课程甚至会开始预科夏季课程给学生,不计入学分当中,比如布朗大学。
如果有转专业的同学可以尽可能的修习以上课程,提升自己的竞争力,通过二学位、辅修学位、暑期课程、网课等方式多修课程。或者多参与实践实习科研也对申请数据科学有很大帮助.
2. 科研实习建议
建议科研类型:
(1)计算机数据挖掘、深度学习、人工智能机器学习、数据分析等专业方向为主。
(2)可选择远程和实地这两种,以个人时间为主,平时可以参加远程,假期可参与实地。
(3)新东方项目,CMU、哈佛、伯克利的项目,可一对一、一对三。背景提升产品
建议实习岗位:
互联网公司、电商公司、金融公司、银行、证券公司等
就业分析
大数据是最近几年来发展最快的行业,而且迅速变成主流,有大量的职业缺口和需求。因此学数据科学在近年来就业将是非常理想的。很多人毕业以后到高科技企业,比如FLAG(Facebook, Linkedin, Amazon和Google)以及阿里巴巴、腾讯、京东等国内高科技企业。主要从事金融、计算机软件、科研、IT技术服务、生物技术等等各个行业。
常见职业方向:
Business Analyst
Business Intelligence Analyst
Computer Information Research Scientist
Computer Systems Analyst
Data Analyst
Data Architect
Data Engineer
Data Modeler
Data Scientist
Data Warehouse Analyst
Data Warehouse Manager
Database Administrator
Database Developer
Database Manager
Marketing Analyst
Quantitative Analyst
Statistician
和商业比较相关的岗位,如Business Analyst 包括分析能力、人际交往能力、领导力,管理能力和交流能力等等。比较硬核的技能要求计算机编程、系统工程和数据库管理等等。而偏数据方面的,比如Data Architect等更加强调硬核技能,要求非常强的分析能力、创造性解决问题的能力、对数据的理解,以及对各种数据库、各种操作系统开发平台比较熟悉。
作为数据工程师,更加强调掌握的是统计和建模能力、相关数据工具,尤其Hadoop, SQL以及相关技术比如Cassandra, MongoDB等等;常见的编程语言,比如C/C++, Java等要熟悉,对自然语言处理和语句分析要有一定了解。而作为数据科学家则要求更强的CS能力,比如机器学习方法工具、软件工程相关、数据挖掘、大数据平台,更要求熟练掌握各类编程语言(Python, Java, C/C++, Perl等等),数据可视化工具(如Amazon S3)
【免责声明】
1、个别文章内容来源于网络善意转载,版权归原作者所有,如侵权,请联系删除;
2、所有图片来源于网络,版权归原作者所有。如有侵权问题请告知,我们会立即处理。
英语翻译硕士毕业,热爱留学行业,专注美国研究生申请,擅长挖掘学生潜在优势,致力于为每一位学生量体裁衣,定做申请方案及申请策略,提供合理高效的建议;文字功底深厚,善于制定个性化文书,提供最适合的留学方案;深谙美国大学招生动态、录取规则以及未来职业发展规划,能够准确把握各校录取精髓,积累了丰富的申请案例,以精益求精的态度,帮上百名学生拿到梦校录取!成功案例:南加大、东北大学、波士顿大学、迈阿密大学等。
做事认真负责,对待学生耐心热情,以专业的眼光进行专业的申请,提高学生综合竞争力,圆梦美国名校。

