专业简介
数据科学是一门涉及到统计,数据分析及其相关方法的科学,借用数据去“理解和分析实际现象”。数据科学使用到数学、统计、信息科学和计算机科学等各个学科的技术和理论,特别是以下分支:机器学习, 分类, 聚类分析,数据挖掘,数据库和可视化。大多数院校的Data Science属于STEM学科。
数据科学主要研究内容有以下三类
1. Predictive Analytics:分析数据来预测未来可能发生的事情。
2. Descriptive Analytics:分析数据找出过去事件的特征和正在发生事件的趋势。
3. Prescriptive Analytics:分析数据来找出最佳措施、取得最优化的结果。
常见的专业名称有Data Science,Data Analytics,Big Data
Computer Science/Statistics/Analytics (with concentration in Data Science)
数据科学和商业分析的区别
很多学生会选择同时申请两个专业,但是实际上,两个专业还是有区别的:
1. DS一般在工学院或者文理学院, BA一般在商学院
2. DS的课程设置一般偏向于计算机和数学, BA的课程一般还有商科
3. 应用的技能不一样
4. 职业岗位不一样
数据科学和统计的比较
统计学和数据科学这两个专业都要求一定的数学和计算机能力。部分DS专业开设在统计或者数学系下面。但是两个专业也有一定区别。
先修课:统计专业要求学过除了线性代数、微积分、概率论等等基础课外,还要求掌握统计的高阶课程,比如回归分析、多元统计、时间序列等。而数据科学对计算机背景和技能要求更高,同时要有数学背景,先修课程包括计算机导论,SQL数据库,C++等,数学要求微积分、数学建模、线性代数、概率论等等以及最好有一定工作经验。
从申请角度,统计学大多有自己独立的院系,而DS多数没有,多数在工学院或计算机学院,少数在统计学院。
从深入学习角度,统计学比较偏科研,也设有博士学位;而DS则应用导向,如果要读博士一般转到CS。
从就业上差别也不小,统计学家侧重统计和分析数据,进行统计推断。研究重点是对统计方法进行研究和改良,用在计算机建模之后对数据进行描述和解释。而数据科学家则是通过科学的方法,用数据挖掘工具寻找新的数据。数据科学家要求掌握数据库、软件开发等等,对于程序语言R, Python、C++,SQL和Hadoop等都要了解,对技能要求更综合。
项目设置
数据科学项目主要是面向职业培训、侧重工业界需求,所以设置博士学位的学校比较少。为了符合工业界需求,专门的数据科学项目课程都很实际,侧重培养学生分析数据、解决问题的实际动手能力,课程一般不涉及理论知识。
如果要读博士,申请统计和生物统计专业最对口,其次是计算机或者电子工程做机器学习数据挖掘这些相关方向的。另外数学、IEOR、经济等专业也有少数博士生做的方向可以转到数据科学上。
课程设置
核心课程有 (以哥伦比亚大学数据科学项目为例):
统计和计算机课程
Ø Introduction to Data Science
Ø Computer Systems for Data Science
Ø Machine Learning for Data Science
Ø Algorithms for Data Science
Ø Probability Theory
Ø Probability Theory
Ø Exploratory Data Analysis & Visualization
Ø Statistical Inference & Modeling
选修课
可选范围比较广泛,包括
Ø Translational Bioinformatics
Ø Topics in Computer Science: Applied Machine Learning
Ø Topics in Computer Science: Causal Inference for Data Science
Ø Topics in Computer Science: Elements of Data Science: A First Course
Ø NLP: Computational Models of Social Meaning
Ø Topics in Computer Science: Projects in Data Science: A First Course
Ø Topics in Information Processing: Big Data Analytics
【免责声明】
1、个别文章内容来源于网络善意转载,版权归原作者所有,如侵权,请联系删除;
2、所有图片来源于网络,版权归原作者所有。如有侵权问题请告知,我们会立即处理。

