薪资高!数据科学专业详细介绍
分类:专家指南2020-08-31
数据科学主要研究内容有以下三类:
1. Predictive Analytics:分析数据来预测未来可能发生的事情。
2. Descriptive Analytics:分析数据找出过去事件的特征和正在发生事件的趋势。
3. Prescriptive Analytics:分析数据来找出最佳措施、取得最优化的结果。
常见的专业名称有Data Science,Data Analytics,Big Data
Computer Science/Statistics/Analytics (with concentration in Data Science)
数据科学和商业分析的区别:
很多学生会选择同时申请两个专业,但是实际上,两个专业还是有区别的:
· DS一般在工学院或者文理学院, BA一般在商学院
· DS的课程设置一般偏向于计算机和数学, BA的课程一般还有商科
· 应用的技能不一样
· 职业岗位不一样


数据科学和统计的比较:
统计学和数据科学这两个专业都要求一定的数学和计算机能力。部分DS专业开设在统计或者数学系下面。但是两个专业也有一定区别。
先修课:统计专业要求学过除了线性代数、微积分、概率论等等基础课外,还要求掌握统计的高阶课程,比如回归分析、多元统计、时间序列等。而数据科学对计算机背景和技能要求更高,同时要有数学背景,先修课程包括计算机导论,SQL数据库,C++等,数学要求微积分、数学建模、线性代数、概率论等等以及最好有一定工作经验。
从申请角度,统计学大多有自己独立的院系,而DS多数没有,多数在工学院或计算机学院,少数在统计学院。
从深入学习角度,统计学比较偏科研,也设有博士学位;而DS则应用导向,如果要读博士一般转到CS。
从就业上差别也不小,统计学家侧重统计和分析数据,进行统计推断。研究重点是对统计方法进行研究和改良,用在计算机建模之后对数据进行描述和解释。而数据科学家则是通过科学的方法,用数据挖掘工具寻找新的数据。数据科学家要求掌握数据库、软件开发等等,对于程序语言R, Python、C++,SQL和Hadoop等都要了解,对技能要求更综合。
1.2 项目设置
数据科学项目主要是面向职业培训、侧重工业界需求,所以设置博士学位的学校比较少。为了符合工业界需求,专门的数据科学项目课程都很实际,侧重培养学生分析数据、解决问题的实际动手能力,课程一般不涉及理论知识。
如果要读博士,申请统计和生物统计专业最对口,其次是计算机或者电子工程做机器学习数据挖掘这些相关方向的。另外数学、IEOR、经济等专业也有少数博士生做的方向可以转到数据科学上。
1.3 课程设置
核心课程有 (以哥伦比亚大学数据科学项目为例):
统计和计算机课程
l Introduction to Data Science
l Computer Systems for Data Science
l Machine Learning for Data Science
l Algorithms for Data Science
l Probability Theory
l Probability Theory
l Exploratory Data Analysis & Visualization
l Statistical Inference & Modeling
选修课
可选范围比较广泛,包括
l Translational Bioinformatics
l Topics in Computer Science: Applied Machine Learning
l Topics in Computer Science: Causal Inference for Data Science
l Topics in Computer Science: Elements of Data Science: A First Course
l NLP: Computational Models of Social Meaning
l Topics in Computer Science: Projects in Data Science: A First Course
l Topics in Information Processing: Big Data Analytics
就业解析
大数据是最近几年来发展最快的行业,而且迅速变成主流,有大量的职业缺口和需求。因此学数据科学在近年来就业将是非常理想的。很多人毕业以后到高科技企业,比如FLAG(Facebook, Linkedin, Amazon和Google)以及阿里巴巴、腾讯、京东等国内高科技企业。主要从事金融、计算机软件、科研、IT技术服务、生物技术等等各个行业。
-
Business Analyst
-
Business Intelligence Analyst
-
Computer Information Research Scientist
-
Computer Systems Analyst
-
Data Analyst
-
Data Architect
-
Data Engineer
-
Data Modeler
-
Data Scientist
-
Data Warehouse Analyst
-
Data Warehouse Manager
-
Database Administrator
-
Database Developer
-
Database Manager
-
Marketing Analyst
-
Quantitative Analyst
-
Statistician
和商业比较相关的岗位,如Business Analyst 包括分析能力、人际交往能力、领导力,管理能力和交流能力等等。比较硬核的技能要求计算机编程、系统工程和数据库管理等等。而偏数据方面的,比如Data Architect等更加强调硬核技能,要求非常强的分析能力、创造性解决问题的能力、对数据的理解,以及对各种数据库、各种操作系统开发平台比较熟悉。
作为数据工程师,更加强调掌握的是统计和建模能力、相关数据工具,尤其Hadoop, SQL以及相关技术比如Cassandra, MongoDB等等;常见的编程语言,比如C/C++, Java等要熟悉,对自然语言处理和语句分析要有一定了解。而作为数据科学家则要求更强的CS能力,比如机器学习方法工具、软件工程相关、数据挖掘、大数据平台,更要求熟练掌握各类编程语言(Python, Java, C/C++, Perl等等),数据可视化工具(如Amazon S3)。
重要技能排序:

状态和趋势

https://www.onetonline.org/link/summary/15-1199.06
大企业的薪资状况

