数据科学专业为什么这么“燃”?
提到数据科学专业,一直以来都是学生和家长追捧的热门专业之一!随着申请者数量的递增,相应的申请难度也因此逐年递增。随着互联网行业的蓬勃发展,各行各业的数据量激增,因此很多传统行业也加入了互联网科技的浪潮。如何让如此庞大的数据量,为人们的生产生活“智能”的服务,成为了大家探索和发现的目标。大数据为现代的生活带来的便捷和智能化程度也有目共睹。因此,研究生申请阶段,数据科学这个专业,也是很多申请者青睐的目标专业。
什么是数据科学专业呢?其实数据科学,是一个在工业界蓬勃发展后,再回归到学校的学科。实际应用中,大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
从研究生专业角度上来看,数据科学是一门涉及到统计,数据分析及其相关方法的科学,借用数据去“理解和分析实际现象”。数据科学使用到数学、统计、信息科学和计算机科学等各个学科的技术和理论,特别是以下分支:机器学习, 分类, 聚类分析,数据挖掘,数据库和可视化。大多数院校的Data Science属于STEM学科。
数据科学主要研究内容有以下三类:
1. Predictive Analytics:分析数据来预测未来可能发生的事情。
2. Descriptive Analytics:分析数据找出过去事件的特征和正在发生事件的趋势。
3. Prescriptive Analytics:分析数据来找出最佳措施、取得最优化的结果。
麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
申请要求:
先修课要求:
以Harvard的Master of Science in Data Science为例:
Prerequisites we expect from applicants include knowledge of calculus and linear algebra, familiarity with probability and statistical inference, fluency in at least one programming language such as python or R, and an understanding of basic computer science concepts.
Columbia的 Data Science要求:
Prior quantitative coursework (calculus, linear algebra, etc.)
Prior introductory computer programming coursework (Python, Java, R, C++, etc.)
科研实习要求:
l、计算机数据挖掘、深度学习、人工智能机器学习、数据分析等专业方向为主。
2、互联网公司、电商公司、金融公司、银行、证券公司等。
申请细节及时间点提示:
数据科学就业情况:
和商业比较相关的岗位,如Business Analyst 包括分析能力、人际交往能力、领导力,管理能力和交流能力等等。比较硬核的技能要求计算机编程、系统工程和数据库管理等等。而偏数据方面的,比如Data Architect等更加强调硬核技能,要求非常强的分析能力、创造性解决问题的能力、对数据的理解,以及对各种数据库、各种操作系统开发平台比较熟悉。
作为数据工程师,更加强调掌握的是统计和建模能力、相关数据工具,尤其Hadoop, SQL以及相关技术比如Cassandra, MongoDB等等;常见的编程语言,比如C/C++, Java等要熟悉,对自然语言处理和语句分析要有一定了解。而作为数据科学家则要求更强的CS能力,比如机器学习方法工具、软件工程相关、数据挖掘、大数据平台,更要求熟练掌握各类编程语言(Python, Java, C/C++, Perl等等),数据可视化工具。常见职业岗位如下:
• Business Analyst
• Business Intelligence Analyst
• Computer Information Research Scientist
• Computer Systems Analyst
• Data Analyst
• Data Architect
• Data Engineer
• Data Modeler
• Data Scientist
• Data Warehouse Analyst
• Data Warehouse Manager
• Database Administrator
• Database Developer
• Database Manager
• Marketing Analyst
• Quantitative Analyst
• Statistician









