数据科学专业简介
专业简介
数据科学是一门涉及到统计,数据分析及其相关方法的科学,借用数据去“理解和分析实际现象”。数据科学使用到数学、统计、信息科学和计算机科学等各个学科的技术和理论,特别是以下分支:机器学习, 分类, 聚类分析,数据挖掘,数据库和可视化。大多数院校的Data Science属于STEM学科。
数据科学可以应用在哪些领域?--以哥大的数据科学所的研究领域为例:
Financial and Business Analytics 金融与商业分析(例如数据科学帮助解决诈骗邮件的问题;数据科学帮助解决量化交易收益最大化的问题;数据科学在大规模商业银行中的应用)
Health Analytics 健康分析(哥伦比亚大学数据健康分析中心的研究员和教授来自医学、生物、公共卫生、生物信息、计算机、应用数学与统计专业。目标是通过数据驱动的方法和对健康过程的理解来改善个人健康和医疗系统。案例: Real-time Monitoring and Data Visualization for the Management of Intracranial Hypertension in the Intensive Care Unit 重症监护病房颅内高压管理的实时监测和数据可视化)
Smart Cities 智慧城市(哥大智慧城市研究中心的研究涵盖面很广,例如检测和消除城市基础设施老化的问题,提高智能电网技术,计算和沟通交通拥挤时的最佳交通路线等)
Computational Social Science 计算社会科学(哥伦比亚大学计算社会科学研究中心,帮助缺少编程和技术背景的研究人员,解决社会科学的问题。例如利用移动电话和卫星数据绘制贫困地图,解决贫困问题(孟加拉地区))
Cybersecurity 网络安全(我们致力于开发在整个生命周期内保持数据安全和私有性的能力。该中心与计算机科学和电气工程系,以及商学院合作研究。)
数据科学主要研究内容有以下三类:
1. Predictive Analytics:分析数据来预测未来可能发生的事情。
2. Descriptive Analytics:分析数据找出过去事件的特征和正在发生事件的趋势。
3. Prescriptive Analytics:分析数据来找出最佳措施、取得最优化的结果。
数据科学和统计的比较:
统计学和数据科学这两个专业都要求一定的数学和计算机能力。部分DS专业开设在统计或者数学系下面。但是两个专业也有一定区别。
先修课:统计专业要求学过除了线性代数、微积分、概率论等等基础课外,还要求掌握统计的高阶课程,比如回归分析、多元统计、时间序列等。而数据科学对计算机背景和技能要求更高,同时要有数学背景,先修课程包括计算机导论,SQL数据库,C++等,数学要求微积分、数学建模、线性代数、概率论等等以及最好有一定工作经验。
从申请角度,统计学大多有自己独立的院系,而DS多数没有,多数在工学院或计算机学院,少数在统计学院。
从深入学习角度,统计学比较偏科研,也设有博士学位;而DS则应用导向,如果要读博士一般转到CS。
从就业上差别也不小,统计学家侧重统计和分析数据,进行统计推断。研究重点是对统计方法进行研究和改良,用在计算机建模之后对数据进行描述和解释。而数据科学家则是通过科学的方法,用数据挖掘工具寻找新的数据。数据科学家要求掌握数据库、软件开发等等,对于程序语言R, Python、C++,SQL和Hadoop等都要了解,对技能要求更综合。
如需进一步了解,或有任何相关疑问,欢迎在线咨询留学专家。如果您对自己是否适合留学还有疑虑,欢迎参与前途出国免费评估,以便给您进行准确定位。