本篇给大家介绍的主要分五块内容,分别是什么是数据科学、数据科学专业就业前景、美国数据科学硕士申请专业要求、申请数据科学专业需要哪些软性背景、热门数据科学项目。下面是详细的介绍的。
一、什么是数据科学
数据科学是一门交叉的学科, 涉及到很多的领域包括统计学、数学、计算机、人工智能、机器学习、数据库、模式识别、可视化技术等多学科的知识。关于数据科学项目的就业前景,全球最优秀管理咨询公司麦肯锡(McKinsey)出具了一份详细的分析报告,大数据或者数据工作者的岗位需求将激增,其中大数据科学家的缺口在140000到190000之间,懂得如何利用大数据做决策的分析师和经理的岗位缺口则将达到1500000!其中对大数据处理需求最旺盛的行业包括:制药业、计算机软件、互联网、科研、IT技术服务、生物技术。事实上, 大数据工作者可以施展拳脚的领域非常广泛,从国防部、互联网创业公司到金融机构 ,到处需要大数据项目来做创新驱动。数据分析或数据处理的岗位报酬也非常丰厚,在硅谷,入门级的数据科学家的收入已经是6位数美元了。
二、 数据科学专业就业前景
数据科学的三类职业方向:机器学习、数据分析和数据科学家。
1、 机器学习工程师Machine Learning Engineer
代表了技术含量较高的方向,工作内容主要是开发机器学习系统和用这些系统解决实际问题。一般需要ship production code,做出来的是数据产品。
2、 数据分析员Data Analyst
工作内容俗称analytics (product analytics or business analytics),从数据中提取insight,估计投资回报比,为产品方向提建议,所用工具一般较基础,比如写SQL query取数据、用R/Python做简单的分析、用Tableau/Excel作图比较常见,能自己开发Dashboard算是analyst里面技术强的,工作需要产生各种形式的报告;在统计层次上,懂基本t-test和线性回归即可。
3、 数据科学家Data Scientist
工作内容以高级建模为主,会针对复杂的问题来设计技术方案,比如Uber叫车的ETA、各种定价系统、Airbnb和金融行业的Fraud Detection、Amazon物流管理、FB/Linkedin的社交网络或者ebay/Airbnb/Uber这样供需双方Marketplace市场规模的实验。这些例子,听上去就不是写SQL能解决的,也不是会写代码就能做出来的,都需要比较深的领域知识。
三、美国数据科学硕士申请专业要求
首先, 本科是计算机科学CS的同学,是最符合申请条件的 ,因为大多数数据工作都是通过编程和数据库的相关手段进行的,同时学过统计、微积分、高级语言;例如哈佛大学对于MSDS的本科背景要求是:希望有微积分、线性代数,概率和统计等相关课程,能使用至少1种编程语言,例如Python或R,了解计算机科学概念。其次, 本科背景是统计、数学或应用数学,且有一定编程基础的同学 也可以申请,这都是很好的匹配专业。最后, 商科背景出身,但量化背景较强的商科专业 ,比如金工,但又希望能选择一个STEM专业的同学,那DS显然也是个非常好的选择。所以说,如果你有比较强的编程背景,又有比较好的数理基础,那你就很有竞争力;而纯商科背景的同学,如果没有强的量化背景,或者不懂编程,那建议还是数据科学DS和商业分析BA混合申请,因为商业分析更加偏商科,开在商学院,对商科背景接纳程度大很多。****
四、申请数据科学专业需要哪些软性背景?
建议可以从科研方面加强, 在大学期间最好找和量化相关的科研 ,如果实在没有,可以把相关的课程大作业拿来用。再退而求其次,也可以是计算机软件、数据库相关。如果没有科研经历,那将是极大的硬伤。此外, 可以参加一些竞赛 。竞赛的平台有很多,比如最近很火的Kaggle,再如阿里的天池、SODA、WID、数据嗨客等。
最后就是实习。实习最优选择应该是数据公司的数据岗,然而现实是这样的岗位由于太过重要,基本不会招实习生。 所以建议找一些统计量化相关的或者计算机相关的实习。
五、热门数据科学项目
1、 哈佛大学Harvard University
专业介绍:哈佛大学的数据科学项目是由Computer Science和Statistics以及 the Institute for Applied Computational Science 联合授课,开设在哈佛的 Arts and Sciences 学院下。需要在3个学期内完成12门课。这个项目于2018 FALL才开始招生,目前统计到的大部分录取学生是top2和美本的学生。
申请要求:TOEFL建议113+、不接受雅思成绩、GRE建议330+,对于先修课方面要求修过微积分、线性代数、概率论和统计,至少精通一门编程语言(如python或R),并且对计算机科学有基本的认知。这个项目DDL是12.15,申请后统一审核。
2、 哥伦比亚大学Columbia University****
哥伦比亚大学的MS in Data Science 项目处于美国数据科学硕士申请难度的第一梯队。该项目为期1.5年,共需修读30个学分,无需撰写毕业论文。17年fall的master人数在75人左右,full time的学生大概55人,国际生里70%是中国人,所以大约是20个左右中国学生(基本一半陆本,一半海本)。
申请要求:GPA 均在3.5-3.9 、托福105 +、GRE 均在320+(prefer325)。 倾向于有理工科背景,扎实掌握着数学、统计或电脑编程技能的学生。该专业比较倾向于cs、物理、数学、统计等专业,要求申请者拥有一定的数学及编程基础,最好学过微积分、线性代数、计算机编程等课程。
3、 斯坦福大学Stanford University****
斯坦福的数据科学相关的专业有两个,一个是统计系下的Data Science track,还有一个是ICME(Institute for Computational & Mathematical Engineering)的数据科学,课程设置也比较像,差距在于录得人背景不一样。ICME录得人背景相当Science,基本都是数学、物理背景、计算机的都很少,而且相当看重你的Research Experience,光上课没有用的,每年录的中国人也很少,因为项目本来就很小。而Statistics相对来说录的人多一些,如果是统计背景的话,我建议直接申Statistics,据说14年录了比较多中国人。学制:5 Quarters(1年包括3个Quarters)。