2021年最火的数据科学DATA SCIENCE 研究生解析
科学数据的定义
随着互联网的发展,产生了越来越多的数据,而能够有效分析这些数据并将它们应用于商业的人才却极其短缺,在这种趋势下,数据科学专业应运而生。
数据科学(英语:Data Science),是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。
从上图可以看出,数据科学是一门横跨多领域的交叉学科,这些学科包括:计算机科学、数学、统计学、商科以及其他应用领域。
有人说数据是当今世界的石油,借助合适的工具,技术,算法,我们可以使用数据并将其转换为独特的业务优势。
而这就是数据科学家们正在做的——
挖掘数据的科学价值,进行数据领域的底层技术研发。
数据科学的应用领域
数据和数据分析已经深深地影响和作用于我们的生活,其在各行各业的应用也极大提高了我们的生活的便利度和产出效率。
政府就可以通过对大数据的不同应用及时高效地监测到问题,为制定相关方针政策服务。
比如基于大数据分析,找出雾霾的根源在哪里,是因为车辆尾气还是因为钢厂排放,堵车问题的解决是通过修路还是改变出行方式,或是建立副中心,而不仅仅是通过一刀切的限号方式来解决。又比如美国国家税务局已经在它的返回审查程序中集成了大数据分析功能:通过分析大量的数据,美国国家税务局能够检查、预防和处理避税和诈骗行为。
数据科学家是利用数据创造奇迹的巫师
在商业环境中,一个熟练的数据科学家善于将原始数据转化为有意义的见解,帮助公司使用数据来驱动决策。
例如,企业要进行采购决策。
那么企业需要对客户支付进行供应链分析。在企业的内部交易系统中有购买订单、发票和支付记录,数据库中还有供应商的详细信息等。数据科学家能够创建一个程序,它不仅可以显示订单频率和付款时间的趋势,还能通过建立预测模型,来为可能有类似商业行为的团体解读季节性趋势(即在特定时间段内相对稳定的起伏),通过对季节性趋势的解读,数据科学家可以预测消费者对库存商品的购买行为,并基于客户支付信息预测相关的采购预算。
但数据科学家不会就此止步,因为采购并不仅是季节性趋势这么简单。
除了通过企业内部资源获取营销数据,为了优化模型,他们还会利用网络数据爬取工具来获得一些常规的经济指标,如就业率和国内生产总值,以及一些特定的指标:如供应商的年度和季度报告、社交媒体的普遍情绪,甚至针对某一新闻事件进行监测。
他们从宏观到微观,通过建立模型,来获取任何可能影响消费者购买行为的数据,从而提供具有科学依据,富有说服力的商业建议。
03 你适合申请数据科学专业研究生吗?
回答这个问题之前那,首先我们要弄清楚究竟哪些人适合申请数据科学硕士,以及数据科学教应具备哪些基本能力要求,同学们可以根据自己的情况进行评估,究竟你是否适合申请此专业的研究生。
哪些专业背景适合申请数据科学专业?
首先,本科是计算机科学(Computer Science)的同学,无异最符合大多数数据科学项目申请条件的,因为大多数数据工作都是通过编程和数据库的相关手段进行的,并要求学过统计、微积分、高级语言,如哈佛大学对于MSDS(Master of Science in Data Science)的本科背景要求是:希望有微积分、线性代数,概率和统计等相关课程,能使用至少1种编程语言,例如Python或R,了解计算机科学概念。
其次,本科背景是统计、数学或应用数学,且有一定编程基础的同学也可以申请,这都是很好的匹配专业。
最后,商科背景出身,但量化背景较强的商科专业,比如金工,但又希望能选择一个STEM(Science,Technology,Engineering,Mathematics)专业的同学,那数据科学专业显然也是个非常好的选择。
所以说,如果你有比较强的编程背景,又有比较好的数理基础,那你就很有竞争力;而纯商科背景的同学,如果没有强的量化背景、完全不懂编程,那么可以考虑数据科学(Data Science)和商业分析(Business Analytics)混合申请,因为后者相较数据科学更加偏商科,多开在商学院,对商科背景接纳程度大很多。
数据科学家是什么人?
数据是冰冷的,只有专业人才能使数据有生命有价值
怎样才是数据科学领域的专业人才?什么是数据科学家?
Google首席经济学家、加州大学伯克利分校教授哈尔·范里安(HalVarian),在2008年10月与麦肯锡总监JamesManyika先生的对话中,曾经讲过下面一段话:
“我总是说,在未来10年里,最有意思的工作将是统计学家。人们都认为我在开玩笑。但是,过去谁能想到电脑工程师会成为20世纪90年代最有趣的工作?在未来10年里,获取数据——以便能理解它、处理它、从中提取价值、使其形象化、传送它——的能力将成为一种极其重要的技能,不仅在专业层面上是这样,而且在教育层面(包括对中小学生、高中生和大学生的教育)也是如此。由于如今我们已真正拥有实质上免费的和无所不在的数据,因此,与此互补的稀缺要素是理解这些数据并从中提取价值的能力。”
范里安教授在当初的对话中使用的是Statisticians(统计学家)一词,虽然当时他没有使用数据科学家这个词,但这里所指的,正是现在我们所讨论的数据科学家。
朝乐门在《数据科学理论与实践》中的定义为:
数据科学家是将现实问题映射或转换为数据问题之后,主要采用数据科学的理念、原则理论、方法、技术、工具,通过将数据尤其是大数据转换为知识和智慧的过程中,为解决"现实世界中的问题"提供直接指导、依据或参考的高级专家。
简单的概括,就是能用数据讲故事,能用数据解决问题的人。
数据科学家做什么?
有研究人员以Indeed、Linkedln和百度百聘为数据来源,搜集了2020年3月18至5月28期间,中国、美国、英国、德国、加拿大、日本、澳大利亚和韩国八个国家五种语言的数据科学家招聘公告,挑选出206则具有代表性的招聘公告,提炼出数据科学家的能力要求和岗位职责。
这些职位的主要岗位职责包括:
(a)提出以数据为中心的解决方案;
(b)从海量数据中发现有价值的信息;
(c)面向具体业务的算法和模型研发;
(d)进行假设检验与试验设计;
(e)数据治理与数据质量控制;
(f)数据产品的研发及基于数据的传统产品的创新;
(g)跨部门和跨领域合作。
而具体的能力可以分为与数据科学相关的能力要求以及综合能力要求两类
数据直接相关的包括计算机科学、数学、统计、数据挖掘、数据可视化、数据管理等等具体能力。
上述与数据非直接相关,但是是数据科学家所需要具备的素质,同时也是企业招聘中所非常看重的能力:包括团队工作中的沟通与合作能力、解决问题的能力、自学能力、细节导向型、抗压和应变能力、领导能力和数据科学家的3C精神。
所谓数据科学家的3C精神,包括解决问题的原创性(Creative)、思考问题的批判性(Critical)和提出问题的好奇性(Curious)。
部分招聘公告将数据科学家的3C精神称为"喜欢有挑战的工作",且特别提到上述三种精神的“天生"特点,强调应聘人才对数据问题的热爱和天生才华。
如Stanley Black & Decker公司要求数据科学家要有天生的好奇心以及对实证研究和解决问题的强烈热情;Loblaw Companies Limited要求数据科学家应具备精湛的分析和批判性思维能力。
这和托马斯和帕蒂尔在《哈佛商业评论》杂志上发表的《数据科学家:21世纪最性感的职业(Data Scientist: The Sexiest Job of the 21st Century)》文章中数据科学家应该具备的基本知识结构与综合能力高度匹配:他们沉浸在大数据中时能有价值发现,会编写程序代码,永远对数据充满好奇心,并且具备数据分析和交流沟通能力。
The Data Science Venn Diagram by Drew Conway
自我评估:你适合申请DS研究生吗?
总结一下,作为该专业的申请者,不妨反思一下,你是否符合这些特征:
(a)热爱数学,具有良好的数学、统计学基础
(b)敏锐的数据嗅觉,可以不仅可以数据视觉化更能数据“故事化”
(c)优秀的语言学习者,当然“计算机语言”也是其中一种
(d)充满好奇心,喜欢有挑战性的工作
(e)有能力把想法与其他人去交流 (不是用数学的语言介绍,而是用商业的语言给别人进行交流沟通)
如果答案是YES,那么恭喜你,你将会是潜在的优秀数据科学家。
而据统计,数据科学家一般都具有高学历——88%的数据科学家至少是硕士学位,46%的数据科学家是博士学位。
这表明想要成为一名数据科学家需要非常好的教育背景,那么取得此相关专业的硕士以上的学位将会是必须,接下来你只需静下心来,了解关于数据科学研究生硕士申请的更多信息,并做好相应的准备,稳扎稳打,朝着你的目标