从云到端:边缘计算正重塑世界
深夜,街头的一名在逃犯正低头行走。他没想到,就在这一瞬间,头顶摄像头实时识别了他的位置,并将信息传给警方。精准围捕,就这样悄然展开。
这一切,不再是电影桥段。背后的导演,正是当前数据科学领域的新趋势——边缘计算(Edge Computing)。
过去,我们习惯让数据“长途跋涉”,上传到远在几十公里外的云端服务器进行处理。就像街头上万个摄像头的视频,全都送往远方的计算中心分析,也就是云计算。逃犯的正脸或许在傍晚六点被清楚拍下,但等数据传输、分析、比对完毕,可能他已经吃过晚饭、睡了一觉,又再次出发。这样的延迟,在分秒必争的现实世界里,往往是致命的。
而边缘计算,颠覆了这一切。
它把“智能大脑”直接部署在摄像头、手表、汽车这些本地设备上。让数据在产生它的地方,就地计算,瞬间决策。于是,你的智能手表才能在你心跳异常的那一刻,立刻发出提醒。无人驾驶汽车才能在危险的那一秒,果断刹停。敏感数据也无需远程传输,更安全。
过去,数据是被动的、等待分析的对象;现在,数据在产生的那一刻就被分析、被决策。数据科学,正在从“云端智能”走向“实时智能”。
ReThink Technology Research预测,到2030年代初,全球74%的数据将在传统数据中心之外处理。麦肯锡也将“云与边缘计算”列为未来十三个关键技术趋势之一。
这一趋势也对数据科学家提出了新要求。
他们不仅要懂算法,还要掌握模型优化、量化、剪枝、知识蒸馏等技术,让AI在体积小、功耗低的条件下保持高性能。
当然,边缘计算只是冰山一角,它揭示了一个更宏大的趋势,AI和数据科学正在从实验室扩展到世界的每一个角落。
医疗健康、商业决策、社交媒体、交通规划、环境保护……几乎没有一个领域能脱离数据科学家的支持。
《哈佛商业评论》把数据科学家称为“21世纪最性感的职业”。世界经济论坛报告显示,2025年-2030年增长最有效的15个职业中,有五个与数据科学直接相关,占比三分之一。
东北大学研究预测,到2031年,数据科学相关岗位将增长超过40%。
当AI从“云端”走向“身边”,数据科学家也在走向世界的每一个“边缘”。
可以说,学数据科学,就是学习理解世界的“新语言”。在AI时代,它是具有创造力、也具有安全感的选择之一。
今天我们就来谈谈,这个“21世纪最性感的专业”——数据科学(Data Science)。
数据科学专业介绍
很多人听到“数据科学”,脑海里浮现的可能只是代码、算法或密密麻麻的表格。其实,这门学科远比想象中更有趣、更重要。
那它到底研究什么?为什么说学数据科学就像在学一种“理解世界的新语言”?美国数据科学的本科和硕士专业有什么不同?我们将一一解答。
下面,我们就从最核心的问题讲起——什么是数据科学?它究竟培养怎样的人?
2.1 数据科学与数据科学家
什么是数据科学?
Metamarket公司的CEO Mike Driscoll在美国知乎Quora进行了回复,我和大家分享一下他的回复:
研究数据科学,一方面需要如极客那般刻苦钻研,一方面需要像统计学家那样拥有完美的理论。
Note:极客是形容对计算机和网络技术有狂热兴趣并投入大量时间钻研的人。
- 数据科学家不仅仅是极客——极客只关心如何调试一行Bash脚本或Pig脚本,没人会在意非欧氏距离矩阵。
- 数据科学家也不仅仅是统计学家——后者只关注如何完成一个理论的证明或构建出一个完美的模型,很少有人会使用R语言将数据文件读入系统,从而进行后续的分析。
Mike称,数据科学是一门关于数据的工程,它需要同时具备理论基础和工程经验,需要掌握各种工具的用法。
因此有这样一个说法:数据科学家是计算机科学家中的统计行家,是统计行家中的计算机科学家。
但我更喜欢数据科学家Joel Grus的定义,数据科学家是能够从混乱数据中剥离出洞见的人[3]。
今天,世界各地有无数人着力于此。
包括美国总统的竞选团队。当年奥巴马的竞选团队就雇用了很多数据科学家通过数据洞察,辅助总统竞选中的拉票决策。
举个例子,数据科学们搜集了选民的相关数据,包括他们的年龄、性别、家庭状况、政治观点、社交媒体活动等,这些数据汇总成了一个庞大的数据库。
接着,他们通过数据挖掘技术从不同选民中甄别出那些需要更多关注的两类群体:那些被认为是“摇摆州”的选民,以及潜在的新选民。
然后,对于“摇摆州”的选民,他们通过数据分析,确定选民们关心的问题和优先考虑的政策,针对性地制定竞选信息和政策提案。
例如他们发现大多数选民关心医疗保健,希望获得更便宜和更可及的医疗服务,于是便提出医疗保健改革计划,减少人们医疗费用,扩大医保覆盖范围等。
而对于潜在的新选民,则通过社交媒体和数字广告大量铺陈竞选广告,吸引年轻人和少数族裔参与到选举中来,因为这些群体通常对政治参与有较低的门槛。
同时,数据科学家们能够通过数据和行为分析,知道哪种竞选广告在哪个平台上最有效,以及何时发布最有利。他们就像操纵数据的魔法师,帮助奥巴马团队在混乱的选民数据中挖出洞见,做出成功的竞选决策。
除了总统竞选,数据科学和我们生活的方方面面都在进行深度的融合,这场数据竞争的硝烟正在弥漫开来。
2.2 美国数据科学专业培养体系
如果说智能终端的“边缘计算”代表了技术的下沉,那么数据科学教育则体现了智能时代的“人才上升”。美国的数据科学教育呈现出清晰的金字塔式培养路径:本科阶段夯实基础、培育通才,硕士阶段聚焦深化、塑造专精。
1)数据科学本科项目
本科层面的数据科学通常作为独立专业开设。这类项目多隶属于计算机科学学院(College of Computing / Engineering)、文理学院(College of Arts and Sciences)或统计与数据科学学院(School of Statistics / Data Science);
部分学校则以跨学院合作的形式开设,比如斯坦福的数据科学BS项目就由斯坦福大学的统计系、数学系、计算机科学系以及管理科学与工程系共同支持,伯克利的数据科学专业隶属于计算、数据科学与社会学院(College of Computing, Data Science, and Society, CDSS)。
这种多元的院系归属本身就揭示了数据科学的内在特质:它既需要工科的严谨,又离不开文理的视野。尽管各校课程结构不尽相同,但前列项目普遍围绕三大支柱构建培养体系:
坚实的“数学-统计-计算”三重基础
无论未来走向哪个应用领域,理解算法的本质、掌握模型背后的理论,是数据科学家区别于普通数据分析师的关键。
在伯克利、斯坦福、卡内基梅隆大学等前列名校,你会遇到一系列硬核课程:从微积分、线性代数、概率论构筑的数学语言,到回归分析、贝叶斯统计、因果推断组成的统计思维,再到以 Python/R 编程、数据结构、机器学习导论为核心的计算实践。
以伯克利为例:数据科学低年级课程要求
Foundations of Data Science —— 数据科学基础
Calculus I & II —— 微积分 I & II
Linear Algebra —— 线性代数
Program Structures —— 程序结构
Data Structures —— 数据结构
Domain Emphasis —— 领域侧重
这些课程环环相扣,共同指向一个目标:让学生不仅能调用工具,更能设计模型、解释结果,并做出可信的决策。
与真实世界接轨的“跨学科融合”
美国数据科学教育最鲜明的特色,是坚决反对“纯技术”培养。几乎所有前列项目都通过 “领域专向”(Domain Emphasis or Concentration) 机制,强调学生将数据技能应用于具体领域。
比如,伯克利的数据科学专业要求学生选择至少一个领域重点方向,提供的选择超过20个:从传统的商业与工业分析、经济学,到前沿的分子与基因组生物学中的计算方法,再到人文关怀的社会不平等、数据艺术与人文等等。
斯坦福的三个本科项目也是“大跨界”。
斯坦福除了强调技术导向的数据科学理学学士(B.S. in Data Science),还创新性地开设了数据科学与社会系统文学学士(BA in Data Science & Social Systems),将数据科学与心理学、社会学、政治学、经济学等社会科学深度融合。
艺术与文化分析的数据科学文学学士(BA in Data Science for Artistic and Cultural Analysis),大胆地将数据科学应用于文化艺术领域,批判性地、哲学地思考数据在社会、文化和艺术中的作用。每个学位还设置了不同的Pathway,供学生深入探索。
贯穿始终的“伦理、沟通与社会责任”
在算法深刻影响社会的今天,新一代的数据科学家必须是负责任的数据管理者。因此,数据伦理(Data Ethics) 与社会影响(Social Impact) 已成为课程体系的标配。
斯坦福在每个数据科学项目中都嵌入了伦理模块。在数据科学与社会系统专业中,学生需要修读“Justice”、“AI Safety”、“Data Privacy and Ethics”等课程;即使在技术性最强的B.S.项目中,学生也必须选择一门探讨“数据、技术、伦理”的课程。
纽约大学在专业目标中明确提出:要培养'具备道德和科学责任感的数据管理者(ethically and scientifically responsible stewards of data)',并将数据伦理课程(Responsible Data Science)设为必修课程。这种定位反映了业界对数据科学人才的新期待:不仅要懂得如何分析数据,更要懂得为何分析、为谁分析。
从本质上看,美国本科的数据科学教育,其目标不是培养单一的“程序员”或“统计师”,而是塑造这样一种人:他们能用计算语言理解世界,以统计思维审视不确定性,在跨学科团队中有效协作,并始终对技术的影响保持清醒与负责。
2)数据科学硕士项目
经过本科阶段的通识培养,硕士阶段呈现出更加多元和专精的发展路径。
在过去10年里,美国大学陆续开设200多个与数据科学有关的硕士专业。尤其是近几年,开设了数据科学、商业分析和数据分析专业的学校数量更是井喷(▶如下图所示):
美国的数据科学硕士专业一般开设在计算机学院、工程学院、数学、统计学院或者系下。多元的院系归属带来不同的培养特色。
举个例子,计算机学院的培养方案当中,可以更多利用学校计算机的资源。
比如卡耐基梅隆大学的数据科学专业开设在计算机学院下,学生除了5个核心课程外,其余的课程可以在卡内基梅隆的计算机学院下开设的超过600门课中进行选修,当然项目对学生的计算机背景会有相对更为严格要求,卡内基梅隆的数据科学硕士要求其必须在项目开始前完成相应的计算机系统的课程,包括对往年录取学生的背景分析,具有更强计算机背景(包括本科专业,以及计算机实习或者项目经验)会更受招生官的青睐。
数学学院的培养方案,多从数学学科出发,更注重数学方面的理论基础,因为院系的师资力量就决定了课程设置。
例如纽约大学的数据科学硕士(Master’s in Data Science)就是设立在纽约大学数据科学中心下(The Center for Data Science ,简称CDS),CDS附属在著名的库郎数学科学研究所 ,对申请者数学背景(本科数学科目GPA、GRE数学部分的成绩)较为看重,往年录取者GRE数学平均分在168分以上。
总的来说,数学给到大数据的理论性支撑会更多,而具体的大数据平台开发等,需要依赖于计算机语言去实现,比如说Java、Python等。
除了单独开设的数据科学专业,其他专业也将数据科学与传统的项目相结合,增设了许多新的项目,以顺应市场的人才需求,这样的跨学科单独设置学位比本科阶段更加聚焦和深入。
例如,华盛顿大学圣路易斯分校(Washington University in St. Louis)医学院于2025年推出全新的“生物医学数据科学与人工智能”硕士学位(Master of Science in Biomedical Data Science and AI)。项目隶属于I2DB(信息学、数据科学与生物统计)部门,面向数据、科技与医疗交叉领域的人才需求。
学生毕业后可以成为健康数据科学家或数据分析师,为医疗决策和政策制定提供数据驱动的建议。
e.g 他们可以运用数据挖掘和机器学习技术来识别病例的相似性、患者流动模式以及医疗资源的利用效率,帮助医院和决策者优化医疗资源的配置,改善医疗服务质量,降低医疗成本。
同时,公共政策、公共管理、公共事务也是近两年来数据科学另外的重要的应用领域。
美国以及英国的学校都开设了这样的交叉学科的硕士项目,他们把数据科学与公共政策、公共管理、公共事务相结合起来。
例如芝加哥大学的 MS in Computational Analysis and Public Policy (MSCAPP,计算分析与公共政策硕士);
乔治城大学的Master of Science in Data Science for Public Policy (公共政策数据科学理学硕士);
伦敦政治经济学院(LSE) 的Data Science for Public Policy(公共政策数据科学)等等。
除此之外,数据科学和商业分析、公共卫生、生物、气候变化、神经科学、物理、医疗等等都在不断交叉融合中。
从本科的“通才基底”到硕士的“专精深化”,美国数据科学教育构建了清晰的人才培养阶梯。
这种教育体系恰恰呼应了技术发展的需求:当智能从云端“下沉”到边缘,当数据科学从“批处理”走向“实时智能”,行业需要的是既拥有扎实基础、又能深入特定领域的多层次人才。
数据科学中美就业:哪里是你的未来?
如果你正在考虑学习数据科学,一定会好奇:这个专业毕业后到底能做什么?在中国和美国就业情况有何不同?让我们一起揭开这个谜底。
3.1 中国就业全景
在中国,数据科学正享受着“国家队”的强力支持。
中国信息通信研究院监测数据显示,截至2025年9月,全国有超过5300家人工智能企业在同时发力,这个产业每年以24%的速度疯狂增长。为什么这么快?因为从国家到地方,都在全力推动“AI+”战略,就像给整个行业装上了火箭推进器。
国家层面,《“十四五”数字经济发展规划》《关于深入实施“人工智能+”行动的意见》等政策相继出台,为产业发展把舵定向;
地方区域也密集释放政策红利,首都北京印发《北京市加快人工智能赋能科学研究高质量发展行动计划(2025年-2027年)》,以人工智能引领科研范式变革,加速各领域科技创新突破;广东省推出“人工智能+”赋能千行百业专项行动;浙江省以“未来产业先导区”建设推动AI与实体经济深度融合......
在这样的大背景下,数据科学人才正被推向舞台中央。那他们都去了哪里?
从中国人民大学统计与大数据研究院毕业生的就业去向中,我们可以看到三条清晰的职业路径:
体制内岗位
国家部委与大型央企,正成为数据科学博士和硕士毕业生的热门去向。国家发改委、中国人民银行总行、中国人民银行征信中心等国家部门,以及中信集团等大型央企,都在积极吸纳数据科学人才。
这些机构需要的已不只是数据分析师,而是能用数据支持宏观经济决策、政策建模的“数字智囊”。
同时,北京、上海、浙江、湖北等地纷纷成立省级数据集团,成为“体制内的科技公司”。它们正在建设数据要素市场,也为数据科学人才提供了兼具科研性与稳定性的全新岗位选择。
互联网高科技企业
互联网企业是毕业生的主要去向之一。从字节跳动等新兴科技企业,到百度、阿里巴巴、腾讯等传统互联网大厂,都在持续招聘数据团队。
行业赋能:数据科学的跨界融合
随着数字化转型深入推进,金融、医疗、教育到制造业、农业、能源等传统行业都在创造大量交叉岗位。
在中国人民大学统计与大数据研究院 2025 届毕业生的就业报告中,相当比例的学生选择了金融机构、制造企业、咨询公司等传统领域。
对比中美数据科学的发展可以发现,这一领域正进入“深水区”:算法、算力与数据不断演进,更新速度远超以往。今天的热门技术,几年后可能被新范式取代;而那些如今尚不被关注的方向,也许会成为下一轮浪潮的核心。所以,选择专业时,不应只看眼前的“风口”,更要理解背后的逻辑与趋势。
与此同时,社会对数据科学人才的需求正在快速增长。科技、金融、医疗、教育、能源、城市治理……几乎每个行业都在吸纳懂技术、会分析、能沟通的跨学科人才。具备国际视野、逻辑思维与工程实践能力的年轻人,正成为全球最稀缺的“智力资本”。对高中生与本科生而言,学习数据科学,不只是为了找到一份好工作,更是为了学会理解世界的新语言,参与下一场科技与社会的共演。
但当我们谈论数据科学的光鲜未来,也必须清醒地看到:技术从来不是万应灵药。许多人以为,只要掌握了Python、算法或AI,就能轻松在智能时代立足。但这正是一种新的幻觉。技术能让你走得更快,却不能替你决定往哪儿走。









