在香港岛与九龙之间,车流与霓虹把城市切成无数实时数据切片。香港理工大学人工智能与大数据计算理学硕士(MSc in Artificial Intelligence and Big Data Computing,简称 AIBD)就像一块嵌在闹市的“多核处理器”,把算法、算力与场景悄悄焊接在一起。以下文字试图拆开它的内部结构,为正在考虑“升级自己”的人提供一份非官方说明书。
一、课程骨架:把“AI”与“Big Data”焊成同一条总线
项目采用一年全日制节奏,毕业需修满 31 学分。整体被切成五条线:
Programme Core(3 学分)
只有一门“人工智能与大数据计算编程”,却在 13 周里把 Python、分布式调用、GPU 加速与容器化打包串成一条工作流,结课时要交出能在 AWS 或阿里云一键起服的镜像。
AI Core(6 学分)
从“机器学习与数据分析”“自然语言处理”“计算机视觉与图像处理”“高级人工智能”里任选两门。课堂作业常把香港公开数据集直接塞进模型:地铁闸机图像、政府新闻稿、路政署路面照片,结课前要跑通从预处理到可解释性报告的完整链路。
Big Data Core(6 学分)
在“大数据计算”“数据挖掘与数据仓库应用”“高级数据分析”里任选两门。服务器集群就在校园地库,200 张 Tesla V100 24h 开机,学生可以用 Slurm 自己提交任务,体验把 2TB 出租车 GPS 轨迹压进 Spark 集群时风扇突然飙到 80 分贝的“仪式感”。
Dissertation(9 学分)
必修论文,可换“选修 + 小项目”但几乎没人舍得换。导师池横跨计算机、数学、金融、地理、医疗五个系,近年题目包括:
用联邦学习把多院影像数据拼成肺癌早筛模型
把港交所 Level-2 逐笔成交压成高频特征,预测 5 秒内价差跳动
基于手机信令的跨境货车排队时间仿真
论文答辩前,学生需在系里“开放日”摆海报,常有企业现场递名片。
Elective(6 学分)
可在 AI、Big Data 两条主线里继续深挖,也可到隔壁系“蹭课”——区块链安全、软件项目管理、网络协议、优化理论、统计推断,甚至去商学院选“金融科技合规”,把模型落地所需的监管视角一并打包。
二、时间编排:让“白天实习 + 晚上跑实验”成为可能
课表默认晚间 7:00–10:00,一周一到两次;实验室 24h 刷卡进入。多数人会把白天空出来:
去深圳湾对岸的科技公司做算法实习,晚上回校把公司数据带回集群继续调参;
或倒过来,白天在实验室跑论文实验,晚上去中环参加 Meet-up,把最新开源工具包介绍给金融公司量化组。
夏季小学期还会加开 3 周短课:Docker/K8s 实践、强化学习前沿、图神经网络工作坊,方便错过秋季选修的人“补课”。
三、师资与硬件:跨系“混编”与地下算力中心
授课团队来自计算机、数学、工业工程、地理与医疗科技五个系。核心讲师 18 人,其中 11 人同时兼任深圳、香港两地研究院的兼职研究员,能把两地政府与企业的数据接口直接带进课堂。
硬件层面,学校把一座旧防空洞改成“大数据计算中心”:
冷通道封闭,42U 机柜 50 组,CPU 节点 1200 核,GPU 节点 200 张 A100/V100;
校内 40G 光纤环网,与香港交换中心 HKIX 直联,拉数据到 AWS 新加坡区 8 毫秒延迟;
学生账户默认 2TB 分布式存储,可随作业量扩容,毕业前可申请把实验环境整体打包成镜像带走。
四、职业出口:让“模型”对接“场景”
香港本地市场对 AIBD 岗位拆得细:银行要模型可解释,物流公司要毫秒级响应,零售品牌要客户画像,医疗集团要联邦合规。项目 2024 届毕业生 82 人,去向分布大致如下:
金融科技 28%:投行模型验证、虚拟银行反欺诈、保险公司自动核保;
互联网 24%:云服务商解决方案、社交平台推荐系统、游戏公司 AI 对战;
物流与供应链 15%:港口货柜调度、航空配载优化、快递动态定价;
医疗与生物 12%:医学影像标注平台、药物分子生成、可穿戴设备预警;
继续读博 10%:留港、赴欧或回内地,方向从联邦优化到时空图神经网络;
其余 11%:创业、家族企业数字化、或干脆把论文里诞生的模型做成 SaaS 工具。
求职渠道除了常规招聘会,更依赖“课程嵌入式内推”:
秋季的“AI in Fintech Night”会把银行科技子公司的真实数据包提前两周发给学生,现场 3 小时 hack,直接发实习面试;
春季的“Big Data Expo”把毕业设计海报摆到理工楼展厅,企业 CTO 遛弯式逛展,看中就拉去隔壁咖啡厅聊 offer。
五、城市与校园:把维港当成一条实时数据河
主校区卡在红磡海底隧道口,去中环 15 分钟地铁,去深圳福田 48 分钟高铁。对 AIBD 学生而言,城市就是实验室延伸:
在“交通大数据”选修里,把港铁 20GB 进出站记录拖进 Spark,作业是预测周末午夜加班客流;
在“城市计算”项目里,把 OpenStreetMap、气象感应器、社交媒体情绪值叠在一起,看台风前一天超市货架清空速度与网络关键词的滞后关系;
夜里从实验室出来,步行 10 分钟到维港海边,笔记本合上,对岸霓虹继续闪烁——那些光点本身,就是下一次作业的图像分割素材。
六、写在最后:把一年变成“可插拔的算力模块”
一年学制听起来短,项目却刻意把“课程—论文—实习”做成可并行线程:
白天在公司用企业数据训练模型;
晚上把脱敏后的实验结果带回学校,写进论文;
周末再把论文里调出的 trick 反哺给公司,挣回下一学期的生活费。
等证书拿到手,你会发现简历上不再只有“会什么”,而是多出一条“能把模型安进业务流水线”的证据。香港这座港口城市继续吞吐数据,你则像一块可插拔的算力模块,随时可以装进金融、物流、零售或医疗的插槽,成为下一条实时数据流里的隐形齿轮。









