如果把城市比作一张动态网络,地铁刷卡就是边,社交媒体发文就是节点,而人的情绪、迁移、选择,则在毫秒间更新权重。计算社会科学理学硕士(MSc in Computational Social Science)便位于这张网络的交叉口——它既不用“文科”或“理科”自我设限,也拒绝把“人”简化为冰冷数字。项目隐藏在香港中文大学(深圳)的道扬书院旁,默认两年,可一年加速,亦可三年兼职。以下是一份非官方手记,写给想把问卷与代码握在同一只手里的人。
一、课程骨架:把“社会理论-数据工程-伦理法规”压进同一条流水线
1. 核心通识(12 学分)
计算社会科学导论
把“小世界、同质性、结构洞”用 Python 的 NetworkX 跑一遍,作业是给班级微信群画一张动态图,看谁在期中周成为“信息桥”;
社会统计与因果推断
从 RCT 到双重差分,再到断点回归,用珠三角产业转移数据验证“高铁开通是否提升工资”;
数据工程与编程
Git、SQL、Pandas、Spark 一条龙,结课时要能把 2 亿行微博脱敏数据在单机上跑出情感极性;
研究伦理与数据隐私
把 GDPR、网安法、个人信息保护法拆成 18 条“可做/不可做”清单,再写一份 800 字“用户知情同意”小册子。
2. 方法工具箱(9 学分)
三选二:
机器学习与社会预测
文本挖掘与意见挖掘
空间分析与遥感
每门课自带 GPU 机房,学生可把模型封装成 RESTful API,供下一届调用。
3. 领域深度(9 学分)
城市与迁移
社会网络与组织
数字治理与公共政策
经济与劳动市场
健康与福祉
领域课没有标准答案,只有“可解释性”要求:期末必须交出一份“社会人能看懂”的技术简报。
4. 毕业设计(6 学分)
两条路径:
纯课程:再选两门领域课 + 一份 8000 字技术报告;
研究论文:进实验室或合作机构, 12 周完成课题,近年题目举例:
《基于移动信令的跨境学生通勤情绪研究》
《短视频平台“失业叙事”的主题演化与地域差异》
《利用街景图像测度老旧小区改造前后主观幸福感》
《微博热搜操控检测:一种融合图神经网络的异常识别方法》
二、时间编排:让“白昼实习”与“夜晚跑模型”无缝并发
秋季:白天上课,晚上泡机房,周末去深圳湾做“徒步-情绪”配对调研;
春季:选修 + 开题,清明不回乡的人留在校园跑爬虫,抓“踏青舆情”;
夏季:全职论文,可留在龙岗 lab,也可去广州政数局、香港 NGO、澳门社工局同步完成;
三、硬件与数据:把校园变成“可检索的社会”
社会调查实验室:CATI 坐席 40 台,可一键外呼大湾区手机样本,学生自己写问卷、自己清洗数据;
行为实验机房:30 间独立隔间,眼动、皮电、鼠标轨迹同步记录,常被借来做“算法推荐是否加剧极化”实验;
GPU 集群:200 张 RTX4090/A6000,支持大模型微调,学生账户默认 5 TB 存储,可扩容;
校外接口:深圳地铁信令(脱敏)、微博历史舆情、澳门出入境记录、香港房屋署公屋维修工单,对学生开放申请,伦理委员会 48 h 内批复。
四、产业接口:让“模型”与“客户 KPI”同场竞技
秋季“数据开放日”:企业把痛点贴出来——
“如何 30 分钟发现直播间‘水军’?”
“老旧小区改造,如何 1 周完成幸福感前后测?”
学生举牌组队,像 hackathon 一样抢单,期末交付模型,甲方现场打分。
春季“政策沙盘”:与深圳市政数局合作,模拟“某区学位紧张”场景,学生需在 6 小时内完成“数据-模型-政策简报”全链条。
近年合作名单:腾讯、字节、快手、深圳市政数局、香港社会服务联会、澳门社工局、大湾区青年协会。
五、职业出口:让“计算社会科学家”成为可迁移的元标签
毕业流向大致如下:
互联网与数据产品 35 %:推荐算法、用户研究、数据科学;
政府与公共部门 25 %:政数局、政策研究室、智库;
市场与咨询 15 %:用户洞察、品牌咨询、ESG 分析;
继续读博 10 %:港中文本部、Columbia、Northwestern、LSE;
金融与风控 10 %:ESG 评级、消费金融、保险反欺诈;
其余 5 %:创业、媒体、家族企业数字化。









