MDSML 的课程结构设计围绕核心能力与跨学科应用展开。学位要求学生完成五门核心课程,总计20学分,确保具备扎实的理论基础与研究能力。核心课程包括:
- Introduction to Big Data for Industry(DSA5101,4学分):聚焦大数据在工业场景中的应用,帮助学生理解数据的获取、存储、处理与分析链条,以及在实际工业环境中的挑战与解决思路。
- Optimization Algorithms for Data Modelling(DSA5103,4学分):讲解用于数据建模的优化算法,涵盖从经典方法到现代优化技术,提升模型的效率与性能。
- Principles of Data Management and Retrieval(DSA5104,4学分):聚焦数据管理、检索与组织,帮助学生建立高效的数据治理与检索能力,是数据科学工作流的重要基础。
- Principles of Machine Learning(DSA5105,4学分):系统介绍机器学习的基本原理、常用算法及其应用路径,是进入后续研究与实务的核心技能。
- Deep Learning: Foundations and Techniques(DSA5106,4学分):深入探讨深度学习的理论基础、网络结构与训练技巧,适用于处理高维和复杂模式识别任务。
在选修课程方面,学生需要再完成五门课程(共20学分),以扩展专业深度和应用广度。课程覆盖多个领域与应用场景,主要分布在数据科学、数学系、以及其他相关系部,示例包括:
- DSML Industry Consulting and Applications Project(DSA5201,4学分):结合行业案例,锻炼从问题定义到解决方案落地的全过程能力。
- Advanced Topics in Machine Learning(DSA5202,4学分):前沿主题,帮助学生跟踪最新研究进展并拓展技术视野。
- Visual Data Processing and Interpretation(DSA5203,4学分,SSG subsidised):处理和解读视觉数据的技术,适用于计算机视觉相关任务。
- Data Science in Quantitative Finance(DSA5205,4学分,SSG subsidised):数据科学在金融领域的应用,提升在量化金融场景的分析与建模能力。
- Text Processing & Interpretation with Machine Learning(DSA5207,4学分):面向文本数据的处理与分析,结合机器学习方法的应用。
此外,还有一些来自其他系的课程,如 Natural Language Processing(CS4248,4学分,SSG subsidised)、Cloud Computing(CS5224,4学分)、Knowledge Discovery and Data Mining(CS5228,4学分)、Big-Data Analytics Technology(CS5344,4学分,SSG subsidised)等,进一步丰富了跨领域的知识结构。ST系列课程如 Statistical Foundations of Data Science、Applied Regression Analysis、Statistical Analysis of Networks 等,也为学生提供统计与分析的坚实基础。









