“这是一个很有价值的项目,我们能够利用暑假学习新知识,提前了解和掌握研究流程。”
“这个训练营让我体验了学术研究与实践应用相结合的学习过程。”
“从文献综述到原型开发和评估,项目提供了清晰的学习路径。”
“如果时间能更长一些,就可以更深入地探索相关技术。”
(25暑期CS科研营学生反馈)
这些反馈来自参加了SMU计算机科学 2025 暑期研学科研营的同学们。从他们的分享中可以看出,他们在学习过程中收获了不少经验。接下来就和小编一起看看他们在这个暑假的学习与生活。
2025年暑期,SMU工程学院于7月4日至7月25日举办了为期3周的SMU Summer Research Bootcamp——计算机科学暑期研学科研营。
科研营不仅是了解美国工程教育的机会,也是提升学术能力、探索职业方向、积累研究经验的过程。
在科研营中,学生们每天9:30参加晨会,集中讨论研究问题,交流进展并接受指导。每周一、三、五还有3次专项研究指导。
此外,SMU工程学院 Hart Center职业发展中心还安排了2场讲座,帮助学生了解美国的科研与职场文化,学习沟通合作技巧,并介绍了国际学生实习及就业政策。
研究主题 : Data-driven Software Search Engine
研究背景及目标
在现代软件开发中,代码复用对效率和质量很重要。但在大规模代码库中找到合适的代码片段仍是一项挑战。传统的关键词搜索在理解编程意图和结构相似性方面有限。
此次研究的目标是探索数据驱动的软件搜索引擎的开发和评估,利用机器学习和语义代码表示,更好地理解开发者的查询。
主要研究方向包括:
-
探索基于结构、语义和使用模式的代码索引与搜索技术
-
研究代码的向量嵌入方法(如 CodeBERT、GraphCodeBERT)
-
实现可用于学术评估的软件搜索引擎原型
研究过程
首周:初期培训与文献综述
-
回顾代码搜索、神经网络代码表示及 API 推荐相关研究
-
熟悉 GitHub API、CodeSearchNet 数据集、Hugging Face 模型
-
确定子主题与实验方案
第二周:实验与原型开发
-
提取并预处理开源代码示例
-
应用机器学习模型生成代码向量嵌入
-
开发自然语言代码搜索的原型界面
第三周:评估与展示
-
使用精确度/召回率指标评估性能
-
分析错误案例并提出改进思路
-
准备演示文稿、书面报告及代码成果
7月25日,学生们在SMU工程学院计算机科学系进行了答辩,展示研究成果,演示开发的搜索引擎,并回答教授提问。最终所有同学顺利完成科研目标,获得了SMU与GEI颁发的结业证书及教授推荐。
研究收获
-
掌握在软件工程任务中应用机器学习模型的经验
-
学习构建语义代码搜索引擎组件的实践方法
-
提升研究能力和技术沟通技巧
-
为今后的学习与研究积累经验
文化与交流活动
Leadership workshop
7月11日和18日,SMU工程学院与Hart Center组织了2次交流活动。通过团队互动和讨论,学生们认识到理解文化差异的重要性,并学习了如何在新的环境中建立合作关系。
认识德州
科研营还安排了德州文化体验活动,包括参观 Fort Worth Stockyards 牛仔小镇、观看体育比赛、参观Dallas博物馆等,帮助学生们更好地融入当地生活。
学生们居住在SMU附近的公寓,配备基本生活设施,科研活动在SMU工程学院计算机科学系实验室的专用会议室进行。
科研营结束后,学校进行了匿名评估,参与学生普遍表示认可并推荐这一项目。