想要申请Computational Linguistics项目,首先需要对这个领域感兴趣。 >>在线咨询留学申请
申请者基本可分为两类:具备语言学背景或计算机背景。对于有一些计算机基础的非对口专业申请者,通过所在系里组织的Placement Test(主要考察编程等计算机相关技能)就能够成功入读。
计算语言学作为一个跨界的学科领域正迅速发展,它将语言学、计算机科学和数学完美结合,探索如何让计算机更智能地理解和处理自然语言——也就是我们日常沟通所使用的语言。
在这个领域中,研究的方法有好几种,主要可以分为三类:规则驱动的方法、数据驱动的方法,以及这两者的综合。
首先,来看规则驱动的方法,或者叫做符号主义。这种方法的核心在于找出语言的规律并构建起一套规则体系。 >>在线咨询留学申请
语言学家们通过研究和总结不同语言背后的普遍规则,创建起知识库,并由此研发处理算法,让计算机能够根据这些预设的规则来处理语言。但是,我们的语言其实非常灵活多变。正如Sapir在1921年所说:“所有的语法都是漏洞百出的。”研究者在现实应用中需要根据实际情况不断调整这些规则,以期达到更好的语言处理效果。
然而,正因为语言的这种多变性,规则驱动方法遇到了一些困难。这就引入了数据驱动的方法,这种方法又通常与统计手段相结合。研究者们构建庞大的语料库,反映出自然语言的实际使用情况。对这些语料的内容进行统计建模,可以帮助我们理解和预测语言使用的各种模式。这种方法的优势在于,通过机器学习技术,计算机可以直接从大量的语言实例中“学习”,进而发展和改进语言处理模型,不必依赖于人类提前设定的规则。
最近十几年的趋势显示,由于自然语言处理存在的复杂性,越来越多的研究者开始倾向于数据驱动的方法,使用统计模型来进一步深入研究语言的奥秘。
关于准备工作
一、编程
python Codecademy: Learn PythonCoursera: Python for EverybodyLearn Python the Hard WayLeetCode (用来刷算法题)
正则表达式 (Regular Expression)Lesson 1: An Introduction, and the ABCs (学习正则的课程)PHP, PCRE, Python, Golang and JavaScript (101regex, 用来测试一个正则写的对不对)
R语言:R in Action (豆瓣) 这一本足够了
Shell Script Codecademy: Learn the Command LineShell Scripting Tutorial >>在线咨询留学申请
二、理科知识
概率论 (Probability Theory)
统计 (Statistics)
微积分 (Calculus)
线性代数 (Linear Algebra)
(在 Coursera 和 Khan Academy 上可以找到很多相关课程)
三、语言学
语音学和音系学 (Phonetics and Phonology)
The Sounds of Language句法学 (Syntax)
语义学 (Semantics)
四、自然语言处理 (Natural Language Processing) >>在线咨询留学申请
Speech and Language Processing (这本书,非常重要)
五、机器学习 (Machine Learning)
Coursera: Machine Learning by Andrew Ng (这门课作为机器学习入门非常非常推荐)
Coursera: Deep Learning Specialization
六、其他
PyCharm (Python 集成开发工具)
Vim/Emacs (文本编辑器)
LaTex (论文排版工具)
总的来说,纯文科的同学,例如语言学、应用语言学的同学可以申请计算机语言学的专业,但是需要提前做好准备,把上述准备工作中的各个知识点补足。
补足的方式可以做一些计算机语言学方向的科研项目。 >>在线咨询留学申请
如果您需要了解更多出国留学相关资讯,或有任何相关疑问,欢迎在线咨询留学专家。如果您对自己是否适合留学还有疑虑,欢迎参与前途出国免费评估,以便给您进行准确定位。
推荐阅读:
法国留学准备10万就够了
硕士/博士2024秋季申请数据揭秘!
GRE标化成绩的构成
【免责声明】
1、个别文章内容来源于网络善意转载,版权归原作者所有,如侵权,请联系删除。
2、所有图片来源于网络,版权归原作者所有。如有侵权问题请告知,我们会立即处理。