NewStudents
NewStudents copied to clipboard
For the new students who just join a NLP group
新生训练(New Version, updating)
我们想通过这样一个项目,给新进实验室的同学提供一些基础训练,快速提高水平。
训练题目
-
Linux & Shell
-
一些简单的Linux和Shell命令训练,学会使用Linux
-
练习内容可以从 https://github.com/HIT-SCIR/scir-training-day 上自行下载。
-
针对每一个训练内容都给出了详细的说明文档和相关学习资料,注意查询学习。
-
-
Code Projects (详细附后)
- 文本处理相关的基础代码训练,学会处理文本
-
NLP Projects(配合研1的计算语言学的课,详细附后)
- 自然语言处理(NLP)相关的基础训练,学会一些基础任务的基本方法
Code Projects
实现语言:Python and (C++ or Java)
-
英文单词词频统计并按次数排序
-
中文文本字频统计(UTF8)
-
中文文本正向最大匹配分词(UTF8)
NLP Projects (with NLP course) (To add)
实现语言:Python or C++ or Java or 基于现有工具
-
文本分类(学习基本分类算法)
-
分词(基于分类器的分词)
-
命名实体识别NER
-
CKY-依存分析
-
SMT
-
To add more