NewStudents icon indicating copy to clipboard operation
NewStudents copied to clipboard

For the new students who just join a NLP group

新生训练(New Version, updating)

我们想通过这样一个项目,给新进实验室的同学提供一些基础训练,快速提高水平。

训练题目

  • Linux & Shell

    • 一些简单的Linux和Shell命令训练,学会使用Linux

    • 练习内容可以从 https://github.com/HIT-SCIR/scir-training-day 上自行下载。

    • 针对每一个训练内容都给出了详细的说明文档和相关学习资料,注意查询学习。

  • Code Projects (详细附后)

    • 文本处理相关的基础代码训练,学会处理文本
  • NLP Projects(配合研1的计算语言学的课,详细附后)

    • 自然语言处理(NLP)相关的基础训练,学会一些基础任务的基本方法

Code Projects

实现语言:Python and (C++ or Java)

  • 英文单词词频统计并按次数排序

  • 中文文本字频统计(UTF8)

  • 中文文本正向最大匹配分词(UTF8)

NLP Projects (with NLP course) (To add)

实现语言:Python or C++ or Java or 基于现有工具

  • 文本分类(学习基本分类算法)

  • 分词(基于分类器的分词)

  • 命名实体识别NER

  • CKY-依存分析

  • SMT

  • To add more