jasoncao11/nlp-notebook: NLP 领域常见任务的实现，包括新词发现、以及基于pyto...

项目描述

NLP 领域常见任务的实现，包括新词发现、以及基于pytorch的词向量、中文文本分类、实体识别、文本生成、句子相似度判断、三元组抽取、预训练模型等。

依赖

python 3.7
pytorch 1.8.0
torchtext 0.9.1
optuna 2.6.0
transformers 3.0.2

数据集	数据量
训练集	56700
验证集	7000
测试集	6300

nlp-notebook
nlp-notebook copied to clipboard

Metadata

项目描述

依赖

目录

0. 新词发现算法

1. 词向量

2. 文本分类 (每个模型内部使用optuna进行调参)

3. 实体识别NER

4. 文本摘要生成

1). 生成式

2). 抽取式

5. 句子相似度判别

6. 多标签分类

7. 三元组抽取

8. 预训练模型(ELECTRA + SimCSE)

9. 提示学习

10. PaperwithCode

11. QA

← Metadata

Owner

Metadata

nlp-notebook nlp-notebook copied to clipboard

Metadata

项目描述

依赖

目录

0. 新词发现算法

1. 词向量

2. 文本分类 (每个模型内部使用optuna进行调参)

3. 实体识别NER

4. 文本摘要生成

1). 生成式

2). 抽取式

5. 句子相似度判别

6. 多标签分类

7. 三元组抽取

8. 预训练模型(ELECTRA + SimCSE)

9. 提示学习

10. PaperwithCode

11. QA

← Metadata

Owner

Metadata

nlp-notebook
nlp-notebook copied to clipboard