Xiaoquan Kong
Xiaoquan Kong
MicroTokenizer
一个微型&算法全面的中文分词引擎 | A micro tokenizer for Chinese
Chinese_models_for_SpaCy
SpaCy 中文模型 | Models for SpaCy that support Chinese
WeatherBot
一个基于 Rasa 的中文天气情况问询机器人(chatbot), 带 Web UI 界面
hanzi_chaizi
汉字拆字库,可以将汉字拆解成偏旁部首,在机器学习中作为汉字的字形特征
hanzi_char_featurizer
汉字字符特征提取器 (featurizer),提取汉字的特征(发音特征、字形特征)用做深度学习的特征 | A Chinese character feature extractor, which extracts the features of Chinese characters (pronunciation featu...
ATIS_dataset
The ATIS (Airline Travel Information System) Dataset
MITIE_Chinese_Wikipedia_corpus
Pre-trained Wikipedia corpus by MITIE
seq2annotation
基于 TensorFlow & PaddlePaddle 的通用序列标注算法库(目前包含 BiLSTM+CRF, Stacked-BiLSTM+CRF 和 IDCNN+CRF,更多算法正在持续添加中)实现中文分词(Tokenizer / segmentation)、词性标注(Part Of Speech, P...
rasa_chinese
rasa_chinese 专门针对中文语言的 rasa 组件扩展包,提供了许多针对中文语言的组件
chinese-wikipedia-corpus-creator
Corpus creator for Chinese Wikipedia