Eliyar Eziz comments

Results 99 comments of


                                            Eliyar Eziz

trafficstars

关于total_word_feature_extractor_zh.dat文件

你好，我这里现在有一批影片名称和相关预料。如何在你训练的 total_word_feature_extractor_zh.dat 基础上继续训练利用这一批出书？还是只能用 wordrep 重新训练？

关于total_word_feature_extractor_zh.dat文件

@crownpku 了解了。谢谢~。我试试看。

关于total_word_feature_extractor_zh.dat文件

@crownpku 有尝试过训练 spacy 模型么，MITIE 训练只能单线程，太慢了。而且以后电影名称库更新又得重来这个步骤。

关于total_word_feature_extractor_zh.dat文件

恩，看样子只能这样了。此外我的 MITIE 模型训练完后，训练 rasa nlu 也非常慢，目前只有 30 个 sample，似乎跟这个 https://github.com/mit-nlp/MITIE/issues/11#issuecomment-76982370 issue 一个问题。你的 nlu 大概多少个数据，训练要多久？

关于total_word_feature_extractor_zh.dat文件

我们用 MITIE 只做了词向量，那么可以用 gensim 做 word2vec 来替代这个词向量么？还是两者有本质区别？

关于total_word_feature_extractor_zh.dat文件

中文 nlu 用了 MITIE 的话没办法用 sklearn 做分类器吧？我这个配置，30 个 sample 大概需要 40 来分钟。 ``` { "name": "rasa_zh_nlu", "pipeline": [ "nlp_mitie", "tokenizer_bf", "ner_mitie", "ner_synonyms", "intent_entity_featurizer_regex", "intent_featurizer_mitie", "intent_classifier_sklearn" ], "language": "zh", "mitie_file":...

关于total_word_feature_extractor_zh.dat文件

这个分词器跟你的基本一致，就加了个自定义字点的加载。我把我的数据共享给你，你跑一下看看可以么。数据在这里， https://github.com/BrikerMan/rasa-demo/blob/master/data.json

关于total_word_feature_extractor_zh.dat文件

我这里换成 'tokenizer_jieba' 也一样。似乎是这个问题，https://github.com/RasaHQ/rasa_nlu/issues/260#issuecomment-292893317

Eliyar Eziz

中文字符向量

Please add python 3 support

关于total_word_feature_extractor_zh.dat文件

关于total_word_feature_extractor_zh.dat文件

关于total_word_feature_extractor_zh.dat文件

关于total_word_feature_extractor_zh.dat文件

关于total_word_feature_extractor_zh.dat文件

关于total_word_feature_extractor_zh.dat文件

关于total_word_feature_extractor_zh.dat文件

关于total_word_feature_extractor_zh.dat文件