EasyNLP icon indicating copy to clipboard operation
EasyNLP copied to clipboard

EasyNLP: A Comprehensive and Easy-to-use NLP Toolkit

Results 46 EasyNLP issues
Sort by recently updated
recently updated
newest added

the issue is: cannot import name 'AutoTokenizer' from 'easynlp.modelzoo' (unknown location) I have already clone the GitHub to the colab, but the problem is above and I used AutoTokenize(from transformers),...

通过修改 examples/kbert/run_cls.sh 这个文件下的 label_enumerate_values 改变模型分类个数。 自己数据集一共是10种类别,值为0-9,但是运行会报错。 通过打印logits 的值发现,模型输出依然是二分类。logits形状为[batch_size,2] 如何改变分类类别?

根据https://www.yuque.com/easyx/easynlp/ts4czl 文档上的代码尝试使用文本向量化功能,但是报错找不到checkpoint_dir 请问是什么地方可能有问题呢 File "/home/iu/anaconda3/envs/easyNLP/lib/python3.8/site-packages/pai_easynlp-0.1.2-py3.8.egg/easynlp/modelzoo/configuration_utils.py", line 490, in get_config_dict raise Exception(f'{pretrained_model_name_or_path} is not a filer or folder.') Exception: bert-small-uncased is not a filer or folder.

下载下来的训练集都是一下这句话。 {'text': '通常来说,人类想获得针对某种的[ENT]特异性抗体[ENT]有两种方式,要么是通过自然感染,要么是通过[ENT]疫苗接种[ENT]。但是,我们显然不会让婴幼儿冒着生病的危险去主动感染某个病毒,而对于 3 岁以下婴幼儿,目前各国尚没有[ENT]新冠疫苗[ENT]获批使用。', 'relation_id': [1, 2, 3], 'replced_entity_id': [1, 2, 3]}。 请问有没有解决办法?提前感谢! 还是说训练集就是这种重复的一句话。

从最初的tf版本追到这里,非常感谢!

I use k-bert run_ner.py but cannot get the result as high as the paper say, and I dont know how to change dataset to finetune ![image](https://user-images.githubusercontent.com/60349378/219858129-7a9f2719-e6c4-4c55-9c31-350cfa52985c.png)

类似Chinese clip模型,可同时构建文本和语音特征

chatGpt训练算法从transformer变成ppo以后。可以看到ai的效果和gpt3有了本质的提升。而强化学习中ppo算法还有很多提升空间。也还有不同的强化算法也有提升空间td3,deepnash。那么如果使用这些算法,并且加上集群的功能。那还了得。easyNLP可以自定义算法吗?怎么定义?又支持集群训练吗?怎么处理?以及能支持单机训练百亿参数的原理是蒸馏吗?