Chucy2020

Results 13 comments of Chucy2020

> PaddleNLP内置的数据集,有两种方式手动加载 > > 1. 改为[以内置数据集格式读取本地数据集](https://paddlenlp.readthedocs.io/zh/latest/data_prepare/dataset_load.html#id4),这时放在任意目录,`datafiles`指向对应数据即可。 > 2. 放在内置数据集的默认path,一般在用户目录下`~/.paddlenlp/datasets/DuReaderRobust/dureader_robust-data/`. 好的,我试下,感谢回复与解答,后续有问题再请教你们。

> PaddleNLP内置的数据集,有两种方式手动加载 > > 1. 改为[以内置数据集格式读取本地数据集](https://paddlenlp.readthedocs.io/zh/latest/data_prepare/dataset_load.html#id4),这时放在任意目录,`datafiles`指向对应数据即可。 > 2. 放在内置数据集的默认path,一般在用户目录下`~/.paddlenlp/datasets/DuReaderRobust/dureader_robust-data/`. ![image](https://user-images.githubusercontent.com/73978694/181248559-a3ed16fb-2efd-49e0-8084-0dc416d6e102.png) ![image](https://user-images.githubusercontent.com/73978694/181248605-1f7cebd5-abbb-47f2-95f4-b2837c1683c6.png) 你好,采取上述你提到的方式中的第一个,在yesno数据集上可以正常运行,在Robust数据集上运行报错,另外想问下, ![image](https://user-images.githubusercontent.com/73978694/181249290-b1e8dd8b-9b2b-4745-87eb-fb51e7e64dc9.png) 这是什么意思?数据是pd格式,带有列名?我看robust数据集上没有列名。 以及下面两个名字是哪里得到的? ![image](https://user-images.githubusercontent.com/73978694/181249369-8d4974a7-f916-402a-876d-7c0328a48753.png) 麻烦您有时间的话解答一下,谢谢。

> 您好,很感谢您的回复和解答,现在按照您提供的方式遇到了一些的问题,想再次请教您。 我的数据放在当前目录的dureader_robust-data文件夹下。下面两种调用(图1)都有下面的错误(图2),请问这是什么情况?麻烦您有空的时候解答一下,谢谢。 ![image](https://user-images.githubusercontent.com/73978694/181430605-d19fe969-1f6f-42c3-882f-a89496f7e418.png) ![image](https://user-images.githubusercontent.com/73978694/181430068-3f545969-e747-4734-8dc4-67395f71382d.png)

> PaddleNLP内置的数据集,有两种方式手动加载 > > 1. 改为[以内置数据集格式读取本地数据集](https://paddlenlp.readthedocs.io/zh/latest/data_prepare/dataset_load.html#id4),这时放在任意目录,`datafiles`指向对应数据即可。 > 2. 放在内置数据集的默认path,一般在用户目录下`~/.paddlenlp/datasets/DuReaderRobust/dureader_robust-data/`. 采用第一种的方式会有上述的错误,因此采用下载数据到~/.paddlenlp/datasets/DuReaderRobust/dureader_robust-data/ 运行Robust的代码还是会有数据下载无法联网的问题,麻烦您有空再解答一下这个paddlehub加载本地数据出现报错的这个问题。

> 您好,因为HuggingFace API的接口和paddlenlp自带的有所区别,所以这里重新列下 `from datasets import load_dataset`这种情况手动加载的方法: > > **方法一:在无网的机器上不修改代码,直接加载** > > Step 1. 在有网络的机器上调用API下载数据 > > ``` > from datasets import load_dataset > train_examples = load_dataset('PaddlePaddle/dureader_robust', split='train') > dev_examples...

> 可以从原始代码的URL手动下载数据集再传到服务器上。 > > * [DuReader_Robust URL](https://github.com/PaddlePaddle/PaddleNLP/blob/develop/paddlenlp/datasets/dureader_robust.py#L34)是https://bj.bcebos.com/paddlenlp/datasets/dureader_robust-data.tar.gz > * [DuReader_yesno URL](https://github.com/PaddlePaddle/PaddleNLP/blob/develop/paddlenlp/datasets/dureader_yesno.py#L36)是https://bj.bcebos.com/paddlenlp/datasets/dureader_yesno-data.tar.gz 好的,非常感谢大佬的回复与解答,后续有问题再请教你们。谢谢。

> 在google drive 可能需要梯子 我这好像确实下载不了,能麻烦您一下看一下是否是失效了吗?感谢大神

> 我这边看链接是 Ok哒~ ?好吧,那应该我的网络或者什么地方出现了问题,我检查一下,我先训练得到模型参数,感谢大佬嘿嘿。

> I used the latest release of the version, and use the `run_sup_example.sh` to train my datasets. But when I used SimCSE to load the model I got this hint:...

> 可以参考这个FAQ:https://paddlenlp.readthedocs.io/zh/latest/FAQ.html#q1-3-paddlenlp 您好,我尝试将你们提供的下载网址将ernie-3.0-xbase-zh文件下载保存到文件夹,但是使用 MODEL_NAME = "ernie-3.0-xbase-zh" ernie_model = paddlenlp.transformers.ErnieModel.from_pretrained(MODEL_NAME)时报错,无法加载,请问这是怎么回事?