MNBVC icon indicating copy to clipboard operation
MNBVC copied to clipboard

wikipedia与code_metadata数据有误

Open fitexmage opened this issue 1 year ago • 1 comments

在下载过程中又发现如下两个数据集有报错,请问可以麻烦再更新一下吗:

  1. wikipedia数据集中的https://huggingface.co/datasets/liwu/MNBVC/resolve/main/wiki/20230198/58.jsonl.gz还有一个JSONDecodeError的问题
  2. code_metadata数据集报错:FileNotFoundError: Couldn't find file at https://huggingface.co/datasets/liwu/MNBVC/resolve/main/code/metadata/20230302/20000000-21000000.jsonl.gz

fitexmage avatar Apr 23 '24 09:04 fitexmage

麻烦@silverriver 看下

esbatmop avatar Apr 24 '24 03:04 esbatmop

在下载过程中又发现如下两个数据集有报错,请问可以麻烦再更新一下吗:

  1. wikipedia数据集中的https://huggingface.co/datasets/liwu/MNBVC/resolve/main/wiki/20230198/58.jsonl.gz还有一个JSONDecodeError的问题
  2. code_metadata数据集报错:FileNotFoundError: Couldn't find file at https://huggingface.co/datasets/liwu/MNBVC/resolve/main/code/metadata/20230302/20000000-21000000.jsonl.gz

已经修复了这两个问题

silverriver avatar Jun 22 '24 00:06 silverriver