Thirteen

Results 5 issues of Thirteen

增加chatgpt2的数据集处理,可直接用于chatgpt2模型的训练

Fix the issue that the spacy version is incompatible; Added Chinese version of README; Added a test file;

next -> __next__

# 1.首字返回会出现符号 使用给出的html观察发现在页面中有一个处理过程。 注释掉这一部分,服务器使用官网所给出的地址同样会出现标点。 ![Image](https://github.com/user-attachments/assets/50a18df3-3cd9-4910-80b2-4b6aed560924) ![Image](https://github.com/user-attachments/assets/d80be602-cbff-467b-83f4-2334fc7f5f91) --------------- # 想知道这样的原因,是因为模型识别的原因还是因为设置is_final=Ture导致的这个原因 ![Image](https://github.com/user-attachments/assets/4222919a-b1d9-4517-8a00-3e76052da4bd)

question