Hengyuan Zhang
Hengyuan Zhang
在看huggingface官网提供的GPT2模型接口上,发现他里面并没有stride参数,想问博主的stride参数传入是自己设计的是嘛,[huggingface GPT2链接](https://huggingface.co/transformers/model_doc/gpt2.html) 另外想请教一下,就是huggingface 提供的GPT2的n_postions和n_ctx是什么关系呢,谢谢!
Predict
想问下,就是训练好模型以后,怎么用它实现predict来搭起服务呢,有具体的参考code吗?谢谢~
I count the zh data, its length is 48818, but readme say it has 52k
Web UI
可以请问下前端的 Web UI 是怎么制作的么
博主你好,想问下你的第四项任务中的法律知识图谱的部分有上传吗谢谢
how does PIQA got 78 acc ? I see the eval folder's readme file, it says the metric is not trustworthy ?
In the pre-train stage, the sample should use corresponding task router (using task_id param) to get fused prompt embedding, but in the code, I found task_id set to 0 always...
作者你好,请问会开源相关的 eval 数据集和评测脚本吗