wind91725 comments

Results 27 comments of


                                            wind91725

和原来gpt2-ml的demo.py 进行inference的代码对比，使用的不是同一个vocabulary？

额这个词表啥的随你用啊想用哪个就用哪个我用的这个是中文bert常用的词表，原版的那个clue词表我没见过所以就没用

设置110000 其实只跑1万步因为原本的预训练模型是跑了10万步 . 在2020年06月11日 14:58，rivaldinho123 写道：我看参数设置的是110000步，而且batch_size是1的话，就意味着一共也只过了11万条数据就有效果了么？另外想问一下v100单卡训练这样10万步大概要多久？ @wind91725 — You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or unsubscribe.

自己的数据集需要多大效果会比较好

我自己finetune时也就2000条数据就有效果了当然越多越好在2020年06月11日 15:41，rivaldinho123 写道：设置110000 其实只跑1万步因为原本的预训练模型是跑了10万步 . 在2020年06月11日 14:58，rivaldinho123 写道：我看参数设置的是110000步，而且batch_size是1的话，就意味着一共也只过了11万条数据就有效果了么？另外想问一下v100单卡训练这样10万步大概要多久？ @wind91725 — You are receiving this because you were mentioned. Reply to this email directly,...

自己的数据集需要多大效果会比较好

时间记不得了单卡v100 一万步也就一下午吧具体记不清了在2020年06月11日 15:41，wind91725 写道：我自己finetune时也就2000条数据就有效果了当然越多越好在2020年06月11日 15:41，rivaldinho123 写道：设置110000 其实只跑1万步因为原本的预训练模型是跑了10万步 . 在2020年06月11日 14:58，rivaldinho123 写道：我看参数设置的是110000步，而且batch_size是1的话，就意味着一共也只过了11万条数据就有效果了么？另外想问一下v100单卡训练这样10万步大概要多久？ @wind91725 — You are receiving this because...

自己的数据集需要多大效果会比较好

推荐你用 https://github.com/lipiji/Guyu，另一个开源的中文预训练模型，模型小了很多，用起来也方便在 2020-06-12 17:58:08，"rivaldinho123" 写道：时间记不得了单卡v100 一万步也就一下午吧具体记不清了在2020年06月11日 15:41，wind91725 写道：我自己finetune时也就2000条数据就有效果了当然越多越好在2020年06月11日 15:41，rivaldinho123 写道：设置110000 其实只跑1万步因为原本的预训练模型是跑了10万步 . 在2020年06月11日 14:58，rivaldinho123 写道：我看参数设置的是110000步，而且batch_size是1的话，就意味着一共也只过了11万条数据就有效果了么？另外想问一下v100单卡训练这样10万步大概要多久？ @wind91725...

可以给一个输入数据的例子吗，就是 pre_data.py的输入文件格式

只要是文本格式的数据都行，文章、书籍啥的都行，但最好处理下，比如删除一些url之类，尽量让数据干净些

可以给一个输入数据的例子吗，就是 pre_data.py的输入文件格式

直接自然语言文本就行，书籍，文章都可以，不需要做任何操作。另外，推荐另一个中文预训练模型给您 https://github.com/lipiji/Guyu ，这个模型小了很多，也很方便调优在 2020-06-12 17:34:21，"huangdacheng" 写道：如果finetuning ，需要喂给它句子对呢？需要用什么做分隔？ — You are receiving this because you commented. Reply to this email directly, view it on GitHub, or unsubscribe.

wind91725

请问需要多大显存的卡？

bs=1，训练有效果么

和原来gpt2-ml的demo.py 进行inference的代码对比，使用的不是同一个vocabulary？

自己的数据集需要多大效果会比较好

自己的数据集需要多大效果会比较好

自己的数据集需要多大效果会比较好

自己的数据集需要多大效果会比较好

自己的数据集需要多大效果会比较好

可以给一个输入数据的例子吗，就是 pre_data.py的输入文件格式

可以给一个输入数据的例子吗，就是 pre_data.py的输入文件格式