SeqGAN_tensorflow icon indicating copy to clipboard operation
SeqGAN_tensorflow copied to clipboard

About real dataset

Open wyxcc opened this issue 6 years ago • 4 comments

你好,我使用真实的语料集作为训练数据,但是发现生成文本的质量很不好,请问有什么在训练上的建议嘛?谢谢~

wyxcc avatar Jul 02 '18 12:07 wyxcc

seqgan的训练是相当不稳定的,目前关于怎麽让训练变好还是一个在研究中的课题。简单的方法我建议可以在pretrain多一点epoch。pretrain的效果好不好对seqgan影响很大。

ChenChengKuan avatar Jul 06 '18 02:07 ChenChengKuan

@wyxcc hello你好,请问用真实的语料集作训练数据怎么进行,能不能指导一下呢,谢谢!

letmeheard avatar Jun 10 '19 06:06 letmeheard

我是后来跑了那个texygen:https://github.com/geek-ai/Texygen/ 这里面支持跑真实语料集,中文的分好词了就行,你试试看~

wyxcc avatar Jun 10 '19 06:06 wyxcc

好的!谢谢谢谢

letmeheard avatar Jun 10 '19 06:06 letmeheard