dgk_lost_conv icon indicating copy to clipboard operation
dgk_lost_conv copied to clipboard

如何训练?

Open fighting41love opened this issue 8 years ago • 7 comments

您好,我下载了您的语料。 请问如何训练这个中文语料? 英文的代码中,th train.lua 即可训练。 查看代码后,发现英文训练语料是个csv格式的数据。 而您的数据中,没有csv,只有conv。 是只需要训练conv即可吗?

fighting41love avatar Sep 01 '16 21:09 fighting41love

你好,我也不知道怎么训练的conv数据,麻烦能答疑解惑一下不?

CEfanmin avatar Sep 11 '16 02:09 CEfanmin

并不知道。。。我读了代码,改了代码,不知道为何还是不行。我联系过作者,她可能比较忙。。。 我是在做一个公益项目,想加入这个功能。。。始终未能如愿,如有解决办法,烦请告知。 多谢啦! 我自己也会再研究研究,看看有什么办法。。。(⊙o⊙)…

fighting41love avatar Sep 11 '16 03:09 fighting41love

好,谢谢,我也研究研究看,知道了我就回复你。

CEfanmin avatar Sep 11 '16 03:09 CEfanmin

@fighting41love @CEfanmin 请问这里的语料使用有进展吗?我正在找一些可用于中文聊天机器人的可用语料。

Edward-liang avatar Mar 23 '17 03:03 Edward-liang

下载这个文件就好了。dgk_shooter_min.conv.zip

guob1l avatar Mar 28 '17 02:03 guob1l

@zzngb 使用了之后发现对话很奇怪。 然后仔细看了下 语料编排的规则: //M 表示话语,E 表示分割。 E M 话语 a M 话语 b M 话语 c M 话语 d E M 话语 a M 话语 b M 话语 c M 话语 d


然而,电影对白,这种才是可用的吧: 场景 1: A to B B to A A to B ...

场景 2: A to B B to A A to B ...


请问本语料是否有好的应用思路呢? M 话语 a M 话语 b M 话语 c M 话语 d 这个话语不一定是不是一个人说的呢。

Edward-liang avatar Jun 01 '17 01:06 Edward-liang

直接把后缀改成.txt就可以用了

Charles3000 avatar Aug 28 '19 02:08 Charles3000