dgk_lost_conv 如何训练？

您好，我下载了您的语料。请问如何训练这个中文语料？英文的代码中，th train.lua 即可训练。查看代码后，发现英文训练语料是个csv格式的数据。而您的数据中，没有csv,只有conv。是只需要训练conv即可吗？

Sep 01 '16 21:09 fighting41love

你好，我也不知道怎么训练的conv数据，麻烦能答疑解惑一下不？

Sep 11 '16 02:09 CEfanmin

并不知道。。。我读了代码，改了代码，不知道为何还是不行。我联系过作者，她可能比较忙。。。我是在做一个公益项目，想加入这个功能。。。始终未能如愿，如有解决办法，烦请告知。多谢啦！我自己也会再研究研究，看看有什么办法。。。(⊙o⊙)…

Sep 11 '16 03:09 fighting41love

好，谢谢，我也研究研究看，知道了我就回复你。

Sep 11 '16 03:09 CEfanmin

@fighting41love @CEfanmin 请问这里的语料使用有进展吗？我正在找一些可用于中文聊天机器人的可用语料。

Mar 23 '17 03:03 Edward-liang

下载这个文件就好了。dgk_shooter_min.conv.zip

Mar 28 '17 02:03 guob1l

@zzngb 使用了之后发现对话很奇怪。然后仔细看了下语料编排的规则： //M 表示话语，E 表示分割。 E M 话语 a M 话语 b M 话语 c M 话语 d E M 话语 a M 话语 b M 话语 c M 话语 d

然而，电影对白，这种才是可用的吧：场景 1： A to B B to A A to B ...

场景 2： A to B B to A A to B ...

请问本语料是否有好的应用思路呢？ M 话语 a M 话语 b M 话语 c M 话语 d 这个话语不一定是不是一个人说的呢。

Jun 01 '17 01:06 Edward-liang

直接把后缀改成.txt就可以用了

Aug 28 '19 02:08 Charles3000

dgk_lost_conv dgk_lost_conv copied to clipboard