dgk_lost_conv
dgk_lost_conv copied to clipboard
如何训练?
您好,我下载了您的语料。 请问如何训练这个中文语料? 英文的代码中,th train.lua 即可训练。 查看代码后,发现英文训练语料是个csv格式的数据。 而您的数据中,没有csv,只有conv。 是只需要训练conv即可吗?
你好,我也不知道怎么训练的conv数据,麻烦能答疑解惑一下不?
并不知道。。。我读了代码,改了代码,不知道为何还是不行。我联系过作者,她可能比较忙。。。 我是在做一个公益项目,想加入这个功能。。。始终未能如愿,如有解决办法,烦请告知。 多谢啦! 我自己也会再研究研究,看看有什么办法。。。(⊙o⊙)…
好,谢谢,我也研究研究看,知道了我就回复你。
@fighting41love @CEfanmin 请问这里的语料使用有进展吗?我正在找一些可用于中文聊天机器人的可用语料。
下载这个文件就好了。dgk_shooter_min.conv.zip
@zzngb 使用了之后发现对话很奇怪。 然后仔细看了下 语料编排的规则: //M 表示话语,E 表示分割。 E M 话语 a M 话语 b M 话语 c M 话语 d E M 话语 a M 话语 b M 话语 c M 话语 d
然而,电影对白,这种才是可用的吧: 场景 1: A to B B to A A to B ...
场景 2: A to B B to A A to B ...
请问本语料是否有好的应用思路呢? M 话语 a M 话语 b M 话语 c M 话语 d 这个话语不一定是不是一个人说的呢。
直接把后缀改成.txt就可以用了