Skip to content
New issue

Have a question about this project? # for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “#”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? # to your account

如何训练? #1

Open
fighting41love opened this issue Sep 1, 2016 · 7 comments
Open

如何训练? #1

fighting41love opened this issue Sep 1, 2016 · 7 comments

Comments

@fighting41love
Copy link

您好,我下载了您的语料。
请问如何训练这个中文语料?
英文的代码中,th train.lua 即可训练。
查看代码后,发现英文训练语料是个csv格式的数据。
而您的数据中,没有csv,只有conv。
是只需要训练conv即可吗?

@CEfanmin
Copy link

CEfanmin commented Sep 11, 2016

你好,我也不知道怎么训练的conv数据,麻烦能答疑解惑一下不?

@fighting41love
Copy link
Author

并不知道。。。我读了代码,改了代码,不知道为何还是不行。我联系过作者,她可能比较忙。。。
我是在做一个公益项目,想加入这个功能。。。始终未能如愿,如有解决办法,烦请告知。
多谢啦!
我自己也会再研究研究,看看有什么办法。。。(⊙o⊙)…

@CEfanmin
Copy link

好,谢谢,我也研究研究看,知道了我就回复你。

@Edward-liang
Copy link

@fighting41love @CEfanmin 请问这里的语料使用有进展吗?我正在找一些可用于中文聊天机器人的可用语料。

@guob1l
Copy link

guob1l commented Mar 28, 2017

下载这个文件就好了。dgk_shooter_min.conv.zip

@Edward-liang
Copy link

@zzngb 使用了之后发现对话很奇怪。
然后仔细看了下 语料编排的规则:
//M 表示话语,E 表示分割。
E
M 话语 a
M 话语 b
M 话语 c
M 话语 d
E
M 话语 a
M 话语 b
M 话语 c
M 话语 d


然而,电影对白,这种才是可用的吧:
场景 1:
A to B
B to A
A to B
...

场景 2:
A to B
B to A
A to B
...


请问本语料是否有好的应用思路呢?
M 话语 a
M 话语 b
M 话语 c
M 话语 d
这个话语不一定是不是一个人说的呢。

@Charles3000
Copy link

直接把后缀改成.txt就可以用了

# for free to join this conversation on GitHub. Already have an account? # to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

5 participants