text_classification icon indicating copy to clipboard operation
text_classification copied to clipboard

您好!我想用自己的数据来训练TxtCNN的模型,请给我一些建议,谢谢

Open li74531 opened this issue 6 years ago • 4 comments

你好! 我想用自己的数据来训TxtCNN的多标签的模型,除了按照要求的格式来替换sample_multiple_label.txt文件,还需要修改那些代码。我看到load_data里面用读的是h5格式的文件,是否只要替换成load sample_multiple_label.txt文件格式代码,另外load_data读出来的数据格式满足什么要求才能直接用您的代码做模型训练呢?

li74531 avatar Jan 10 '19 09:01 li74531

还有如果我希望通过pre-processing生成h5格式的文件,如果已经有了和sample_multiple_label.txt格式一样的文件,需要做哪些修改,最终用来生成h5文件的数据,需要什么样的格式,才能保证训练程序能正确的执行呢?

li74531 avatar Jan 10 '19 09:01 li74531

我也在头疼这个问题,用自己的数据集我看了看data_untils的代码,改了改,但是验证集不知道怎么处理

yoonjae5 avatar Sep 04 '19 09:09 yoonjae5

同问,希望提供一下数据预处理的接口。

qianc62 avatar Jun 20 '20 09:06 qianc62

我也希望有数据预处理的接口,谢谢

VVesley avatar Mar 25 '21 14:03 VVesley