黄辉 comments

Results 27 comments of


                                            黄辉

请问run_pretrain.py和train.py有什么区别？

pretrain是预训练代码，一般来说，google的Bert是基于wiki的中文数据集预训练的，我们拿来做司法这种特殊领域需要现在司法数据上做预训练，训练完之后，我们再使用自己再次预训练后的模型去做下游任务，如这次的要素抽取，使用的代码就是train | | m13021933043 邮箱：[email protected] | Signature is customized by Netease Mail Master 在2019年10月15日 11:40，unstory 写道：基础比较差，没看懂。 — You are receiving this because you are subscribed to this thread. Reply...

请问run_pretrain.py和train.py有什么区别？

是的，init_checkpoint加载你预训练后的ckpt模型文件，config和vocab使用的文件和预训练一样

模型优化的问题

> 你好，我是一个初学者。我看到你的模型后接了rcnnatt，我考虑接其他网络去尝试一下（gru，capsule net之类）。我看了你的rcnn代码部分，感觉十分简练。我在网上找了很多都没有找到这样的其他网络的tf实现，请问你还有其他网络的加入方法吗或者说获取方式？ > 谢谢你好，gru的话你可以把我原代码的LSTM cell 换成GRU ccell就行了，capsule net的话我没有相关的实现，你可以去github搜一下capsule net，然后把embedding部分替换成bert的输出就行了

模型优化的问题

我个人认为，bert拟合能力已经很强了，接层的话很大可能会破坏bert已预训练好的分布，直接使用dense就行了，而对于不太好的数据，拟合能力不足，添加层可能会效果好点，但大多数情况，bert在很多数据集上添加层都会下降，我也只是在这个比赛有提升

请问怎样才使程序在GPU上运行?

你好，你可以先测试下你的tensorflow是否可以使用gpu，如果不行，应该是tensorflow的安装问题，比如cuda版本不对应什么的 | | m13021933043 邮箱：[email protected] | Signature is customized by Netease Mail Master 在2020年07月08日 19:24，zhouyang-bigdata 写道：请问怎样才使程序在GPU上运行?服务器用的是腾讯云的GPU,也是用你的命令，可是不管怎么试，都是用CPU运行的。请问，还需要装什么模块吗？ — You are receiving this because you are subscribed to this thread. Reply...

请问怎样才使程序在GPU上运行?

看你设置的epoch和服务器的性能，你这个应该是每一步大概2s，自己可以计算下大概耗时 | | m13021933043 邮箱：[email protected] | Signature is customized by Netease Mail Master 在2020年07月09日 09:50，zhouyang-bigdata 写道：一番折腾，后腾讯云换了个系统镜像，这应该是在gpu上运行了。请问这个训练一般耗时多久？日志如下： INFO:tensorflow: name = bert/encoder/layer_11/attention/output/dense/kernel:0, shape = (768, 768), INIT_FROM_CKPT INFO:tensorflow: name =...

请问怎样才使程序在GPU上运行?

这是tensorflow的estimator训练方式，如果修改成session方式，我感觉可以更灵活，可以像torch一样打印训练日志和进度，只不过比较复杂点 | | m13021933043 邮箱：[email protected] | Signature is customized by Netease Mail Master 在2020年07月09日 10:12，zhouyang-bigdata 写道：涨知识了。之前用pytorch时候，还没注意到step。 — You are receiving this because you commented. Reply to this email directly,...

请问怎样才使程序在GPU上运行?

可能有一部分重复吧，毕竟官方没有开源测试数据。也有可能是使用的使用的divorce那个数据集，那个数据集相对其他两个效果要好点。 | | m13021933043 邮箱：[email protected] | Signature is customized by Netease Mail Master 在2020年07月09日 10:53，zhouyang-bigdata 写道：训练出来，准确率有0.83. 是训练集和测试集放一起训练了吧？日志： 99%|█████████▉| 249/252 [01:36

请问怎样才使程序在GPU上运行?

我之前的训练数据就是我分享的所有数据，多gpu的话团队bert代码没办法，需要更改优化器部分，或者使用horovod。再或者还pytorch，多卡很方便... | | m13021933043 邮箱：[email protected] | Signature is customized by Netease Mail Master 在2020年07月10日 18:00，zhouyang-bigdata 写道：请问一下2个问题: (1)请问你之前用的训练数据是多大的? (2)请问一下，怎样设置多个GPU一起训练? — You are receiving this because you commented. Reply to this...

请问怎样才使程序在GPU上运行?

测试数据都不一样...我的成绩是官网测试成绩，而且一些trick代码我没有发在github，只是readme写了介绍 | | m13021933043 邮箱：[email protected] | Signature is customized by Netease Mail Master 在2020年07月15日 09:55，zhouyang-bigdata 写道：这应该是我训练数据文件名的问题。我多训练几遍再看看。用了6.08M 的数据（divorce）后，准确率只降了0.1. 好神奇……请问这个是合理的吗？没有重现你的0.73的准确率。这个很可能是我测试用的数据不对。改为data_small_selected.json后，试了2次，是0.71 ，很接近了，不过，0.73没重现过。 — You are receiving this because you commented....