Jpy5 comments

Results 18 comments of


                                            Jpy5

您好~ 我在进行一项有这1000多个label的文本分类任务，在这个特定任务上，对代码做了点修改，解决了一些可能存在的问题~想和您分享一下，哈哈 1. 我在使用smart时，在如下代码中，由于我的类别数特别多，可能会导致tf.log()内的值可能非常接近于0或者等于0，从而使得在求log以后，该值为负无穷，导致了loss为无穷值，从而在后面计算梯度的时候，梯度值为NAN，出现梯度爆炸的情况，loss也会一直为NAN； ``` per_example_loss = tf.reduce_sum( probs_breg * (tf.log(probs_breg) - tf.log(probs)), axis=-1) per_example_loss_breg = tf.reduce_sum( probs * (tf.log(probs) - tf.log(probs_breg)), axis=-1) ``` 以及 ``` per_example_loss = tf.reduce_sum( probs_prtb...

对抗训练

在验证的时候是有把dropout_rate设为0的，那看来就是底层可能有不一样的实现，谢谢您的解答啦~

对抗训练

> > 在验证的时候是有把dropout_rate设为0的，那看来就是底层可能有不一样的实现，谢谢您的解答啦~ > > tensorflow源码我没怎么读，过去以研究上层网络为主，不能解决你的问题很抱歉哈哈哈没事没事，能够大致知道问题出在哪也就很有收获啦

对抗训练

> > 您好~ > > 我在进行一项有这1000多个label的文本分类任务，在这个特定任务上，对代码做了点修改，解决了一些可能存在的问题~想和您分享一下，哈哈 > > > > 1. 我在使用smart时，在如下代码中，由于我的类别数特别多，可能会导致tf.log()内的值可能非常接近于0或者等于0，从而使得在求log以后，该值为负无穷，导致了loss为无穷值，从而在后面计算梯度的时候，梯度值为NAN，出现梯度爆炸的情况，loss也会一直为NAN； > > > > ``` > > per_example_loss = tf.reduce_sum( > > probs_breg * (tf.log(probs_breg) - tf.log(probs)), axis=-1)...

Jpy5

对抗训练

对抗训练

对抗训练

对抗训练

对抗训练

对抗训练

单机多卡

forward() got an unexpected keyword argument 'masked_lm_labels'