Weitang Liu comments

Results 66 comments of


                                            Weitang Liu

你好，我想问一下linears.py里面的poolerstartlogits是什么用？

@heroazhe 还是那个问题啊，训练的时候标签是可知的，可用可不用，这里需呀做实验才知道哪种好，我这里可能是应该是为了应对eval使用soft label，将hard label转化为one-hot形式，纬度保持一致，具体的需要你个人做实验蔡得知。

Step_counter not defined ?

@tchaton get it a try： ```python from radam import Radam base_optim = RAdam(model.parameters(),lr = 0.001) optimizer = Lookahead(base_optim, k=5, alpha=0.5) ``` I try, no problem

新版transformers中已经没有WarmupLinearSchedule了

@DrDavidS 目前的代码是把transformers源码download下来试用的，还是老版本，后续跟新成transformers=2.5.1版本

BMInf 这个模型还没有收录，

@chenjunqiang 下午时候看过，但感觉它本质是一个工具包，内嵌相关模型。晚点我在详细看看。

训练过程中albert占用的显存很大

@fatmelon 有1400M的bert-wwm模型？？？

请问如何使用微调好的模型进行预测？

预测参考下chineseGLUE版本吧，预测其实不难。

模型在运行过程中崩了

@vpegasus 你也是使用动态mask吗我之前自己训练bert的时候，动态mask 10个文件有一个文件会造成你说的崩的情况，我后面处理直接跳过这个文件，对剩下9个文件进行训练，另外这个代码比较乱，回头我整理下。

加载Brightmart模型时，AlbertForMaskedLM中的cls.predictions.project_layer参数无法正确加载

@hong-feng 用modeling_albert_bright.py文件

加载Brightmart模型时，AlbertForMaskedLM中的cls.predictions.project_layer参数无法正确加载

@hong-feng 两个模型权重大小不一致的不能对应上只能加载bright版本

加载Brightmart模型时，AlbertForMaskedLM中的cls.predictions.project_layer参数无法正确加载

@hong-feng 你是要fine-tuning还是pretrianed？decoder部分使用project共享的话，好像会出问题。