PyTorch_CoSENT icon indicating copy to clipboard operation
PyTorch_CoSENT copied to clipboard

实验苏神的CoSENT的Torch实现

Results 1 PyTorch_CoSENT issues
Sort by recently updated
recently updated
newest added

就是问一下,使用 cosent 这个损失函数,最后会收敛到多少呢?或者说收敛情况如何呢?我发现我这里训练半个 epoch 就很难继续去收敛了。 我的数据集是,20万对 0-1 样本,10万正,10万负。使用的 chinese-roberta-wwm-ext 微调,下游任务是 last hidden state 经过 max pool 、全连接和 normalization 后的 128 维度向量尽可能接近。 其他参数的话,16 bacth,2e-5 的学习率并 torch OneCycleLR 调整(类似 Warmup ),训练 5...