yujun comments

Results 152 comments of


                                            yujun

如何使用已经转好的Roformer_ft 做语义相似度任务？

你可以先参考一下 #14 #17 #22 这三个issue。目前在忙毕业论文，忙完之后我会尝试着手`语义相似度任务`的转换。

如何使用已经转好的Roformer_ft 做语义相似度任务？

`pip install roformer==0.4.3` ```python import torch import numpy as np from roformer import RoFormerTokenizer, RoFormerForCausalLM, RoFormerConfig device = torch.device('cuda:0' if torch.cuda.is_available() else 'cpu') pretrained_model = "junnyu/roformer_chinese_sim_char_base" tokenizer = RoFormerTokenizer.from_pretrained(pretrained_model) config...

如何使用已经转好的Roformer_ft 做语义相似度任务？

安装个0.4.3版本就可以了，这个是最新的版本，pip install roformer==0.4.3

使用RoFormerTokenizer出现错误

更新一下transformers到4.12.5 试试

使用RoFormerTokenizer出现错误

我的正常，你可以重新装一下这两个库。 ![image](https://user-images.githubusercontent.com/50394665/145359899-03edc753-3909-41ff-aa55-4ba6145e0b9c.png)

在run_clue_no_trainer.py中，为什么train_dataloader的batch_siz=32在经过accelerator的处理后就变成None了？

https://github.com/huggingface/accelerate/blob/23c0341262bd396a3ba9265614b3818d6e08a6c1/src/accelerate/data_loader.py#L417-L571 看这里accelerate仓库处理dataloader返回的是DataLoaderShard

RoFormer_pytorch继续预训练性能下降

训练的是什么模型？char级别的还是word级别的模型

RoFormer_pytorch继续预训练性能下降

模型搭建的是没有问题，https://github.com/ZhuiyiTechnology/roformer/blob/main/train.py 可以参考原版的keras代码继续预训练，然后再把模型转成pytorch试试

您好！关于提供的roformer-base模型的最大长度问题

参考这个 issue https://github.com/JunnYu/RoFormer_pytorch/issues/15 修改了`max_position_embeddings`后，如果碰见加载权重不匹配的话，只要删除掉`pytorch_model.bin`中的 `embed_positions`这个权重。

tf转torch model时要过滤掉pooler层

@sxthunder https://github.com/JunnYu/RoFormer_pytorch/issues/11 本仓库的代码添加了pooler层，可以参照这个issues进行转换权重