RoFormer_pytorch issues

关于模型转换问题

1

请问怎样把bert4keras保存的模型转成pytorch，是用model.save_weights()保存的使用您提供的convert_roformer_original_tf_checkpoint_to_pytorch提示 RuntimeError: Unsuccessful TensorSliceReader constructor: Failed to find any matching files for

yang-zi-jiang

在run_clue_no_trainer.py中，为什么train_dataloader的batch_siz=32在经过accelerator的处理后就变成None了？

1

在训练的时候，从Dataloader中拿数据说没有batch_size，我检查了好几遍是有输入这个参数的。结果发现 ( model, optimizer, train_dataloader, eval_dataloader, lr_scheduler, ) = accelerator.prepare( model, optimizer, train_dataloader, eval_dataloader, lr_scheduler ) 这一段代码处理完后的train_dataloader的batch_size=None

learnmore-HDU

您好！有一个关于模型转换的问题

3

我发现在bert4keras读取苏老师开源的chinese_roformer-sim-char-ft_L-12_H-768_A-12和在transformers上读取您的junnyu/roformer_chinese_sim_char_ft_base提取的句向量的效果是差不多的，但是当我尝试将苏老师的模型转为pytorch_bin再用transformers读取后，pooler层怎么都加不上去（bert4keras里指定with_pool='linear'就可以）请问您是如何解决的？

EddieChen324

如何使用已经转好的Roformer_ft 做语义相似度任务？

5

AlexCRX

question

使用RoFormerTokenizer出现错误

4

config = RoFormerTokenizer.from_pretrained(XXX) ModuleNotFoundError: No module named 'transformers.models.imagegpt' 使用transformers的没有错误

zyh3826

您好！关于提供的roformer-base模型的最大长度问题

1

![6e0d4b8cbbd95095c9962433271eee2](https://user-images.githubusercontent.com/31853251/144530853-210ce12d-3fc0-4936-af7f-b15c802c4c27.png) 这是您提供的roformer-base模型的config文件，我看里面"max_position_embeddings"是1536, 如果说我想使用更长的长度的话，那是不是就会出现错误呀？或者说我需要重新拿语料进行预训练来使用更大长度？谢谢！

BCWang93

RoFormer_pytorch继续预训练性能下降

3

非常感谢您在huggingface上的贡献！在我的项目中，我尝试利用transformers/example/pytorch/language_modeling中的mlm脚本对RoFormer继续在领域文本上预训练，但是预训练后的表现出现下降的问题。作为对比，对roberta继续预训练能够得到提升。可以请教下具体的原因嘛？是否和脚本中调用的AutoModelForMaskedLM有关？再次感谢！

hflserdaniel

tf转torch model时要过滤掉pooler层

2

试了一下将苏神有监督训练的roformer从tf转到torch，苏神参数里面有pooler层，转的时候要过滤掉。

sxthunder

对gradient checkpointing的支持似乎有问题

你好！在使用roformer v2微调的时候开启gradient checkpointing的时候会产生报错： File "/root/conda/envs/highbase/lib/python3.7/site-packages/torch/nn/modules/module.py", line 889, in _call_impl result = self.forward(*input, **kwargs) File "/root/conda/envs/highbase/lib/python3.7/site-packages/roformer/modeling_roformer.py", line 1120, in forward return_dict=return_dict, File "/root/conda/envs/highbase/lib/python3.7/site-packages/torch/nn/modules/module.py", line 889, in _call_impl result = self.forward(*input,...

boxiaowave

Roformer-sim生成相似句速度慢，有批量生成50句的方法吗

1

xunfeiniao

RoFormer_pytorch
RoFormer_pytorch copied to clipboard

Metadata

关于模型转换问题

在run_clue_no_trainer.py中，为什么train_dataloader的batch_siz=32在经过accelerator的处理后就变成None了？

您好！有一个关于模型转换的问题

如何使用已经转好的Roformer_ft 做语义相似度任务？

使用RoFormerTokenizer出现错误

您好！关于提供的roformer-base模型的最大长度问题

RoFormer_pytorch继续预训练性能下降

tf转torch model时要过滤掉pooler层

对gradient checkpointing的支持似乎有问题

Roformer-sim生成相似句速度慢，有批量生成50句的方法吗

← Metadata

Owner

Metadata

RoFormer_pytorch RoFormer_pytorch copied to clipboard

Metadata

← Metadata

Owner

Metadata

RoFormer_pytorch
RoFormer_pytorch copied to clipboard