Silver

Results 28 comments of Silver

实现中应该是把每个英文字母当作是一个token来处理

您好,您所使用的GPU显存可能有点小。碰到比较长的序列的话有可能因为要记录的激活太多导致OOM。您可以考虑限定一下训练过程中的最长序列长度,或者换一个大一点显存的显卡。

> 修改num_workers为1就好了 num_workers 是 pytorch中DataLoader的参数,用来控制用多少个CPU进程来加载数据,这个数值的大小不会影响模型显存的占用的。

您可以用transofmers这个库的组件加载模型,可以直接调用generate这个方法做生成。

训练好的模型ckpt应该是可以用比较新的transformers库加载的。具体的版本我忘了,您可以试一下。

The download link can be found in the README file https://pan.baidu.com/s/1GKwGDV-0e6dcRR-hVrrKGw?pwd=rev5 or https://drive.google.com/file/d/1jsTyvOz0y_6UIAkaibvvxf6bw0REqAlO/view?usp=sharing

您可以根据自己所用的bs调一下试试

请您提供一下详情: 1. transformer库的版本 2. 加载的哪个模型 3. 出错的指令

抱歉,我们没有host图片的,因为版权问题