bert4torch icon indicating copy to clipboard operation
bert4torch copied to clipboard

An elegent pytorch implement of transformers

Results 33 bert4torch issues
Sort by recently updated
recently updated
newest added

提问时请尽可能提供如下信息: ### 基本信息 - 你使用的**操作系统**: - 你使用的**Python**版本: - 你使用的**Pytorch**版本: - 你使用的**bert4torch**版本: - 你加载的**预训练模型**: ### 核心代码 ```python # 请在此处贴上你的核心代码 ``` ### 输出信息 ```shell # 请在此处贴上你的调试输出 ``` ### 自我尝试 此处请贴上你的自我尝试过程

提问时请尽可能提供如下信息: ### 基本信息 - 你使用的**操作系统**: macOS 14.2.1 - 你使用的**Python**版本: 3.8.16 - 你使用的**Pytorch**版本: torch 2.1.0 - 你使用的**bert4torch**版本: 0.4.9.post2 - 你加载的**预训练模型**:bge-large-zh-v1.5 ### 核心代码 ```python sentences_1 = ["样例数据-1", "样例数据-2"] sentences_2 = ["样例数据-3", "样例数据-4"]...

提问时请尽可能提供如下信息: ### 基本信息 - 你使用的**操作系统**: win0 - 你使用的**Python**版本: 3.10 - 你使用的**Pytorch**版本: 2.1 - 你使用的**bert4torch**版本: - 你加载的**预训练模型**: ### 核心代码 ```python # 请在此处贴上你的核心代码 ``` def generate(self, passage, topk=1, topp=0.95): token_ids, segment_ids =...

bug

### 基本信息 - 你使用的**操作系统**: win10 - 你使用的**Python**版本: 3.10 - 你使用的**Pytorch**版本: 2.0.1 - 你使用的**bert4torch**版本: 最新版 - 你加载的**预训练模型**:Yi-6B ### 输出信息 4bit量化报错 NotImplementedError: Cannot copy out of meta tensor; no data! 代码用的examples里task_llama-2_lora.py,config已替换过Yi-6B对应的bert4torch_config了,请问这个是哪的问题?谢谢

提问时请尽可能提供如下信息: ### 基本信息 - 你使用的**操作系统**: win11 - 你使用的**Python**版本: - 你使用的**Pytorch**版本: 1.8.2+cu111 - 你使用的**bert4torch**版本: 0.2.8 - 你加载的**预训练模型**:chinese-bert-wwm-ext ### 核心代码 ```python # 请在此处贴上你的核心代码 ``` ### 输出信息 ```shell # 请在此处贴上你的调试输出 ### 自我尝试 1、首先,我的代码出现了这个问题...

提问时请尽可能提供如下信息: ### 基本信息 - 你使用的**操作系统**: - 你使用的**Python**版本: - 你使用的**Pytorch**版本: - 你使用的**bert4torch**版本: - 你加载的**预训练模型**: ### 核心代码 ```python # 请在此处贴上你的核心代码 ``` def collate_fn(batch): batch_token_ids, batch_segment_ids, batch_labels = [], [], [] for text,...

你好 我原本的bert4torch版本是0.2.8执行task_seq2seq_autotitle_csl_mt5等一些类似模型没有问题,但是版本升级到0.3.4发生问题 在下面这个方法中outputs值返回2个值 class CrossEntropyLoss(nn.CrossEntropyLoss): def __init__(self, **kwargs): super().__init__(**kwargs) def forward(self, outputs, y_true): _, _, y_pred = outputs y_pred = y_pred.reshape(-1, y_pred.shape[-1]) return super().forward(y_pred, y_true) 如果去掉一个的话 在下面这部分的return地方会报错。 请问要如何解决 class AutoTitle(AutoRegressiveDecoder):...

怎么提高GLM2模型的推理速度

@Tongjilibo 您好,我看model里面有BaseModelDDP,想知道是如何使用来进行分布式训练呢,里面只有一个master_rank参数,多机多卡的进程数、地址那些在哪设置呢

todo list

### 基本信息 - 你使用的**操作系统**: ArcoLinux - 你使用的**Python**版本: 3.10 - 你使用的**Pytorch**版本: '2.0.0+cu117' - 你使用的**bert4torch**版本: 0.3.0 - 你加载的**预训练模型**: gau_alpha ### 问题反馈 当loss 出现一次Nan之后,即使后续没有Nan, 进度条也会因为平滑机制一直显示Nan ```text 2023-07-27 10:26:24 - Epoch: 1/10 2660/6659 [==========>...................]...