jdcmj

Results 4 issues of jdcmj

您好,不知是否方面分享一下模型文件呢?

### Reminder - [X] I have read the README and searched the existing issues. ### Reproduction ``` accelerate launch --config_file "accelerate_config_ppo.yaml" \ ${TRAIN_BASH_PY} \ --stage ${STAGE} \ --model_name_or_path ${SFT_MODEL_PATH} \...

pending

具体代码如下: self.linear_subj_start = nn.Linear(self.hidden_dim, opt['num_subj_type'] + 1) 请问这里的输出维度为什么是实体类别数+1呢?

哈喽,想请教一下,看Argument_Extraction模型的代码,全连接层是直接把hidden_size映射到2维,再sigmoid得到logits,但这样貌似只是对token做了一个二分类,而在load data的时候,answer是维度是seq_len*2的向量,第一个维度是start_index,第二个维度是end_index,如果按照代码里写的,直接对logits和answer计算损失函数可能会存在问题吧?感觉是不是应该在定义模型的时候token做两次二分类,一次判断其是否为start,一次判断其是否为end? 不知道是否是我理解有误,期待回复~