Daniel
Daniel
在使用自己数据进行训练的时候,发现报错 [Hint: Expected labels_dims[axis] == 1UL, but received labels_dims[axis]:3 != 1UL:1.] 猜测是label图片读取的时候,通道数为3,查了下dataset.py和transforms.py的代码,在Compose这个类中,关于label图片的读取是 label = np.asarray(Image.open(label)) 改成 label = cv2.imwrite(label, cv2.IMREAD_GRAYSCALE) 此时报错解除,但不确定是否有效 不知道是我的图片的问题还是哪里不对
你好,我在pytorch1.0上进行的训练,修改了 if torch.mean(preds0_prob[text_begin:text_begin+len(sim_preds0[j].split('$')[0]+'$')]).item() >\ torch.mean(preds1_prob[text_begin:text_begin+len(sim_preds1[j].split('$')[0]+'$')]).item(): 将.data[0]改为.item(),训练是可以进行的了,按照readme所说,只是训练变慢,应该不会还有什么后遗症吧
在使用model = Paraformer(model_dir, batch_size=1, device_id=0) 加载权重之后,在进行识别的时候,无论什么输入,都会打印 input wav is silence or noise 在libtorch\funasr_torch中查看paraformer_bin.py,打开except中的错误提示注释,此时再次进行识别,报出的具体错误是two device 出现在outputs = self.ort_infer(feats.cuda(), feats_len.cuda())这里 请问这个项目是不支持gpu加速么
i found rpn_loss_box has always been zero, and that because bbox_outside_weights is 0. maybe i should change positive_weights = 1.0 / num_examples negative_weights = 1.0 / num_examples to positive_weights =...