aaferrero
aaferrero
1024要报错的,因为现在是必须加载预训练模型训练,所以token长度只能写成512,2.4版本中可以支持不同长度token的预测,2.6版本这块应该是bug,我在2.6版本照着2.4版本改了下,可以支持多长度token的预测。
https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6/ppocr/data/imaug)/[vqa] 大概思路就是在这里面吧数据封装改下,比如token长度是750,把它padding成512+512的长度,就是1024,然后shape变成2,512,变成两个batch放进网络中预测
./2.6/ppocr/postprocess)/vqa_token_ser_layoutlm_postprocess.py中: def _infer(self, preds, segment_offset_ids, ocr_infos): results = [] for pred, segment_offset_id, ocr_info in zip(preds, segment_offset_ids, ocr_infos): pred = np.argmax(pred, axis=1) pred = [self.id2label_map[idx] for idx in pred] for idx...
你是有大量的真实的发票数据集么,我微信号15902152449,你看方便的话,能加下微信么。
模板批量生成的代码有吗,可以提供下么
你好,我也在研究answers_span的问题,我在debug源码的时候发现数据集的answers_span对应的答案和我理解的对应的答案对不上,你看方不方便給下联系方式,我加下,问下。