wjd

Results 8 comments of wjd

> > 之前有一批数据根据 https://github.com/PaddlePaddle/PaddleNLP/blob/develop/examples/text_matching/sentence_transformers/train.py 这个代码训练了模型,现在希望在原数据基础上增加少量新数据继续训练,但是之前训练的时候并没有保存optimizer的参数,这种情况下还可以实现增量训练吗? > > 您好,对于optimizer这里的save和load和model的保存是类似的,下面是实例代码你可以尝试看看 > > ```python > # Save optimizer state_dict > paddle.save(optimizer.state_dict(), os.path.join(save_dir, "adamw")) > > # Load the optimizer state_dict > optimizer.set_state_dict(paddle.load(os.path.join(save_dir, "adamw"))...

> 你好,可以参考下Taskflow DocPrompt任务里predictor的构造方法 > > * 获取静态图参数 > > https://github.com/PaddlePaddle/PaddleNLP/blob/c8bc4405fc6ed7026887c7c97d6ce1afa32e300f/paddlenlp/taskflow/document_intelligence.py#L78-L80 > > * predictor构建 > > https://github.com/PaddlePaddle/PaddleNLP/blob/c8bc4405fc6ed7026887c7c97d6ce1afa32e300f/paddlenlp/taskflow/task.py#L249-L254 predictor的构建我是沿用 https://github.com/PaddlePaddle/PaddleNLP/blob/develop/model_zoo/ernie-layout/deploy/python/predictor.py 这里的,但是出现报错

@linjieccc 使用的代码就是https://github.com/PaddlePaddle/PaddleNLP/blob/develop/model_zoo/ernie-layout/deploy/python/predictor.py 和 https://github.com/PaddlePaddle/PaddleNLP/blob/develop/model_zoo/ernie-layout/deploy/python/infer.py 其中,predictor.py的 https://github.com/PaddlePaddle/PaddleNLP/blob/c8bc4405fc6ed7026887c7c97d6ce1afa32e300f/model_zoo/ernie-layout/deploy/python/predictor.py#L38-L39 修改为: ``` config = paddle.inference.Config( os.path.join(model_path_prefix, "inference.pdmodel"), os.path.join(model_path_prefix, "inference.pdiparams"), ) ``` 其余无修改。 模型是通过Taskflow下载的docprompt,模型文件目录下包括: ![image](https://user-images.githubusercontent.com/65559675/198534782-90b71b34-6dab-4db4-944a-ebbc8e9c9c54.png)

@linjieccc 请问这个问题可以定位到吗?

> @wjddd ernie-layout中的模型是通过jit.save的方式保存为静态图模型的,这里定义了模型的输入shape和type https://github.com/PaddlePaddle/PaddleNLP/blob/develop/model_zoo/ernie-layout/export_model.py#L42 > > 可以check下是否是因为DocPrompt的输入不一致导致的 应该就是这个问题,感谢~

> 纯文本的QA可以参考 https://github.com/PaddlePaddle/PaddleNLP/tree/develop/pipelines/examples/question-answering https://github.com/PaddlePaddle/PaddleNLP/blob/develop/paddlenlp/taskflow/document_intelligence.py 这个例子可以改成文本输入而非图片输入吗?

> 补充:之前对于异步编程和并发处理的认知有一些错误。如果仅仅是希望使用 api 接受并发请求,应该不涉及到多线程的一些问题。 您好,请问您有尝试其他提升并发的方案吗?

> 这个不可以的 了解,感谢答复。