yaphet266
yaphet266
你好,我现在需要实现一个模板图搜索功能,模板数是不确定的,一直增长的。如果使用resnet50功能来进行特征提取,是否需要基于自己的数据进行训练,因为这个模板数是不确定的,请问这种该怎么训练,是使用度量学习的方式训练吗?
使用PaddleClas训练了100轮,导出的最优模型在实际应用中识别率不高。我先前使用这个参数训练了一段时间(没有跑完,终止训练程序),导出了一个最优模型应用识别率比较高,这个比较高的没有跑到100轮。我设置100轮是不是过拟合了,请问我怎么才能设置具体的epochs这个值,能保证训练不过拟合,导出的是最优的模型。 具体环境信息如下: 1. PaddleClas develop 2. PaddleInference 2.4.2 3. 训练环境信息: a. 操作系统Linux ubuntu 20.04 b. Python 3.8 c. CUDA/cuDNN版本, 如CUDA12.0 4. 训练yaml文件内容 Global: checkpoints: null pretrained_model: null output_dir: ./output/ device:...
使用相同的训练样本,使用相同的Docker镜像,在不同的Linux服务器上,一个正常,一个不正常,并打印许多nan 1. PaddleClas版本以及PaddlePaddle版本: paddle-bfloat 0.1.7 paddleclas 2.5.1 paddlepaddle-gpu 2.5.1.post117 使用的代码分支为PaddleCLas/develop分支(使用release-2.5.1分支报错) 2. 涉及的其他产品使用的版本号:PaddleClas 3. 训练环境信息: a. 具体操作系统,如Linux(Ubuntu 20.04.5) b. Python版本号,python 3.8 c. CUDA/cuDNN版本, 如CUDA11.7/cuDNN 8.4等 4. 完整的代码(相比于repo中代码,有改动的地方)、详细的错误信息及相关log [2023/09/13 09:33:10] ppcls INFO:...
大佬好,想咨询下数学公式识别用什么技术可以实现
是否有文档解释下这个yaml文件中每个配置项的含义 # global configs Global: checkpoints: null pretrained_model: null output_dir: ./output device: gpu save_interval: 1 eval_during_train: True eval_interval: 1 epochs: 100 print_batch_step: 20 use_visualdl: False eval_mode: retrieval retrieval_feature_from: features #...
在”特征提取“脚本中,看通过模型提取到特征向量后,对原有向量进行了feature_normalize操作得到新的特征向量,请问该操作作用是什么,是不是必须的
使用PPLCNetV2_base_ShiTu训练了一个特征提取网络,部署到GPU上后压测,发现GPU一直没有什么利用率,且相对于在CPU环境运行无明显效率的提升,请问这个是模型的问题吗还是我哪里设置错了
以下是截取的yaml文件内容 transform_ops: - DecodeImage: to_rgb: True channel_first: False - ResizeImage: size: [224, 224] return_numpy: False interpolation: bilinear backend: cv2 **- RandFlipImage:** flip_code: 1 - Pad: padding: 10 backend: cv2 -...
The export of ckpt file to onnx model resulted in an error message, as shown below: [ErrorCode:NotImplemented] Could not find an implementation for Trilu(14) node with name '/Trilu'" System information:...
### 请提出你的问题 如何使用PaddleNLP,使用LoRA微调LLama 3.1 8B的模型,有没有参考文档和视频教程提供