Jamly7

Results 5 issues of Jamly7

迷宫扩充至44*44后,训练过程特别慢,有没有办法优化

针对中间过程中,layerout检测缺失部分内容,导致后续md文件缺失内容,如何修改模型参数或其他方法去解决这个问题。 ![Uploading layerout.png…]()

enhancement

目前我已经通过修改代码,能将所有的公式保存成图片了(与image和table一样),但对应的md文件中的公式没有像图片和表格一样有图片链接,我应该如何修改代码完成这个功能、

enhancement

设备为两台linux,每台2张A100 40G显卡:A100(40G) * 2 训练命令如下:主节点命令为CUDA_VISIBLE_DEVICES=0,1 NNODES=2 NODE_RANK=0 NPROC_PER_NODE=2 MASTER_ADDR=127.0.0.1 swift sft --model_type qwen1half-7b-chat --model_id_or_path /mnt/model_repository/Qwen1.5-7B-Chat/ --dataset /root/lh/data2.jsonl --output_dir /root/lh/output/ --add_output_dir_suffix false --deepspeed default-zero3 --ddp_backend=nccl;子节点命令rank为 1,master_addr 为主节点 ip; 运行后,无报错,但程序没响应,一直卡在加载模型。 run sh:...

目前我是用MinerU指定的LayoutLMv3模型效果并不理想,通过查阅资料发现LayoutLMv3官方有3个不同的预训练模型,我如何在MinerU中替换模型呐?需要进行代码的修改吗?目前的模型地址是这样的:/opt/PDF-Extract-Kit/models/Layout/model_final.pth,模型同级目录有个config.json。

enhancement