BinChen

Results 6 issues of BinChen

### PR types Bug fixes ### PR changes APIs ### Description 无法使用自己的ocr结果调用taskflow实现文档抽取问答,增加对应文本区域ori_boxes参数输入

加载较大量级的私有知识库后,原本的知识会被覆盖 问题:“你是谁” 回答:“根据已知信息,我无法回答该问题。没有提供足够的相关信息,无法确定身份或地区。请提供更多信息,以便我能够更好地帮助您。”

### Is your feature request related to a problem? Please describe. 采用P-Tuning 和全参finetune,可实现私域数据嵌入,但是当私域数据量很少[100多条]时候,问对应的问题,可将答案原模原样回答; 当增加私域数据到上千,回答就不可控,虽然看着像是正常的回答,但是未能原样输出,达不到预期。 ### Solutions 更改学习率,batch_size等都不行;有没有哪位大佬帮忙解答一下,该怎么微调? ### Additional context _No response_

### Is your feature request related to a problem? Please describe. 采用P-Tuning 和全参finetune,可实现私域数据嵌入,但是当私域数据量很少[100多条]时候,问对应的问题,可将答案原模原样回答; 当增加私域数据到上千,回答就不可控,虽然看着像是正常的回答,但是未能原样输出,达不到预期。 ### Solutions 更改学习率,batch_size等都不行;有没有哪位大佬帮忙解答一下,该怎么微调? ### Additional context _No response_

看大家都已经在跑130b的模型,想咨询一下,计算资源是本地搭建的GPU集群吗?这个该如何搭建啊?

### Reminder - [X] I have read the README and searched the existing issues. ### Reproduction CUDA_VISIBLE_DEVICES=2 python src/train.py \ --stage sft \ --do_train \ --model_name_or_path /data/Qwen1.5-7B-Chat-GPTQ-Int4 \ --dataset alpaca_gpt4_zh...