chengligen

Results 5 issues of chengligen

docker拉取一直超时 error pulling image configuration: download failed after attempts=6: dial tcp 104.18.124.25:443: i/o timeout

设备为8*V100,40G显存版本,使用device_map='auto'时,部署InternVL-14B-224px报错,错误如下。 RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cuda:1!

![image](https://github.com/OpenGVLab/InternVL/assets/101448376/f2883ab1-99df-4231-8418-f6262b7a0d92) 使用 model = AutoModel.from_pretrained( model_path, torch_dtype=torch.bfloat16, low_cpu_mem_usage=True, trust_remote_code=True).cuda().eval() 加载模型时,默认加载InternVLModel类,如何调用InternVL_C和InternVL_G呢?

最近想使用wenet架构进行小语种的训练。 看了一下训练代码,数据处理部分、训练部分的代码,是我这辈子见过最垃圾的代码,冗余、复杂。 还有大量代码是直接扒的torch官方的代码,直接放进wenet里面。 原因是什么?恶心用户? 看到wenet更新频率是很高的,也知道开发者是真正想把wenet做起来的。 但是目前的做法,简直就是闭门造车。 不支持huggingface,modelscope支持的也不多。 开源有什么用呢,劝退了绝大部分开发者吧。 感觉像是开源了,又没开源。 这种策略是非常错误的。 拥抱开源,才有未来。

I am fine-tuning the space-t table question-answering model. How should I structure the data?