itzhoujun
itzhoujun
> 通样,官网例子部署3B nvida 4090 48G 都爆内存,有严重bug。 bash docker_web_demo.sh -i qwenllm/qwenvl:2.5-cu121 -c /root/Qwen/Qwen2.5-VL-3B-Instruct -n qwen2.5vl --port 8080 老哥解决了吗
找到了一个gme-qwen-vl-2 embedding模型,但是不是基于2.5的,而且纯英文训练。不知啥时候会有基于2.5的中文训练的
> 不微调的话,直接用MLLM output embeddings做相似度度量感觉不太行 我用gme-qwen-vl-2 embedding做文搜图感觉相似度也比较低。
这两个版本所用的接口啥的都不一样
作者最近咋不活跃了。这个pr是否会被合并呢
> 花了5个半小时成功部署了。训练相关代码文件都在docker 镜像里。 https://hub.docker.com/r/guiji2025/digital-human/tags 没有训练代码吧。只有推理,而且大多都是.so库
3个镜像加起来60多G。牛逼
SyncTalk++是啥?synctalk增强版?