limm issues

Results 7 issues of


                                            limm

Update main.py

solving the problem of "TypeError: sequence item 0: expected str instance, list found"

请问demo用的base模型跟本项目给的CN-CLIP（ViT-B/16）是同一个模型吗？跟我本地的测试结果不太一样

#### 1.我准备了一些语句，都是返回张数不足50张的语句：抱着孩子的男人背包的女人戴眼镜的男人骑自行车的孩子一个走在公园里的女孩一群走在山里的男人在河边的金发少女包饺子亲子活动踏青提行李箱的男人在清晨跑步的女人在水里盛开的花在田野里的狗 #### 2.先是在demo里搜索，参数如下，并利用chrome的插件imageye，把返回的图片都下载下来：返回图片数：50张，模型：中文CLIP(Base)，返回缩略图：否因为不同语句搜到的图片存在重复，所以我通过hash值进行了重命名，并用一张表保存每张图对应的语句列表 #### 3.把这些图片都加入一个新的向量库，在本地构建的搜索接口测试搜索：图片和文本都是用的clip-vit-b-16进行向量化，利用余弦相似度进行降序，阈值0.2，结果是，返回的图片并不完全一样，大部分是差个一两张，但是“踏青”，结果差了9张图。详细见下图 ![image](https://github.com/OFA-Sys/Chinese-CLIP/assets/89114157/7a2394d2-65ab-4c3b-b0b7-26314b9e5877)

请问在线demo中的文搜图或图搜图应用，对返回结果的逻辑处理是怎么样的呢？我设置了返回50张，但是有的文本只返回了32张。请问你们是对结果进行了阈值过滤吗，阈值设置的多少呢？用于检索的数据有哪些呢？

请问在三个图文检索数据集上微调时，有使用两阶段微调的方式吗？

我直接使用最新master提供的muge_finetune_vit-b-16_rbt-base.sh进行训练，freeze_vision=""，1张v100，其他参数没变，微调结束后结果提交到官网，评估结果比zero-shot低。 zero-shot：Recall@1=52.16, Recall@5=76.22, Recall@5=83.97, Mean Recall=70.78 finetune：Recall@1=48.82, Recall@5=75.8, Recall@5=84.59, Mean Recall=69.74 如果微调你们用了两阶段的话，参数有调整吗？像学习率、epoch等这些另外请问你们最近有预训练其他的图文匹配模型吗，比如ALBEF、BLIP2等

使用默认超参数在COCO-CN上微调，无法收敛

你好作者，我使用coco-cn_finetune_vit-b-16_rbt-base.sh在你们提供的处理好的COCO-CN上做微调，查看微调过程发现没有收敛，而MUGE和Flickr使用默认参数微调是收敛的，请问问题可能出在哪里呢？仅修改了两个字段 ``` GPUS_PER_NODE=1 export MASTER_ADDR=localhost ``` 下面是三个数据集上的微调折线图 ![image](https://github.com/OFA-Sys/Chinese-CLIP/assets/89114157/a55cb67d-19b5-4cab-95f7-d75e41380ff6) ![image](https://github.com/OFA-Sys/Chinese-CLIP/assets/89114157/e85c6d26-be6c-4404-b549-2873307db410) ![image](https://github.com/OFA-Sys/Chinese-CLIP/assets/89114157/36ef96ca-5764-4880-82df-db46edf53f97) 附上我在COCO-CN上微调的log文件 [out_2024-01-11-09-33-24.log](https://github.com/OFA-Sys/Chinese-CLIP/files/14032254/out_2024-01-11-09-33-24.log)

Update settings.zh.mdx

原来的：（调小`temperature`）实质上，你是在增加其他可能的 token 的权重。更改为：（调大`temperature`）实质上，你是在增加其他可能的 token 的权重。

因为默认的5000端口被占用，换成了未被占用的6000，却打不开网址，换成未被占用的9000可以打开网址

帖子详见：https://linux.do/t/topic/1009280/425?u=limm2025