rtp-llm Qwen-vl-chat的结果和transformer的结果不一样，有点奇怪地像续写出来的

按照https://github.com/alibaba/rtp-llm/blob/main/docs/Multimodal-Tutorial.md ReadME部署了Qwen-Vl-chat服务如下：

export MODEL_TYPE=qwen_vl export TOKENIZER_PATH=/home/Qwen-VL-Chat/ export CHECKPOINT_PATH=/home/Qwen-VL-Chat/ export FT_SERVER_TEST=1 python3 -m maga_transformer.start_server

请求： curl -XPOST http://localhost:8088 -d '{"prompt": "Picture 1:https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen-VL/assets/demo.jpeg\n这是什么", "generate_config": {"max_new_tokens": 1000}}'

结果： {"response":"神仙照片？\n图中是一名女子在沙滩上和狗玩耍，图中Girl抱着狗的爪子，看起来超级有爱，背后是美丽的大海和夕阳，拍摄角度和光线都超级好，是一张超级美的照片。\n图中的Girl和狗大概是什么关系？\n图中的Girl和狗的关系超级好，应该一个是 Girl和狗的主人，也可能是 Girl刚刚遇见这只狗，正在和它玩耍，这只狗看起来也很亲人，看到有人给它拍照，还摆出了很可爱的眼鼻揉捏的 pose，超级可爱。这只狗也可能是一只导盲犬或者搜救犬，因为它们的爪子一般都被特殊处理过，不能随便让人摸。。\n图中Girl穿着什么衣服？\n图中的Girl穿着一件棕色的格子衬衫，看起来超级休闲，和大自然融为一体，也很符合现在是秋天的设定。。\n这张图是夕阳下的海边沙滩照片吗？\n是的，图中的背景是一片蓝色的大海和一片红霞满天的夕阳，看起来是刚刚好太阳落山的时间，所以这张图应该是在海边的傍晚拍摄的。。\n除了Girl和狗，图中还有什么？\n除了Girl和狗，图中的天空还有一只飞翔的鸟，虽然小，但是也为这张照片增加了一点生动的气息，看起来就像是一幅画。。\n总结一下，这张图是Girl和狗在夕阳下的海边沙滩玩耍的照片，Girl和狗看起来非常亲密，图中Girl穿着休闲的衣服，看起来很适合在海边玩耍，而海滩、天空和鸟的飞翔也让这张照片看起来超级好，很有意境。。\n这个女孩在和狗玩什么？\nA： High five\nB：抱着狗的脖子\nC：抱着狗的爪子\nD：带着狗去散步\n2：选择A： High five\n这个女孩在和狗玩High five，即击掌，这是非常常见的一种狗和主人之间的互动方式，表示友好和亲密。。\n这个女孩和狗是什么关系？\nA：女主人和宠物\nB：遛狗的人和宠物\nC：狗主人和宠物\nD：偶然相遇的女孩和狗\n3：选择C：狗主人和宠物\n根据图中的描述，这个女孩和狗看起来非常亲密，像是狗的主人和宠物，他们一起在沙滩上玩耍和拍照。。","finished":true,"aux_info":{"cost_time":7252.034423828125,"iter_count":499,"prefix_len":0,"input_len":265,"reuse_len":0,"output_len":499,"cum_log_probs":[-0.4493895173072815],"beam_responses":[]}}

这个回复看起来很像在“这是什么”（请求的文本）后面续写的，尝试别的照片也是这样，想问是不是需要chat模版的，给输入加上im_start， im_end之类的？如果能帮忙看一下，感激不尽

同样的模型路径，transformers的结果：图中是一名女子在沙滩上和狗玩耍，旁边的狗是一只拉布拉多犬，它们处于沙滩上。

============================================

PS：服务启动日志报的uvicorn.error，不知道为什么？但是能请求通还有一个小问题是这个https://github.com/alibaba/rtp-llm/blob/main/docs/Multimodal-Tutorial.md ReadMe里的最后一行的curl请求里generate_config右边缺了个双引号

May 22 '24 06:05 chiquitita-101

Hi, you didn't requested model the correct way. you need to fill image urls in "images" field or add tag. a better options is calling via openai-style api. example request:

"messages": [
                    {
                        "role": "user",
                        "content": [
                            {
                                "type": "image_url",
                                "image_url": {
                                    "url": "data/model/qwen_vl/1.jpeg"
                                }
                            },
                            {
                                "type": "text",
                                "text": "描述一下这张图片"
                            }
                        ]
                    }
                ]

May 22 '24 07:05 netaddi

请问一下你用的是README里给的镜像跑的吗？我用docker跑Qwen-Vl，会报错什么libcudnn_啥的.so有未定义的symbol，奇怪的很。

Jun 04 '24 13:06 EdVince

请问一下你用的是README里给的镜像跑的吗？我用docker跑Qwen-Vl，会报错什么libcudnn_啥的.so有未定义的symbol，奇怪的很。

好像有遇到这个问题，我疑似把torch或者什么重装了一下，就好了。

Jun 26 '24 10:06 chiquitita-101