TinyQi

Results 17 comments of TinyQi
trafficstars

另外有3个情况跟您反映一下,可能可以方便您排查问题。 1. 我使用的模型是固定输入的,我在导出V4的开源静态模型时,我定死了输入尺寸,导出的模型是固定输入的(shape:[1,3,960,960] 2. 我将模型的输出从原来的2个,改成了只有一个输出(只保留了sigmoid_11.tmp_0这个输出)。因为我一开始直接使用V4模型进行量化训练的时候,会报错。报错信息如下,因为我对比了示例中V3模型的模型,发现V3模型只有一个输出,为此我就尝试只保留一个输出,实验证明如果只保留一个输出的话,就不会崩溃,但是模型量化结果不尽人意。 Traceback (most recent call last): File "run.py", line 157, in main() File "run.py", line 150, in main ac.compress() File "/home/anaconda3/envs/paddle_2.4.1_gpu/lib/python3.7/site-packages/paddleslim/auto_compression/compressor.py", line 594, in compress train_config)...

量化训练脚本为:PaddleSlim/example/auto_compression/ocr/run.py

感谢作者的热心回复,请问, 1. 我看您的代码中有一个Tokenlizer类,这个类中直接返回了一个数组(看起来是"a diagram", "a dog", "a cat"的token),那么如果我是其他的英文单词的话,怎么转换成这个token数组呢? 2. 在您提到的“点prompt生成的mask再送入CLIP”中,mask是指通过裁剪的小图,还是裁剪后二值图,还是mask原图啊

好的,再次感谢作者的无私贡献。谢谢您。我先根据您的指导,尝试在C++下实现这个功能

> > 好的,再次感谢作者的无私贡献。谢谢您。我先根据您的指导,尝试在C++下实现这个功能 > > 那太好了,我这边就等着你的实现了 哈哈哈,我这边挺菜的,不一定搞的定呢

楼主好,我这边按照python的代码尝试了复现,目前遇到了一些问题,跟你分享一下,希望楼主分享一下你的建议: 目前我做到的程度,主要是跟python端的代码比(automatic_mask_generator.py): 1. 在python端和C++端使用同样的输入图像(我保存了c++程序的中间图像,作为python那边准备进行CLIP图像编码的输入图) 2. 在经过一定的预处理后,C++端的图像指针内容与python中图像数组的值是一样的 3. 同样的文本token,经过CLIP文本模型编码后,在python端和c++端结果是一样的 输入图像我也查看了python的代码,应该说我实现的C++版本应该是大差不离的,以下是我生成的局部目标图 ![image](https://github.com/AIDajiangtang/Segment-Anything-CPP/assets/28993936/d7df79c6-6727-4c00-a59f-630fd0983613) ![image](https://github.com/AIDajiangtang/Segment-Anything-CPP/assets/28993936/1359e4f6-0caf-4646-9520-d4d1fccef41f) 但是现在遇到的问题是,程序运行的结果与期望的结果不符,我测试的时候用到是一张“小猫”图像和一张“小狗”图像,但是: 1. 小猫和小狗在经过文本与图像融合后,得分并没有差的很开 我使用了默认的“a dog”, “a cat”提示词,从数值上勉强可以区分,但是不理想 ![image](https://github.com/AIDajiangtang/Segment-Anything-CPP/assets/28993936/762e2cfb-9366-4334-8113-1b1114355cbd) 2. 在我加入“person”之后的提示词,得分竟然高过了猫和狗 我使用了官方推荐的“a photo of dog”, “a photo of cat”提示词, ![image](https://github.com/AIDajiangtang/Segment-Anything-CPP/assets/28993936/78c928d4-0214-4efb-be7b-f44166368cb0)

> > 如题如图,需要使用低版本onnx导出模型,拜托楼主啦。 > > 等我整理一下,尽快发给你 万分感谢啦,我已经跑通CPU了,但是由于我的生产环境的驱动版本很低,所以必须降版本。