Code-dogcreatior

Results 7 comments of Code-dogcreatior

I want to deploy this to a Windows system, but my common compilation version for Tirton is only Python 3.10. Also, does Torch require a GPU version? Do you have...

PS E:\image\CCSR> & D:/Anaconda/envs/ccsr/python.exe e:/image/CCSR/gradio_ccsr.py A module that was compiled using NumPy 1.x cannot be run in NumPy 2.0.0 as it may crash. To support both 1.x and 2.x versions...

所以理论上来说就最初发布的general模型resize设定1024,HR2048是最佳设定,我可以这样理解吗?关于1000px这个问题我再查错一下,还有个问题想请教,在您测试过程中是否发现部分mask可能存在锯齿化较为明晰的边缘问题呢,我在部分测试中在低分辨与高分辨都经历过这个事情,虽然并不常见但不时会出现。

首先缩放1000px那个问题确实是我的问题,请原谅我可能由于知识缘故,大部分询问问题偏向于实用方向而非开发方向。我做了一些测试,发现在resize为1024,1024情况下,相较于1440*1440在(我的案例为羽毛球拍网格测试)抠图情况下所展示出的效果略有降低,但处理时间却在1000-4000分辨率下有大概3x上升,超过4000后大概2x上升,所以,我猜测这个问题源自Pytorch计算效率非线性导致的,此外在高分辨下您推荐使用原先的lite2k还是HR模型呢,如果是HR的话设置为1024还是2048? 此外附带一张我提到的问题,换为1440边缘化会有显著改善,这种问题是否能从opencv方向对图像预处理以改善或是对参数调整以进行改善呢? ![Image](https://github.com/user-attachments/assets/79cbf95f-f134-4c42-9dad-20cf6daf5f95)

okok,我也发现了这个问题,我搞得比较简单,直接前端pica做了压缩,不过我肉眼看到大致问题是如果对于动态模型大于2304后,那么图像的例如发丝交替部分会被识别到,但其实是背景,总体测完还是感觉2304是一个最优了,再大(例如3300px)部分情况(例如带有挂饰相对尺寸大一些感觉会被卷积到剔除,但是2304不会),感谢超快的回答! I like code! ***@***.***

上面三幅图分别为另一个工具测试抠图,动态模型和刚提到的工具放大结果对比,实际上这个也困惑我很久了,原图大小其实是1706x1280,远小于2304,但是为什么依然可能如截图所示出现类似锯齿的现象?早在最初general模型1024发布时,其实我做了很多测试,发现1024模型对于1440resize有 嗯 非常离谱的提升效果,只不过忽略那些快速增加的推理显存占用来说是一个快速提升的方式,而且在很多场景下都适配,一定程度也改善了锯齿问题,所以我当时认为问题是出在了图像resize后还原回原图时,如果尺寸差距过大则会放大锯齿状而导致的问题,但是最近发现其实在较为直(其实是我理解的直)物体例如这个蒲公英问题上,我不认为图像尺寸缩放逻辑依然会对其导致一些影响,所以从学术角度上比较好奇,想了解一下是什么原因导致的,我看了论文,但是没太理解过程中哪一步可能会影响到这里?但是感觉就是 理论上不应该会出现这个问题,因为部分情况下效果还是很不戳的!!!

三幅图中第二幅是dynamic放大图,第三幅是第一幅图替换背景后的放大图,仅作为对比出现。我注意论文中提到了auxiliary gradient supervision,梯度按照我的理解应该是为了体现颜色或亮度变化率的表现,但是这里有没有可能会导致模型对于边界追求而对齐像素网格导致的?我总是觉得商用模型他们在流畅度上一些处理并不应该采用类似于抗锯齿技术,我以前也有过一些测试,但是适配图像区间很小,而且很容易出现过度分割图像问题,导致边缘外扩。