zoe
zoe
**请先确认是否为[最新版本](https://github.com/zenghongtu/PPet/releases/latest)** #### 问题描述 **_平台信息(win/mac/linux):_** #### 截图(可选)
使用SkyCaptioner-V1生成caption,对图片中物体方位、人物左右手的描述很混乱,容易左右不分,有什么好的解决方案吗?
这是分别用两个lora跑的结果: 1、wan2.2-lightning: https://github.com/user-attachments/assets/ff518b0f-6034-4108-abbd-64e248321db2 2、wan2.1 lora(高低噪声模型都加lora): https://github.com/user-attachments/assets/71f5cce4-6821-4c72-b48a-92c0b72274c9 是框架不兼容吗,为啥一个结果那么差,大佬们有没有时间可以看看 config 配置如下:wan_moe_i2v_distill.json { "infer_steps": 4, "target_video_length": 97, "text_len": 512, "target_height": 832, "target_width": 480, "self_attn_1_type": "flash_attn3", "cross_attn_1_type": "flash_attn3", "cross_attn_2_type": "flash_attn3", "seed": 42, "sample_guide_scale": [1.0,...