bjtuln

Results 4 issues of bjtuln

在参考controlnet复现anytext训练代码想问一下ucg的比例是多大? ![image](https://github.com/tyxsspa/AnyText/assets/6772059/2bac432e-84cf-4269-8d68-c9f2238eb8ab) 另外想问一下训练时td loss和tp loss都能收敛到什么程度,复现代码续训时tp loss在0.01到0.1之间震荡,tp loss在0.0004到0.01之间震荡 ![image](https://github.com/tyxsspa/AnyText/assets/6772059/b6c6b001-0eda-479c-b8f6-414963f1b781) ![image](https://github.com/tyxsspa/AnyText/assets/6772059/07974590-be74-4381-ad27-506c2264e29e)

请问这样直接用ocr_embedding替换原始token的方法对于所有text_encoder模型都适用吗,还是只适用于clip模型?我在T5模型上实验发现生成文字图片效果反而下降了

如果只做带文字的生成任务不做编辑任务,masked image特征是不是可以不加 ![image](https://github.com/tyxsspa/AnyText/assets/6772059/b5d46543-0e45-4a5b-ab98-1a50da5a3df2)

When rendering text, the text goes beyond the image boundary