AutoStudio
AutoStudio copied to clipboard
AutoStudio: Crafting Consistent Subjects in Multi-turn Interactive Image Generation
大佬,用你昨天发布的源码,跑了一遍,环境和结果描述如下: ENV:windows 11 x64, Python 3.10, Torch 2.1.0, CUDA 11.8, VS 2019 SD Model: 依你推荐的 dreamlike-anime-1.0 demo.json 脚本配置文件没动过,5段对话没能全部跑完,到 dialogue 5 turn 4 报错了,报错信息见下面。 部分结果图片: data:image/s3,"s3://crabby-images/3596a/3596a72704d5e791a3e970c5a073342c695da04a" alt="幻灯片1" data:image/s3,"s3://crabby-images/f22c7/f22c71a0e424870e0132a7e51a35935ff054e015" alt="幻灯片2" data:image/s3,"s3://crabby-images/6adf6/6adf6cd5f86b8b5733daf7b597185ae070908c06" alt="幻灯片3" data:image/s3,"s3://crabby-images/a54e5/a54e56f690b629eb1e5b08d748f0320da7b839cd" alt="幻灯片4" 大佬给分析分析原因,是环境问题?CUDA版本?CUDA精度?还是模型?参数?还是输出稳定性问题?
是忘了怎么写中国字了吗?
Getting this problem on an i9-9900k, RTX 2080 + RTX 3060 Ti system. Any suggestions to fix? ```A module that was compiled using NumPy 1.x cannot be run in NumPy...
大佬,微信群过期了呢,麻烦更新一下群呢
recommand -> recommend
Really promising project! One question is that how’s “on-the-fly interaction” realized in the project code?
大佬您好,我把你们的论文和代码都看了一遍,论文中提到了多个智能体,比如主题管理器,布局生成器,监督者,绘图者这些,以及这些智能体的Prompt。 但是我似乎没有找到开源的代码中有多智能体交互的内容,比如论文中提到的布局生成器和监督者的多轮交互来确保布局正确,请问这些多智能体交互的代码是没有开源吗?如果是还未开源,是否可以开源让我们学习一下呢? 盼回复。
原理问题
您好,我想问一下character_database = {'0':Image.new('RGB', (100, 100), (255, 255, 255))}中的'0'是什么作用呢。为啥进行image_encoder的时候需要复制两次呢。