AutoStudio icon indicating copy to clipboard operation
AutoStudio copied to clipboard

AutoStudio: Crafting Consistent Subjects in Multi-turn Interactive Image Generation

Results 11 AutoStudio issues
Sort by recently updated
recently updated
newest added

大佬,用你昨天发布的源码,跑了一遍,环境和结果描述如下: ENV:windows 11 x64, Python 3.10, Torch 2.1.0, CUDA 11.8, VS 2019 SD Model: 依你推荐的 dreamlike-anime-1.0 demo.json 脚本配置文件没动过,5段对话没能全部跑完,到 dialogue 5 turn 4 报错了,报错信息见下面。 部分结果图片: ![幻灯片1](https://github.com/donahowe/AutoStudio/assets/131220899/2cac9f95-49bb-4a17-a04b-418c598d0f8d) ![幻灯片2](https://github.com/donahowe/AutoStudio/assets/131220899/c45bfc5a-89f3-4399-8266-8a148fa1241b) ![幻灯片3](https://github.com/donahowe/AutoStudio/assets/131220899/bcb1eeb5-35b2-405c-a2e8-a82ae24fb68f) ![幻灯片4](https://github.com/donahowe/AutoStudio/assets/131220899/118f0b97-f86f-4280-a280-c2218a0defb7) 大佬给分析分析原因,是环境问题?CUDA版本?CUDA精度?还是模型?参数?还是输出稳定性问题?

good first issue

Getting this problem on an i9-9900k, RTX 2080 + RTX 3060 Ti system. Any suggestions to fix? ```A module that was compiled using NumPy 1.x cannot be run in NumPy...

大佬,微信群过期了呢,麻烦更新一下群呢

Really promising project! One question is that how’s “on-the-fly interaction” realized in the project code?

大佬您好,我把你们的论文和代码都看了一遍,论文中提到了多个智能体,比如主题管理器,布局生成器,监督者,绘图者这些,以及这些智能体的Prompt。 但是我似乎没有找到开源的代码中有多智能体交互的内容,比如论文中提到的布局生成器和监督者的多轮交互来确保布局正确,请问这些多智能体交互的代码是没有开源吗?如果是还未开源,是否可以开源让我们学习一下呢? 盼回复。

您好,我想问一下character_database = {'0':Image.new('RGB', (100, 100), (255, 255, 255))}中的'0'是什么作用呢。为啥进行image_encoder的时候需要复制两次呢。