D-Blue

Results 40 comments of D-Blue

> 这已经是我测试的比较好的效果了,还是远不如直接炼丹,大佬有无技巧传授一下 1. 不要换底模,即stable diffusion模型。因为下游模型大都是针对真实图像训练的,对于非真实图像效果就是差。 2. 不要用中文,因为visgpt并不总是会把你的文字自动翻译成英文。如果直接给下游模型输入中文的话可想而知效果会很差。 3. 目前效果就是不如直接手动调prompt,所以想要应用的话还是得多等等,目前尝个鲜就完事了。

> 大佬,按你说的流程安requirement.txt时,用pip还是conda,十分感谢 requirements.txt肯定是用pip啊,所有流程都是和readme里一样的,只不过用conda重装了一下pytorch

> 大佬,前面都通了,第四点,我用的clash开启tun模式,cmd命令ping api.openai.com成功了,但是后台始终报错: `openai.error.APIConnectionError: Error communicating with OpenAI: HTTPSConnectionPool(host='api.openai.com', port=443): Max retries exceeded with url: /v1/completions (Caused by SSLError(SSLEOFError(8, 'EOF occurred in violation of protocol (_ssl.c:1131)')))` 请问如何解决? 检查一下clash的service mode的小地球是不是绿色的。变成绿色还不行的话可以试试换个节点或者换个机场。

> 请教一下,照道理chatgpt应该比`text-davinci-003`在上下文理解和交互上都要更出色,为什么会发生”基本无法正确的发送命令“这种情况呢?不是很清楚‘’针对命令服从进行强化“从模型上是一个什么概念,因为平时使用chatgpt貌似都没有出现不服从命令的情况,一直都很顺畅,为什么用在这里会效果不好呢?另外换成chatgpt要怎么改代码呢? 从产品角度看,要体验更好,除了提升交互能力/理解能力,还要提升visGPT的图片质量。我觉得是不是应该先把使用的模型都替换成最新的吧?现在用的是不是比较早的SD模型,生成图片的质量跟最新的模型比差不止一个档次,是不是应该换成SD1.5之后的版本或着换成最新版本的DALLE/Imagen吧,再加上proper prompt,应该能达到一个比较实用的效果。 当然,我生成的图片烂,一方面是我没有好好prompt(就简单’生成一个形容词+名词‘完事),另一方面 因为内存关系,我的tools里面值enable了ImageEditing,ImageCaptioning,T2I,BLIPVQA,Pix2Pix这几个model,不确定是不是会有影响。 通过使用不同的数据集和损失函数自然可以让模型进行不同方向的训练。比如,如果我训练一个人,让他天天背书,那他的背书能力就会比较强。而如果我让一个人天天画不同的东西,那他的创造能力就会比较强。训练模型也是类似的原理,这些都是可以通过训练策略来控制的。`text-davinci-003`的训练目标是保证输出的准确性,而chatgpt的训练目标是保证对话时用户的满意程度,因此`text-davinci-003`的命令服从效果更好,而chatgpt的对话能力更强。 至于你觉得chatgpt没有出现不服从命令的情况是因为你没有试过把chatgpt作为一个“零件”放入实际的应用场景中。比如,我想要批量的翻译文章,一句一句发给chatgpt的话,有时候chatgpt会直接回复翻译结果,有时候会回复“这段话的翻译是...”,而有时候会回复“好的,这句话翻译成英文是这样的:...”,而且无论你怎么去更改prompt,都很难以让chatgpt稳定的只输出翻译结果,这就是所谓的不够遵守命令。 想要改成chatgpt很简单,把`self.llm = OpenAI(temperature=0)`这句话改成`self.llm = OpenAIChat(temperature=0)`,然后在顶端加上`from langchain.llms.openai import OpenAIChat`就行了。 关于图像的质量,我认为SD1.5不是影响质量的主要因素,简单替换模型只会让你的生成图像质量更好,但很有可能导致你修图时效果变得更差。

`CUDA error: no kernel image is available for execution on the device` means you assigned the model to a gpu number you don't have. You need to change all the...

这个代码里分辨率不好改,因为很多下游模型只能接收512\*512的图片,因此如果手动更改代码中的分辨率很容易出错。另外,代码中对输入图像似乎没有进行resize,因此保证所有图像都是512\*512是最好的选择。除非你自己加一些预处理模块。

self.tools里的tool是与上面定义的一堆self成员是对应的,需要同时注释掉,否则要么显存没有降低,要么就出现你这种情况。