novelai-bot icon indicating copy to clipboard operation
novelai-bot copied to clipboard

最新版本1.11.0会导致传输的tag不一样

Open dnf63123848 opened this issue 1 year ago • 2 comments

更新到最新版本后,输入和之前版本相同的tag,图片会不一样,在没有负面过滤的情况下图片会变得更诡异。 另外请问下官网的Add Quality Tags功能在bot上是默认开启的吗。

dnf63123848 avatar Oct 22 '22 11:10 dnf63123848

更新到最新版本后,输入和之前版本相同的tag,图片会不一样,在没有负面过滤的情况下图片会变得更诡异。

1.11.0 修改了默认的 uc。这个现在是配置项了,可以在 negativePrompt 中改回去。

另外请问下官网的Add Quality Tags功能在bot上是默认开启的吗。

是的,同样可以通过配置 basePrompt 修改。

shigma avatar Oct 22 '22 14:10 shigma

如果诡异可能是因为 negativePrompt 丢失。你确认一下有没有手动修改过这个配置项?

shigma avatar Oct 22 '22 18:10 shigma

没有修改,现在的最新版本还是有这个问题。

dnf63123848 avatar Oct 24 '22 10:10 dnf63123848

Add Quality Tags功能,需要往 basePrompt里面添加什么参数呢。

dnf63123848 avatar Oct 24 '22 10:10 dnf63123848

basePrompt里面找到了。

dnf63123848 avatar Oct 24 '22 10:10 dnf63123848

Add Quality Tags功能,需要往 basePrompt里面添加什么参数呢。

The default value is masterpiece, best quality.

默认值是杰作,最高质量

MaikoTan avatar Oct 24 '22 10:10 MaikoTan

哦作者我懂你意思了,我是为了更接近咒语效果把negativePrompt里的内容删了,原来是这个问题,知道了。

dnf63123848 avatar Oct 24 '22 10:10 dnf63123848

再问下作者,最新版本的-o和-v怎么使用。

dnf63123848 avatar Oct 24 '22 10:10 dnf63123848

Ask the author again how to use the latest versions of -o and -v.

-v 512x768 -o 512x512

format is <width>x<height>, and width/height should be a multiple of 64.

格式是宽度x高度,和宽度/高度应该是64的倍数。

MaikoTan avatar Oct 24 '22 10:10 MaikoTan

宽度/高度应该是64的倍数

这个限制是 nai 的限制还是 sd 的?

shigma avatar Oct 24 '22 10:10 shigma

@dnf63123848 所以现在你的问题还存在吗?

shigma avatar Oct 24 '22 10:10 shigma

宽度/高度应该是64的倍数

这个限制是 nai 的限制还是 sd 的?

It is a restriction of sd, and nai/naifu would convert width/height to the closest number multiple of 64.

这是 sd 的限制,而 nai/naifu 会将宽度/高度转换为最接近的 64 的倍数。

MaikoTan avatar Oct 24 '22 10:10 MaikoTan

还是存在的,现在的图片输出效果与1.10.9版本不同。

dnf63123848 avatar Oct 24 '22 12:10 dnf63123848

还是存在的,现在的图片输出效果与1.10.9版本不同。

而且这两个版本与官网也不是一个效果。

dnf63123848 avatar Oct 24 '22 12:10 dnf63123848

Could you use this site to compare your prompt and negative prompt, also post your koishi.yml file here?

你能不仅用这地点 来比较你的提示和否定提示,还能在这里发布你的 koishi.yml 文件吗?

MaikoTan avatar Oct 24 '22 12:10 MaikoTan

*这站点


Generated by koishi-plugin-github.

NWYLZW avatar Oct 24 '22 12:10 NWYLZW

koishi.zip

dnf63123848 avatar Oct 24 '22 12:10 dnf63123848

在bot上生成的图片拖进去没法解析啊。

dnf63123848 avatar Oct 24 '22 12:10 dnf63123848

还是存在的,现在的图片输出效果与 1.10.9 版本不同。

我们只能解决「在没有负面过滤的情况下图片会变得更诡异」的问题。我们在 1.11 中增加了一些默认的负面 prompt,因此如果想与过去保持一致,你可能需要修改你的配置。

此外,NovelAI 官网已经更换了多次模型,每一次更换模型都会导致过去的 seed 完全失效,我们也无法解决此问题。

shigma avatar Oct 24 '22 12:10 shigma

这是1.10.9版本的图片 1904505140-123236132-1BF78BC0A6495923B59A83B0DBE2F9FE 这是最新版本生成的图片 QQ图片20221024201455 这是官网版本生成的图片 ba7f12f6-850f-47e9-b028-c1d25ef8e251

dnf63123848 avatar Oct 24 '22 12:10 dnf63123848

在bot上生成的图片拖进去没法解析啊。

请注意你的图片格式。如果你使用的是 QQ,则你的图片可能被聊天软件压缩并转换为 jpg。只有 png 格式包含可以用于解析元信息。

shigma avatar Oct 24 '22 12:10 shigma

好吧,问题在添加完负面标签后就不诡异了。

dnf63123848 avatar Oct 24 '22 12:10 dnf63123848

我其实也不知道 QQ 的转换逻辑,但有一些线索:

  • Bot 发送的初始图片是 png
  • 初始图片被复制转发后会自动变成 jpg

尽量右击原图保存。

shigma avatar Oct 24 '22 12:10 shigma

我们尽量会保证与当前版本官网一致。下个版本我们会修改默认的 negative prompt 配置。

shigma avatar Oct 24 '22 12:10 shigma

我们尽量会保证与当前版本官网一致。下个版本我们会修改默认的 negative prompt 配置。

根据您提供的方法我找到原因了: 1.最新版本与旧版本不同是因为有负面tag查重,会自动删掉重复的。 2.bot的版本与官网版本不同,是因为官网版本默认strength:0.69,noise:0.667;而bot的版本默认是strength:0.7,noise:0.2

dnf63123848 avatar Oct 24 '22 12:10 dnf63123848

@dnf63123848 你提供了非常有用的信息。

  1. 旧版本中的重复和排列顺序都不令我满意,因此我改掉了。我觉得最新版本的行为更合理。
  2. 我实现相关功能时抓包的结果是 0.7/0.2,可能是官网改掉了,更大可能是你之前操作的结果。官方会保存你的操作记录,并自动应用到之后的请求中。

shigma avatar Oct 24 '22 12:10 shigma

@dnf63123848 你提供了非常有用的信息。

  1. 旧版本中的重复和排列顺序都不令我满意,因此我改掉了。我觉得最新版本的行为更合理。
  2. 我实现相关功能时抓包的结果是 0.7/0.2,可能是官网改掉了,更大可能是你之前操作的结果。官方会保存你的操作记录,并自动应用到之后的请求中。

第一条是我的问题,这个效果很好。 第二条我之前并没有使用图生图的功能,后面又跑了机柜,应该是官方改掉了。 另外最新版本宽高和不能超过 1280有问题啊,官方免费的512x768都不能使用;还有最新版本,插件里设置竖屏,横屏,正方形无效。

dnf63123848 avatar Oct 24 '22 12:10 dnf63123848

我试了将噪点和强度与官网版同步,效果依然有些差别。 我上传了png格式的图片。 官网 bot机器人

dnf63123848 avatar Oct 24 '22 13:10 dnf63123848

我超级迷惑……我刚刚亲测了一下,整个请求跟网页一模一样的但就是结果不一样……

shigma avatar Oct 24 '22 16:10 shigma

好吧我大概搞明白了……官网默认的 LowQ 和 BadA 是交叉在一起的:

nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry

也就是 LowQ + BadA 不等于字面意义上的 LowQ 拼接 BadA。我改一下默认行为。

shigma avatar Oct 24 '22 16:10 shigma