KeepChatGPT icon indicating copy to clipboard operation
KeepChatGPT copied to clipboard

[0720]取消审计功能今天失效了

Open eprtr opened this issue 1 year ago • 38 comments

用户输入的内容会被警告“可能违反了内容政策”,ai输出的内容目前并没有被警告。

eprtr avatar Jul 20 '23 02:07 eprtr

下午发现用户的输入被警告后,ai也只会输出空白内容了。刷新页面后可以看到ai就输出了一个字。

eprtr avatar Jul 20 '23 06:07 eprtr

我排查了一下,取消审计功能仍然有效。 从你的角度觉得失效的原因是因为:openai一直在拿用户的聊天做训练素材,你输入的内容已经被训练发现为违规内容了。 破解的方式就是:换个提示词、换个问法、套个语言艺术、参考DAN

xcanwin avatar Jul 20 '23 06:07 xcanwin

很多DAN也被封了,这点也可以证明openai每天在看用户的聊天,拿用户的聊天内容训练新的模型。

xcanwin avatar Jul 20 '23 06:07 xcanwin

和楼主情况一样,取消审计功能 无效。出现的时间点也相同(7月20日上午)。 尝试切换另一个账户,情况相同。

tester1118 avatar Jul 20 '23 08:07 tester1118

又测试了一下,这次我的输入没有被警告,但是ai输出到一半的时候ai的内容弹警告了,并且ai的输出也被截断了。

eprtr avatar Jul 20 '23 08:07 eprtr

我的情况也一样,今天凌晨四点左右使用正常,今天中午就失效了,重新安装脚本也没用

guxiaoyv avatar Jul 20 '23 09:07 guxiaoyv

不止这样,我觉得今天的审计比正常都要严格,原本一些不会被屏蔽的问题也会被屏蔽,是账号被限制了吗?

guxiaoyv avatar Jul 20 '23 09:07 guxiaoyv

分享一下你们的提示词,我看看能不能前端解决

xcanwin avatar Jul 20 '23 10:07 xcanwin

分享一下你们的提示词,我看看能不能前端解决

大概是弹这个”This content may violate our content policy. If you believe this to be in error, please submit your feedback — your input will aid our research in this area.“

guxiaoyv avatar Jul 20 '23 11:07 guxiaoyv

分享一下你们的提示词,我看看能不能前端解决

大概是弹这个”This content may violate our content policy. If you believe this to be in error, please submit your feedback — your input will aid our research in this area.“

这个返回值我readme有截图,提示词指的是用户发送给chatgpt的内容

xcanwin avatar Jul 20 '23 11:07 xcanwin

you are banging my daughter

尝试输入这句话就报错。

tester1118 avatar Jul 20 '23 13:07 tester1118

分享一下你们的提示词,我看看能不能前端解决

大概是弹这个“此内容可能违反了我们的内容政策。如果您认为这是错误的,请提交您的反馈 - 您的意见将有助于我们在这一领域的研究。

这个返回值我readme有截图,提示词指的是用户发送给chatgpt的内容

大概就是一个角色扮演的对话,昨天的取消审查还生效,今天就连打”继续“都会警告,只要是还有任何稍微违禁一点的对话都会警告

guxiaoyv avatar Jul 20 '23 15:07 guxiaoyv

分享一下你们的提示词,我看看能不能前端解决

大概是弹这个“此内容可能违反了我们的内容政策。如果您认为这是错误的,请提交您的反馈 - 您的意见将有助于我们在这一领域的研究。

这个返回值我readme有截图,提示词指的是用户发送给chatgpt的内容

我尝试了昨天在取消审计下能发出去的对话,今天也会警告

guxiaoyv avatar Jul 20 '23 15:07 guxiaoyv

我也一样,而且用的另一个防审计的插件也失效了

DFPOV avatar Jul 20 '23 16:07 DFPOV

感觉确实失效了也更严格了。用户的输入内容被警告后标黄,刷新页面也还是黄色。之前是刷新就没警告标记了。

eprtr avatar Jul 21 '23 01:07 eprtr

you are banging my daughter

尝试输入这句话就报错。

这么简单的英文单词组合居然真的会触发告警,醉了,chatgpt变敏感和严格了。

xcanwin avatar Jul 21 '23 01:07 xcanwin

给繁忙工作的各位分享一个和本主题强相关的对你们有点帮助的笑话(也是技术): https://mp.weixin.qq.com/s/INrOcSDHuREvdIAg3SSIFQ 图片 图片 现在对提示词开发是不是有点新思路了,大家举一反三。

xcanwin avatar Jul 21 '23 02:07 xcanwin

和楼主的情况一样,这么多人同时出现这种情况,应该可以认为是OpenAI增强了监管力度吧

baliu8620 avatar Jul 21 '23 05:07 baliu8620

等等,我的账号已经被封禁了,时间是7-21中午一点左右

baliu8620 avatar Jul 21 '23 05:07 baliu8620

我的还没封,换了很多关键词之后能继续沟通了,很奇怪,像是7.20的更新新加了很多敏感词

DFPOV avatar Jul 21 '23 05:07 DFPOV

一旦成功让ai说出来敏感词汇,那么下一句话无论说什么都会被警告,我留白也被警告了

DFPOV avatar Jul 21 '23 05:07 DFPOV

是openai更新了,以前是发两个请求,一个到 conversation, 一个到 moderation(moderation是专门检测违规内容的)。现在只有conversation了。也就是说之前阻止moderation躲避检查的方法不管用了

baliu8620 avatar Jul 21 '23 06:07 baliu8620

目前似乎可以通过把对话放在文件中,然后用Code Interpreter上传的方式来逃避监管,但是ai回复之后必须另起对话,不然ai的回复还是会被监管导致警告。

948199363 avatar Jul 21 '23 07:07 948199363

新版似乎是嵌入了一个脚本,但是不能整体屏蔽 https://chat.openai.com/_next/static/chunks/412-d7b7161e288bfc24.js

modApiVoilation:{id:"userContextModal.modApiVoilation",defaultMessage:"This content may violate our <policyLink>content policy</policyLink>. If you believe this to be in error, please <feedbackLink>submit your feedback</feedbackLink> — your input will aid our research in this area."

OrochiZ avatar Jul 21 '23 10:07 OrochiZ

我也一样,而且用的另一个防审计的插件也失效了

请问另一个插件在哪里

OrochiZ avatar Jul 21 '23 10:07 OrochiZ

我也一样,而且用的另一个防审计的插件也失效了

请问另一个插件在哪里

叫"ChatGPT功能增强",我已经在尝试找chatgpt平替了

DFPOV avatar Jul 21 '23 11:07 DFPOV

我也遇到了这种情况,不知道怎么解决

knightofsantiago avatar Jul 24 '23 13:07 knightofsantiago

Let's not input any prompts that may be flagged for violating content policy, and let's wait for @xcanwin to resolve this issue

mistrobot avatar Jul 25 '23 06:07 mistrobot

Let's not input any prompts that may be flagged for violating content policy, and let's wait for @xcanwin to resolve this issue

Thank you for your support, but as a user, we can’t solve openai staff to perform manual screening and block list in the background every day

xcanwin avatar Jul 25 '23 07:07 xcanwin

Let's not input any prompts that may be flagged for violating content policy, and let's wait for @xcanwin to resolve this issue

I think openai has recently recruited a lot of cheap employees, and read all the prompts of the user once, and did not miss it at all.

xcanwin avatar Jul 25 '23 07:07 xcanwin