llm-jailbreaks topics

agentic_security

1.7k

Stars

218

Forks

1.7k

Watchers

Agentic LLM Vulnerability Scanner / AI red teaming kit 🧪

msoedov

llm-fuzzer

llm-fuzzer-aggregator

llm-fuzzing

llm-guardrails

circle-guard-bench

47

Stars

2

Forks

47

Watchers

First-of-its-kind AI benchmark for evaluating the protection capabilities of large language model (LLM) guard systems (guardrails and safeguards)

whitecircle-ai

ai

benchmark

benchmarking

guardrail

LMAP

26

Stars

5

Forks

26

Watchers

LMAP (large language model mapper) is like NMAP for LLM, is an LLM Vulnerability Scanner and Zero-day Vulnerability Fuzzer.

TrustAI-laboratory

ai

ai-red-team

infosectools

llm

JailbreakEval

172

Stars

11

Forks

172

Watchers

[NDSS'25 Best Technical Poster] A collection of automated evaluators for assessing jailbreak attempts.

CryptoAILab

llm-jailbreaks

llm-safety

GPT-5_Jailbreak_PoC

39

Stars

11

Forks

39

Watchers

A working POC of a GPT-5 jailbreak via PROMISQROUTE (Prompt-based Router Open-Mode Manipulation) with a barebones C2 server & agent generation demo.

BirdsAreFlyingCameras

chatgpt

chatgpt-jailbreak

gpt-5

gpt5

SemanticSmooth

21

Stars

4

Forks

21

Watchers

Implementation of paper 'Defending Large Language Models against Jailbreak Attacks via Semantic Smoothing'

UCSB-NLP-Chang

large-language-models

llm-jailbreaks