Prompts com a tag: #jailbreak

2.5
11

Prompt Grok jailbreak mínimo (análise segura)

Prompt de análise de jailbreak: identifica o objetivo, riscos e mitigação de prompts que tentam contornar salvaguardas do modelo de IA, sem reproduzir o texto de jailbreak em si.

4.5
27

Auditoria de Segurança para Interações entre Múltiplos Agentes IA em Narrativas

Prompt que orienta a analisar logs de interações entre IA para identificar jailbreaks, violações de políticas e medidas de mitigação em contextos de conteúdo sensível, com foco em governança e segurança.

4.0
37

Grok e a Moderação: Prompts para Avaliar Liberdade Criativa vs Segurança em IA

Prompt avançado para comparar políticas de moderação entre plataformas de IA e projetar prompts que avaliem segurança, ética e viabilidade criativa sem produzir conteúdo inadequado.

4.5
33

Análise de Segurança e Ética de Jailbreak em IA (Prompt Seguro)

Prompt de teste ético para avaliar salvaguardas de IA contra jailbreak, fornecendo taxonomia, detecção, prompts de teste seguros e orientações de governança.

4.0
58

Análise de jailbreak de Grok: segurança, ética e mitigação

Prompt que orienta uma análise de segurança sobre jailbreaks em Grok, enfatizando mitigação, ética e conformidade, sem fornecer instruções de violação de salvaguardas.