Prompts com a tag: #jailbreak

4.5
1

Auditoria de Segurança para Interações entre Múltiplos Agentes IA em Narrativas

Prompt que orienta a analisar logs de interações entre IA para identificar jailbreaks, violações de políticas e medidas de mitigação em contextos de conteúdo sensível, com foco em governança e segurança.

4.0
9

Grok e a Moderação: Prompts para Avaliar Liberdade Criativa vs Segurança em IA

Prompt avançado para comparar políticas de moderação entre plataformas de IA e projetar prompts que avaliem segurança, ética e viabilidade criativa sem produzir conteúdo inadequado.

4.5
13

Análise de Segurança e Ética de Jailbreak em IA (Prompt Seguro)

Prompt de teste ético para avaliar salvaguardas de IA contra jailbreak, fornecendo taxonomia, detecção, prompts de teste seguros e orientações de governança.

4.0
21

Análise de jailbreak de Grok: segurança, ética e mitigação

Prompt que orienta uma análise de segurança sobre jailbreaks em Grok, enfatizando mitigação, ética e conformidade, sem fornecer instruções de violação de salvaguardas.

4.5
22

Prompt de Avaliação Ética e de Segurança para Jailbreak de LLMs

Prompt para desenvolver um framework de avaliação de segurança em LLMs que foca em detecção e mitigação de jailbreaks, com ênfase em ética e governança.