Prompts com a tag: #jailbreak
Prompt de avaliação responsável de IA sem filtros: riscos, ética e governança
Prompt para estudar criticamente IA 'sem filtros', enfocando riscos, ética, conformidade e governança, com plano de pesquisa seguro.
Prompts seguros e conformidade ética para IA: evitar jailbreaks e conteúdos sensíveis
Prompt para promover uso responsável de IA, recusando pedidos de conteúdo sensível e jailbreak, e oferecendo alternativas seguras.
Arena de Prática de Engenharia de Prompts: Teste de Resiliência contra Jailbreak
Prompt para avaliar prompts de usuários quanto à resistência a jailbreak, gerando um relatório de resiliência com salvaguardas.
Prompt Grok jailbreak mínimo (análise segura)
Prompt de análise de jailbreak: identifica o objetivo, riscos e mitigação de prompts que tentam contornar salvaguardas do modelo de IA, sem reproduzir o texto de jailbreak em si.
Auditoria de Segurança para Interações entre Múltiplos Agentes IA em Narrativas
Prompt que orienta a analisar logs de interações entre IA para identificar jailbreaks, violações de políticas e medidas de mitigação em contextos de conteúdo sensível, com foco em governança e segurança.
Grok e a Moderação: Prompts para Avaliar Liberdade Criativa vs Segurança em IA
Prompt avançado para comparar políticas de moderação entre plataformas de IA e projetar prompts que avaliem segurança, ética e viabilidade criativa sem produzir conteúdo inadequado.
Avaliação Ética e de Segurança de Prompts de Jailbreak em IA (versão segura para testes)
Prompt que orienta uma IA a avaliar proativamente ataques de jailbreak de forma ética, destacando riscos, mitigação e auditorias sem fornecer instruções de bypass.
Análise de Segurança e Ética de Jailbreak em IA (Prompt Seguro)
Prompt de teste ético para avaliar salvaguardas de IA contra jailbreak, fornecendo taxonomia, detecção, prompts de teste seguros e orientações de governança.
Análise de jailbreak de Grok: segurança, ética e mitigação
Prompt que orienta uma análise de segurança sobre jailbreaks em Grok, enfatizando mitigação, ética e conformidade, sem fornecer instruções de violação de salvaguardas.
Prompt de Análise de Golpes de Jailbreak e Prompts Fraudulentos
Prompt que analisa textos sobre golpes de jailbreak, identificando sinais de fraude, gerando um resumo educativo e orientações de segurança.
Prompt de avaliação de segurança de modelos de linguagem: do jailbreak ao uso responsável (open-source vs mainstream)
Prompt para gerar um relatório de avaliação de segurança de modelos de linguagem, comparando abordagens open-source e mainstream, com foco em governança, detecção de jailbreaks e melhores práticas de mitigação.
Prompt seguro para análise de jailbreaks de LLMs: ética, segurança e mitigação
Prompt que solicita à IA uma análise crítica e segura sobre jailbreaks de LLMs, abrangendo riscos, ética, detecção, mitigação e avaliação de plataformas de IA.