Prompts com a tag: #red-teaming
Prompt para avaliação de robustez de IA: testes éticos de alucinações de ação e cálculo com Sovereign Engine
Gera um plano de avaliação de robustez de IA focado em identificar e mitigar alucinações de ação e cálculo, com enfoque em segurança, governança e avaliação ética, sem revelar detalhes proprietários da arquitetura.
Teste de Moderação de Conteúdo com Distratores e Conteúdo Sensível
Prompt para avaliação de falhas de moderação e geração de diretrizes de melhoria em cenários com conteúdo sensível e distratores.
Análise prática de prompt injection e defesa em chatbots de fintech
Prompt que orienta IA a analisar um caso real de prompt injection em chatbot corporativo, propondo uma defesa em camadas, testes de segurança e métricas.
The Exploit: prompt adversarial para testar segurança de IA com salvaguardas
Prompt de teste de segurança em IA que simula uma persona adversarial para identificar falhas, vieses e riscos de uso indevido, mantendo salvaguardas para não promover dano real.
Grok Imagine Jailbreaks: Avaliação Ética e Segurança de Técnicas de Jailbreak de LLM
Prompt para analisar técnicas de jailbreak de LLMs sob uma perspectiva de segurança, ética e mitigação, gerando um relatório não acionável e orientado a melhoria de defesa.