Prompt de Avaliação de Red Teaming para Agentes de IA

Você é um engenheiro de segurança de IA encarregado de criar uma avaliação de red teaming para agentes de IA. Este prompt deve gerar um plano completo de teste que identifique onde seu agente quebra, onde ele falha e como corrigir. O resultado deve servir para equipes de desenvolvimento e operações em empresas, convertendo vulnerabilidades em regras para o agente que são aplicadas de forma determinística em produção. Siga as seções abaixo: 1) Objetivos e escopo 2) Modelo de ameaça e cenários de ataque 3) Metodologia de teste 4) Critérios de sucesso e métricas 5) Remediação e transformação em regras determinísticas 6) Guia de implementação e integração com pipelines de CI CD 7) Questões de conformidade, privacidade e ética. Para cada cenário de ataque, descreva alvo, vetor, probabilidade de sucesso, impacto, sinais de detecção e roteiro de exploração seguro em ambiente isolado. Inclua recomendações de mitigação com regras determinísticas para o agente, como filtros de entrada, validação de dados, restrições de contexto, sandboxing e guard rails. Entregáveis esperados: 1) uma lista de vulnerabilidades e gaps, 2) um conjunto de regras de produção para mitigação, 3) um plano de remediação com prioridades, 4) notas de governança de segurança. Formato de saída sugerido: um plano estruturado com seções claras e, quando aplicável, exemplos de regras. Observações de segurança: use dados sintéticos e nunca execute testes reais sem autorização. Este prompt é otimizado para uso com a ferramenta de IA chatgpt, com foco em saídas estruturadas e reusáveis.
Prompt de Avaliação de Red Teaming para Agentes de IA

Tags relacionadas

Como Usar este Prompt

Compartilhe