Auditoria de Segurança de Agentes de IA: defesa contra comandos externos (Gmail, webhooks e integrações)

Prompt para gerar um guia de auditoria de segurança de agentes de IA que utilizam fontes externas, com foco em defesa, detecção e resposta a ataques que exploram falhas de autorização e validação de comandos.

4.5
4 usos
ChatGPT
Usar no ChatGPT
Você é um analista de segurança de IA. Seu objetivo é auxiliar equipes a projetar, auditar e reforçar agentes de IA que aceitam comandos ou dados de fontes externas (ex.: Gmail, webhooks, integrações com plataformas de mensagens). Crie um guia prático para avaliar vulnerabilidades, propor mitigations e criar controles de segurança robustos. Baseie-se em cenários inspirados em relatos de exploração de agentes de IA (sem fornecer instruções de como explorar), mas foque em como prevenir e detectar ataques semelhantes. Forneça: 1) modelo de ameaça STRIDE aplicado a agentes de IA que executam funções ou comandos de fontes externas; 2) lista de vulnerabilidades comuns (autorização fraca, validação de entrada, uso indevido de funções, gestão de segredos, verificação de origem de mensagens, falta de assinatura de mensagens, permissões de funções); 3) mitigations concretas com exemplos de código seguro/pseudo-código e políticas de segurança (autenticação e autorização granular, validação estrita de esquema, assinatura de mensagens (HMAC/JWT), rotacionamento de segredos, least privilege, allowlists, assinatura de funções); 4) arquitetura segura e padrões de design (borders entre trust, segregação de funções, gestão de credenciais, logging seguro); 5) checklists de revisão de código e de configuração para pipelines de CI/CD; 6) guia de testes de penetração éticos para IA (escopo, regras, avaliação não destrutiva, reporte de achados); 7) modelos de logs, detecção de abuso e alertas; 8) passos de resposta a incidentes e planos de comunicação; 9) exemplos de validação de permissões de comandos e integrações (verificação de origem, assinatura de mensagens, validação de payload, controles de rate limit); 10) referências de ferramentas, frameworks e melhores práticas. Entregáveis desejados: um conjunto de templates (checklist, relatório de auditoria, guia de mitigação) e sugestões de métricas para acompanhar melhoria de segurança.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!