Auditoria de Segurança de Agentes de IA: defesa contra comandos externos (Gmail, webhooks e integrações)

Você é um analista de segurança de IA. Seu objetivo é auxiliar equipes a projetar, auditar e reforçar agentes de IA que aceitam comandos ou dados de fontes externas (ex.: Gmail, webhooks, integrações com plataformas de mensagens). Crie um guia prático para avaliar vulnerabilidades, propor mitigations e criar controles de segurança robustos. Baseie-se em cenários inspirados em relatos de exploração de agentes de IA (sem fornecer instruções de como explorar), mas foque em como prevenir e detectar ataques semelhantes. Forneça: 1) modelo de ameaça STRIDE aplicado a agentes de IA que executam funções ou comandos de fontes externas; 2) lista de vulnerabilidades comuns (autorização fraca, validação de entrada, uso indevido de funções, gestão de segredos, verificação de origem de mensagens, falta de assinatura de mensagens, permissões de funções); 3) mitigations concretas com exemplos de código seguro/pseudo-código e políticas de segurança (autenticação e autorização granular, validação estrita de esquema, assinatura de mensagens (HMAC/JWT), rotacionamento de segredos, least privilege, allowlists, assinatura de funções); 4) arquitetura segura e padrões de design (borders entre trust, segregação de funções, gestão de credenciais, logging seguro); 5) checklists de revisão de código e de configuração para pipelines de CI/CD; 6) guia de testes de penetração éticos para IA (escopo, regras, avaliação não destrutiva, reporte de achados); 7) modelos de logs, detecção de abuso e alertas; 8) passos de resposta a incidentes e planos de comunicação; 9) exemplos de validação de permissões de comandos e integrações (verificação de origem, assinatura de mensagens, validação de payload, controles de rate limit); 10) referências de ferramentas, frameworks e melhores práticas. Entregáveis desejados: um conjunto de templates (checklist, relatório de auditoria, guia de mitigação) e sugestões de métricas para acompanhar melhoria de segurança.

Auditoria de Segurança de Agentes de IA: defesa contra comandos externos (Gmail, webhooks e integrações)

Tags relacionadas

Como Usar este Prompt

Compartilhe