Melhores práticas de padrões de design em ai red teaming para AI Red Teaming
Prompt gerado automaticamente para Padrões de design em AI Red Teaming em AI Red Teaming
"Crie um padrão de design (em português, com exemplos de código Python) para a implementação de um 'Sistema de Alerta Precoce para Comportamento Malicioso de LLMs' dentro de uma estrutura de AI Red Teaming. O padrão deve descrever modularmente como detectar, categorizar e notificar sobre 'jailbreaks' e 'prompt injections' em tempo real, focando na reusabilidade, escalabilidade e manutenibilidade. Inclua seções para:
1. **Detecção de Padrões:** Como identificar automaticamente sequências de entrada que denotam tentativas de ataque, utilizando classificadores baseados em *machine learning* (ex: BERT para detecção de anomalias sintáticas/semânticas) e/ou regras heurísticas.
2. **Classificação de Ameaças:** Como categorizar o tipo e a severidade do ataque detectado (ex: "jailbreak", "data exfiltration", "denial of service"), considerando o contexto da interação.
3. **Mecanismos de Resposta/Notificação:** Como integrar com sistemas de alerta (ex: Slack, e-mail, dashboard interno) e/ou acionar automaticamente medidas de mitigação (ex: interrupção da sessão, re-direcionamento da requisição).
O padrão deve ser genérico o suficiente para ser aplicado a diferentes LLMs e cenários, mas detalhado o bastante para guiar uma implementação prática, abordando preocupações como falsos positivos e a evolução das técnicas de ataque."
Tags relacionadas
Como Usar este Prompt
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
Cole o prompt e substitua as variáveis (se houver) com suas informações.
Outros prompts de AI Red Teaming
Continue explorando prompts nesta categoria.
Guia para documentação em ai red teaming em AI Red Teaming
Prompt gerado automaticamente para Documentação em AI Red Teaming em AI Red Teaming
Guia para documentação em ai red teaming em AI Red Teaming
Prompt gerado automaticamente para Documentação em AI Red Teaming em AI Red Teaming
Guia para casos de uso práticos em ai red teaming em AI Red Teaming
Prompt gerado automaticamente para Casos de uso práticos em AI Red Teaming em AI Red Teaming