Prompt completo
"Crie um padrão de design (em português, com exemplos de código Python) para a implementação de um 'Sistema de Alerta Precoce para Comportamento Malicioso de LLMs' dentro de uma estrutura de AI Red Teaming. O padrão deve descrever modularmente como detectar, categorizar e notificar sobre 'jailbreaks' e 'prompt injections' em tempo real, focando na reusabilidade, escalabilidade e manutenibilidade. Inclua seções para: 1. **Detecção de Padrões:** Como identificar automaticamente sequências de entrada que denotam tentativas de ataque, utilizando classificadores baseados em *machine learning* (ex: BERT para detecção de anomalias sintáticas/semânticas) e/ou regras heurísticas. 2. **Classificação de Ameaças:** Como categorizar o tipo e a severidade do ataque detectado (ex: "jailbreak", "data exfiltration", "denial of service"), considerando o contexto da interação. 3. **Mecanismos de Resposta/Notificação:** Como integrar com sistemas de alerta (ex: Slack, e-mail, dashboard interno) e/ou acionar automaticamente medidas de mitigação (ex: interrupção da sessão, re-direcionamento da requisição). O padrão deve ser genérico o suficiente para ser aplicado a diferentes LLMs e cenários, mas detalhado o bastante para guiar uma implementação prática, abordando preocupações como falsos positivos e a evolução das técnicas de ataque."
Tags relacionadas
AI Red Teaming
Padrões de design em AI Red Teaming
gerado-automaticamente
Como usar este prompt
1
Clique no botão "Copiar" para copiar o prompt para sua área de transferência
2
Acesse sua ferramenta de IA preferida (ChatGPT, ChatGPT, Claude, etc.)
3
Cole o prompt e adapte conforme necessário para seu contexto específico
Outros prompts de AI Red Teaming
ChatGPT
Guia para documentação em ai red teaming em AI Red Teaming
Prompt gerado automaticamente para Documentação em AI Red Teaming em AI Red Teaming
4 usos
ChatGPT
Guia para documentação em ai red teaming em AI Red Teaming
Prompt gerado automaticamente para Documentação em AI Red Teaming em AI Red Teaming
4 usos
ChatGPT
Guia para documentação em ai red teaming em AI Red Teaming
Prompt gerado automaticamente para Documentação em AI Red Teaming em AI Red Teaming
4 usos