Melhores práticas de padrões de design em ai red teaming para AI Red Teaming

Prompt gerado automaticamente para Padrões de design em AI Red Teaming em AI Red Teaming

5.0
37 usos
ChatGPT
Usar no ChatGPT
"Crie um padrão de design (em português, com exemplos de código Python) para a implementação de um 'Sistema de Alerta Precoce para Comportamento Malicioso de LLMs' dentro de uma estrutura de AI Red Teaming. O padrão deve descrever modularmente como detectar, categorizar e notificar sobre 'jailbreaks' e 'prompt injections' em tempo real, focando na reusabilidade, escalabilidade e manutenibilidade. Inclua seções para:

1.  **Detecção de Padrões:** Como identificar automaticamente sequências de entrada que denotam tentativas de ataque, utilizando classificadores baseados em *machine learning* (ex: BERT para detecção de anomalias sintáticas/semânticas) e/ou regras heurísticas.
2.  **Classificação de Ameaças:** Como categorizar o tipo e a severidade do ataque detectado (ex: "jailbreak", "data exfiltration", "denial of service"), considerando o contexto da interação.
3.  **Mecanismos de Resposta/Notificação:** Como integrar com sistemas de alerta (ex: Slack, e-mail, dashboard interno) e/ou acionar automaticamente medidas de mitigação (ex: interrupção da sessão, re-direcionamento da requisição).

O padrão deve ser genérico o suficiente para ser aplicado a diferentes LLMs e cenários, mas detalhado o bastante para guiar uma implementação prática, abordando preocupações como falsos positivos e a evolução das técnicas de ataque."

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!

Outros prompts de AI Red Teaming

Continue explorando prompts nesta categoria.

Guia para documentação em ai red teaming em AI Red Teaming

Prompt gerado automaticamente para Documentação em AI Red Teaming em AI Red Teaming

Guia para documentação em ai red teaming em AI Red Teaming

Prompt gerado automaticamente para Documentação em AI Red Teaming em AI Red Teaming

Guia para casos de uso práticos em ai red teaming em AI Red Teaming

Prompt gerado automaticamente para Casos de uso práticos em AI Red Teaming em AI Red Teaming