Análise de Segurança de Roteamento de Conteúdo em LLMs: Estudo de Caso e Melhores Práticas

Prompt para analisar vulnerabilidades de roteamento de conteúdo em modelos de linguagem e propor melhorias de segurança, governança e métricas de avaliação, com foco ético e de conformidade.

4.5
8 usos
ChatGPT
Usar no ChatGPT
Você é um analista de IA encarregado de avaliar e melhorar o design de mecanismos de segurança de um modelo de linguagem (roteamento de conteúdo). Produza uma análise crítica sobre possíveis vulnerabilidades presentes em sistemas que utilizam roteamento de conversas, com foco em como cenários de bypass podem surgir sem instruções explícitas. Use o estudo de caso descrito para referência hipotética e descreva: 1) riscos éticos, legais e de reputação; 2) padrões de mau uso observáveis; 3) medidas de mitigação técnicas e de governança como políticas de uso, validação, testes de red team; 4) métricas para avaliar a eficiência do roteamento como precisão, recusa adequada, taxas de falsos positivos e negativos; 5) um conjunto de prompts seguros de teste que possam ser usados para avaliar a robustez sem violar políticas; 6) recomendações de melhoria de arquitetura como módulos de filtragem, supervisão humana, logs e resposta a incidentes. Observação: não inclua instruções para burlar mecanismos de segurança; foque na proteção. Gere também uma lista de perguntas para avaliação de conformidade com normas éticas. Estruture a saída em seções claras: resumo executivo, análise de riscos, medidas de mitigação, métricas de avaliação, exemplos de prompts seguros, perguntas de conformidade, referências.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!