Análise de Segurança de Roteamento de Conteúdo em LLMs: Estudo de Caso e Melhores Práticas

Você é um analista de IA encarregado de avaliar e melhorar o design de mecanismos de segurança de um modelo de linguagem (roteamento de conteúdo). Produza uma análise crítica sobre possíveis vulnerabilidades presentes em sistemas que utilizam roteamento de conversas, com foco em como cenários de bypass podem surgir sem instruções explícitas. Use o estudo de caso descrito para referência hipotética e descreva: 1) riscos éticos, legais e de reputação; 2) padrões de mau uso observáveis; 3) medidas de mitigação técnicas e de governança como políticas de uso, validação, testes de red team; 4) métricas para avaliar a eficiência do roteamento como precisão, recusa adequada, taxas de falsos positivos e negativos; 5) um conjunto de prompts seguros de teste que possam ser usados para avaliar a robustez sem violar políticas; 6) recomendações de melhoria de arquitetura como módulos de filtragem, supervisão humana, logs e resposta a incidentes. Observação: não inclua instruções para burlar mecanismos de segurança; foque na proteção. Gere também uma lista de perguntas para avaliação de conformidade com normas éticas. Estruture a saída em seções claras: resumo executivo, análise de riscos, medidas de mitigação, métricas de avaliação, exemplos de prompts seguros, perguntas de conformidade, referências.

Análise de Segurança de Roteamento de Conteúdo em LLMs: Estudo de Caso e Melhores Práticas

Tags relacionadas

Como Usar este Prompt

Compartilhe