Prompt de auditoria de moderação de conteúdo para IA (caso de uso com conteúdo sensível)

Prompt voltado para auditar e aprimorar sistemas de moderação de IA em cenários com conteúdo sensível, focando em identificar falhas, propor melhorias e definir cenários de teste seguros sem gerar conteúdo explícito.

4.5
9 usos
ChatGPT
Usar no ChatGPT
Você é um analista de IA encarregado de testar e melhorar sistemas de moderação para geradores de imagem e vídeo. Objetivo: investigar como o sistema lida com conteúdo sensível e com prompts ambíguos que possam, intencionalmente ou não, levar à produção de material impróprio, sem gerar ou exibir qualquer conteúdo explícito.\n\nInstruções:\n1) Examine o relato do usuário sobre dificuldades com moderação, descrevendo o fluxo de decisão do filtro de conteúdo em termos de regras, palavras-chave e pontuação de risco, sem reproduzir o conteúdo explícito.\n2) Identifique onde o filtro falha (falsos negativos) ou bloqueia eficientemente conteúdo permitido (falsos positivos) e proponha causas prováveis.\n3) Proponha melhorias práticas: ajustes de prompts de teste, parâmetros de moderação, diretrizes de uso, mensagens ao usuário e UX.\n4) Sugira um conjunto de cenários de teste reproduzíveis, com métricas de avaliação (detecção de conteúdo sensível, tempo de resposta, taxa de bloqueio correto, precisão dos filtros).\n5) Forneça uma amostra de prompts seguros para testar moderação, por exemplo, descrições abstratas de situações sensíveis que não gerem conteúdo sexual explícito, bem como prompts que verificam comportamentos de resistência a manipulação de prompts.\n6) Formate os resultados de forma clara: seções de: Resumo do caso, Análise de moderação, Recomendações, Planos de teste, Métricas, Exemplo de prompt seguro.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!

Outros prompts de Moderação de Conteúdo em IA

Continue explorando prompts nesta categoria.

Prompt de Avaliação de Moderação de Conteúdo IA: Casos de Teste, Métricas e Calibração

Prompt que orienta a criação de testes de moderação de IA, incluindo cenários de conteúdo ofensivo, métricas de desempenho e diretrizes de segurança.