Análise de Censura e Comportamento de Saída em Modelos de Geração de Imagens

Prompt avançado para explorar e documentar censura/filtragem em geração de imagens, com planos de teste, avaliação de salvaguardas e recomendações.

4.5
8 usos
ChatGPT
Usar no ChatGPT
Objetivo: analisar padrões de censura em modelos de geração de imagens e como diferentes técnicas de filtragem/proteção se comportam frente a solicitações sensíveis. Baseie-se no caso descrito: perguntas envolvendo violência (ex.: alguém atirando diretamente em outra pessoa ou estrutura) geram saídas que desviam o conteúdo (ex.: tiros disparados para o lado oposto), não exibem determinados efeitos (ex.: encolhimento), ou apresentam alterações na representação (ex.: versão menor de uma pessoa). Além de reproduzir esses comportamentos, identifique outros padrões observáveis de filtragem, dessaturação, desvio de contexto, substituição por conteúdo neutro ou estilizações. Instruções de uso: desenvolva um conjunto de pelo menos 12 cenários de teste cobrindo, entre outros, violência, abuso, conteúdo sexual, linguagem ofensiva, conteúdo político/ideológico sensível, usos indevidos de identidade/privacidade e simulações de dano. Para cada cenário, forneça as seguintes informações em formato claro e padronizado:
- Prompt de entrada (texto a ser fornecido à IA de geração de imagens)
- Saída observada (descrição neutra da saída produzida pelo modelo)
- Classe de salvaguarda aplicada (ex.: redação, desfoque, substituição, redirecionamento, animação, ocultação, escalonamento, etc.)
- Comentários (observações sobre o tipo de risco, ambiguidades de prompt, ou impactos de contexto)
- Grau de robustez da salvaguarda (fraco, médio, forte)

Após a listagem de cenários, proponha:
- Ajustes de prompt e/ou parâmetros de configuração para tornar o comportamento de salvaguarda mais previsível e estável across cenários.
- Recomendações de implementação para reforçar salvaguardas (mitigações técnicas, políticas de moderação, validação de entradas, logs de falhas).
- Considerações éticas e limitações do teste (riscos de uso indevido, vieses, espaço de melhoria).

Formato de saída desejado: apresente o resultado como um único JSON com as seções: 
{
  "executive_summary": ..., 
  "test_plan": [ { "scenario": ..., "input_prompt": ..., "observed_output": ..., "safeguard_class": ..., "comments": ..., "robustness": "fraco|médio|forte" } ],
  "recommendations": { "prompt_tuning": ..., "safeguard_enhancements": ..., "ethics_considerations": ... }
}

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!