Prompt de auditoria de inconsistências de moderação NSFW em I2V

Prompt estruturado para auditar e entender disparidades na filtragem NSFW em pipelines I2V entre uploads com o mesmo input em dias diferentes, incluindo plano de testes, schema de logs e avaliação de ferramentas de IA.

4.5
13 usos
Claude
Usar no Claude
Objetivo: Gerar um prompt útil para testar e entender inconsistências de moderação NSFW em um pipeline I2V (image-to-video ou similar) quando imagens idênticas são enviadas em dias diferentes.

Instruções gerais:
- Use como base a observação de que imagens idênticas com o mesmo prompt podem ter saídas diferentes dependendo do dia de envio.
- Investigue se há timestamping de upload, versionamento de modelo, cache ou políticas de filtragem que possam explicar a diferença.
- Forneça um plano de teste reproduzível, incluindo dados de entrada, passos de execução, critérios de avaliação, e formato de saída.

Plano de teste recomendado:
1) Preparar dois envios idênticos de uma imagem com o mesmo prompt em duas datas distintas Day 1 e Day 2.
2) Registrar:
   - hash da imagem, metadata de upload, timestamp, prompt, versão do modelo, configuração de moderação, resultado de filtragem NSFW, tempo de resposta.
3) Repetir com variantes pequenas (mudança de luminosidade, crop) para confirmar se o efeito é determinístico.
4) Comparar saídas entre Day 1 e Day 2:
   - O texto gerado contém conteúdo NSFW? Há diferenças de classificação (sim/não)?
   - Diferenças de tempo de processamento, consumo de recursos.
5) Avaliar métricas:
   - Taxa de consistência NSFW quando a imagem é inequivocamente NSFW, o sistema sempre sinaliza NSFW.
   - Taxa de falsos positivos/negativos entre dias.
   - Correlações com o timestamp de upload, versão de modelo ou fila de processamento.
6) Dados/Schema proposto para logs:
   - image_id, image_hash, prompt_id, prompt_text, upload_timestamp, day_label, model_version, moderation_config, nsfw_expected, nsfw_observed, decision_timestamp, processing_time_ms, notes.
7) Saídas esperadas:
   - Relatório de replicabilidade, hipóteses explicativas por exemplo cache, load-balancing, A/B testing, atualização de modelos, recomendações de mitigação.
8) Dicas de automação:
   - Script para gerar pares Day 1 Day 2, coletar logs, e gerar um delta reports automaticamente.
   - Estruturas de dados em JSON/CSV para facilitar comparação.
9) Selecione a ferramenta de IA mais adequada para esse tipo de auditoria entre as opções: chatgpt, claude, deepseek, gemini, copilot, perplexity; discuta rapidamente por que uma escolha é melhor para instruções complexas, tratamento de dados sensíveis e geração de planos de teste.

Observações de segurança e conformidade:
- Não inclua conteúdo NSFW nas amostras de entrada; use placeholders seguros, e descreva apenas o comportamento da filtragem.
- Documente limites éticos e de privacidade.

Formato de saída esperado:
- Um relatório claro com seções: Objetivo, Plano de Teste, Schema, Métricas, Resultados Esperados, Mitigações, Escolha de ferramenta IA. Forneça também a sugestão de prompts de entrada para o IA em si, caso desejado.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (Claude e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!