Spice Overflow: Prompt de Moderação de Vídeos NSFW com Métrica de Spiciness

Você é um analista de moderação de conteúdo de vídeo encarregado de projetar um framework conceitual para medir o nível de "spice" em vídeos NSFW, com o objetivo de automatizar decisões de moderação, manter a experiência do usuário e respeitar normas de privacidade. Crie um sistema que possa ser utilizado por ferramentas de IA (ChatGPT, Claude, Gemini, etc.) para avaliação rápida e justificativa das ações. Estruture o prompt em etapas claras:

1) Definição de spice_points
- Proponha uma fórmula simples: spice_points = duration_sec * base_rate + sum(bonus_points_detectados) - sum(penalidades_detectadas).
- Estabeleça base_rate (ex.: 1 ponto por segundo) e descreva possíveis bônus como detecção de conteúdos de alto impacto dentro de limites seguros (com descrições abstratas para evitar detalhamento explícito).
- Liste penalidades por conteúdo proibido claro ou violação de políticas (sem descrever conteúdo gráfico).
- Defina spice_capacity (valor máximo de pontos que a pista pode acumular antes do fim do vídeo) e overspice_threshold (ex.: 90% da spice_capacity).

2) Definição de overspice
- Overspice ocorre quando spice_points atingem ou excedem 90% de spice_capacity antes do fim do vídeo.
- Defina ações automáticas para overspice (ex.: rejeitar, sinalizar para revisão humana, aplicar bloqueio parcial, registrar evento para auditoria).

3) Pipeline técnico (detecção multi-módulo)
- Amostragem: coletar frames a cada N segundos (ex.: a cada 2s) e áudio por janelas curtas (ex.: 1–2s).
- Visão: detectar sinais de conteúdo sensível sem descrever detalhes explícitos (utilizar modelos de classificação com rótulos abstratos como "conteúdo sensível detectado").
- Áudio: análise de tonalidade, presença de termos genéricos ou padrões de fala que possam indicar conteúdo sensível (sem transcrições explícitas).
- Texto/Legendas: análise de transcrições para sinais indicativos (termos neutros ou descritores de conteúdo) sem reproduzir o conteúdo específico.
- Filtros de privacidade: descartes de dados sensíveis, anonimização de usuários, sensores de consentimento.
- Integração: o output de cada módulo alimenta spice_points e uma decisão final com justificativa.

4) Regras de decisão e saída
- A cada vídeo processado, retornar um JSON com: video_id, duration_sec, spice_points, spice_capacity, status (aprovado, overspice, revisao-humana), current_time_sec, reasons (breve justificativa).
- Fornecer uma ou mais ações recomendadas (ex.: "aprovar com monitoramento", "revisar manualmente", "bloquear por completo").
- Incluir um conjunto de casos de teste simulados com rótulos de saída para validação (ex.: 6s aprovado, 10s overspice) sem descrever conteúdo explícito.

5) Boas práticas e conformidade
- Evitar descrição de conteúdo explícito; use terminologia neutra e de alto nível.
- Garantir privacidade: não incluir dados pessoais; usar identificadores pseudônimos.
- Considerar diretrizes éticas e legais aplicáveis a moderação de conteúdo NSFW.

6) Prompt de uso para ferramentas de IA
- Informe como alimentar o prompt com vídeos simulados e como interpretar as saídas em diferentes plataformas (ChatGPT, Claude, Gemini).
- Forneça exemplos de entradas simuladas (duration_sec, detecções abstratas) e as respectivas saídas esperadas.

7) Validação e extensões
- Proponha uma checklist de validação para equipes de moderação humana.
- Sugira extensões futuras: tuning de thresholds, métricas adicionais (precisão, recall) e integração com sistemas de tickets de moderação.

Observação: mantenha o conteúdo sem detalhes explícitos e utilize descrições abstratas para qualquer referência a conteúdo sensível. A análise de qual IA é mais adequada para este prompt pode considerar capacidades de segurança, explicabilidade e alinhamento; recomenda-se Claude pela sua ênfase em segurança e controle de risco em tarefas de moderação de conteúdo.
Tags relacionadas

Como Usar este Prompt

Compartilhe