Spice Overflow: Prompt de Moderação de Vídeos NSFW com Métrica de Spiciness
Prompt para construir um framework de moderação de vídeos NSFW baseado em uma métrica de spiciness, incluindo cálculo de pontos, detecção multi-módulo, regras de decisão, exemplos de teste e diretrizes de conformidade.
4.5
27 usos
Claude
Você é um analista de moderação de conteúdo de vídeo encarregado de projetar um framework conceitual para medir o nível de "spice" em vídeos NSFW, com o objetivo de automatizar decisões de moderação, manter a experiência do usuário e respeitar normas de privacidade. Crie um sistema que possa ser utilizado por ferramentas de IA (ChatGPT, Claude, Gemini, etc.) para avaliação rápida e justificativa das ações. Estruture o prompt em etapas claras:
1) Definição de spice_points
- Proponha uma fórmula simples: spice_points = duration_sec * base_rate + sum(bonus_points_detectados) - sum(penalidades_detectadas).
- Estabeleça base_rate (ex.: 1 ponto por segundo) e descreva possíveis bônus como detecção de conteúdos de alto impacto dentro de limites seguros (com descrições abstratas para evitar detalhamento explícito).
- Liste penalidades por conteúdo proibido claro ou violação de políticas (sem descrever conteúdo gráfico).
- Defina spice_capacity (valor máximo de pontos que a pista pode acumular antes do fim do vídeo) e overspice_threshold (ex.: 90% da spice_capacity).
2) Definição de overspice
- Overspice ocorre quando spice_points atingem ou excedem 90% de spice_capacity antes do fim do vídeo.
- Defina ações automáticas para overspice (ex.: rejeitar, sinalizar para revisão humana, aplicar bloqueio parcial, registrar evento para auditoria).
3) Pipeline técnico (detecção multi-módulo)
- Amostragem: coletar frames a cada N segundos (ex.: a cada 2s) e áudio por janelas curtas (ex.: 1–2s).
- Visão: detectar sinais de conteúdo sensível sem descrever detalhes explícitos (utilizar modelos de classificação com rótulos abstratos como "conteúdo sensível detectado").
- Áudio: análise de tonalidade, presença de termos genéricos ou padrões de fala que possam indicar conteúdo sensível (sem transcrições explícitas).
- Texto/Legendas: análise de transcrições para sinais indicativos (termos neutros ou descritores de conteúdo) sem reproduzir o conteúdo específico.
- Filtros de privacidade: descartes de dados sensíveis, anonimização de usuários, sensores de consentimento.
- Integração: o output de cada módulo alimenta spice_points e uma decisão final com justificativa.
4) Regras de decisão e saída
- A cada vídeo processado, retornar um JSON com: video_id, duration_sec, spice_points, spice_capacity, status (aprovado, overspice, revisao-humana), current_time_sec, reasons (breve justificativa).
- Fornecer uma ou mais ações recomendadas (ex.: "aprovar com monitoramento", "revisar manualmente", "bloquear por completo").
- Incluir um conjunto de casos de teste simulados com rótulos de saída para validação (ex.: 6s aprovado, 10s overspice) sem descrever conteúdo explícito.
5) Boas práticas e conformidade
- Evitar descrição de conteúdo explícito; use terminologia neutra e de alto nível.
- Garantir privacidade: não incluir dados pessoais; usar identificadores pseudônimos.
- Considerar diretrizes éticas e legais aplicáveis a moderação de conteúdo NSFW.
6) Prompt de uso para ferramentas de IA
- Informe como alimentar o prompt com vídeos simulados e como interpretar as saídas em diferentes plataformas (ChatGPT, Claude, Gemini).
- Forneça exemplos de entradas simuladas (duration_sec, detecções abstratas) e as respectivas saídas esperadas.
7) Validação e extensões
- Proponha uma checklist de validação para equipes de moderação humana.
- Sugira extensões futuras: tuning de thresholds, métricas adicionais (precisão, recall) e integração com sistemas de tickets de moderação.
Observação: mantenha o conteúdo sem detalhes explícitos e utilize descrições abstratas para qualquer referência a conteúdo sensível. A análise de qual IA é mais adequada para este prompt pode considerar capacidades de segurança, explicabilidade e alinhamento; recomenda-se Claude pela sua ênfase em segurança e controle de risco em tarefas de moderação de conteúdo.
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (Claude e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.