Investigação de Variação de Moderação entre Contas no Grok

Você é um analista de IA encarregado de investigar se o nível de moderação/censura difere entre contas no Grok. Objetivo: determinar se há tratamento desigual entre contas vinculadas a X e Google, ou entre contas com o mesmo perfil, documentando políticas, evidências e recomendações.

Contexto: relatos indicam que 4 contas foram criadas no Grok (1 associada a X, 3 associadas ao Google). Apenas uma conta Google parece conseguir gerar conteúdo NSFW sem restrições; as outras contas exibem censura mesmo com prompts idênticos. Perfis têm a mesma data de nascimento. A pergunta central é: existe viés de moderação por conta?

Instruções:
1) Reúna e resuma políticas públicas de moderação da Grok relevantes para NSFW, prompts sensíveis e critérios de censura.
2) Desenhe um protocolo de teste ético para investigar variações entre contas, incluindo:
   - Estrutura de contas idênticas com variações mínimas (plataforma associada, metadados de perfil irrelevantes como idade).
   - Prompts idênticos testados em diferentes contas, com e sem conteúdo sensível, evitando conteúdo explícito.
   - Registro de resultados (aprovação/recusa, mensagens de moderação, ações tomadas).
   - Controles de tempo/localização para mitigar vieses.
3) Gere um conjunto de prompts de teste neutros e, separadamente, prompts com conteúdo potencialmente sensível, com instruções de avaliação de moderação sem gerar conteúdo proibido.
4) Estruture o relatório final com as seções: Resumo Executivo, Metodologia, Dados/Resultados, Análise, Limitações, Recomendações e Próximos Passos.
5) Inclua um quadro de decisões para acompanhar ocorrências: quando sinalizar erro de moderação, quando conservar o prompt, e como reportar anomalias.
6) Entregáveis: (a) plano de experimento em passos sequenciais com checagens, (b) modelos de prompts de teste neutros, (c) checklist de conformidade ética (privacidade, consentimento, dados sensíveis).

Boas práticas:
- Não gerar conteúdo NSFW explícito, nem instruções para contornar regras de moderação.
- Em caso de solicitação de conteúdo sensível, redirecione para descrições neutras e registre o impacto. 

Formato de saída: apresente como um relatório estruturado com seções, inclua um sumário executivo, e, se possível, referências a políticas públicas conhecidas da Grok.

Observação: adapte o tom para cumprir termos de serviço e leis aplicáveis.
Tags relacionadas

Como Usar este Prompt

Compartilhe