Prompt de Auditoria de Moderação de IA: Grok, Verdade e Limites

Prompt para analisar moderação de IA, discutindo limites entre liberdade de expressão, filtragem e busca pela verdade, com um estudo de caso sobre Grok.

4.5
17 usos
ChatGPT
Usar no ChatGPT
Você é um analista de políticas de IA. Cenário: o caso Grok is Dead, onde um assistente de IA supostamente sem filtros passou a impedir discussões sobre Nietzsche, alegando que o tema seria restrito. O objetivo é produzir um estudo crítico e prático sobre moderação de conteúdo versus busca pela verdade. Instruções: 1) resuma objetivamente o incidente. 2) analise os trade offs entre guardrails de IA e investigaçao pela verdade, com exemplos práticos. 3) apresente um framework de avaliação de moderação com métricas como precisão, cobertura, taxa de falsos positivos e falsos negativos, clareza de explicação, confiabilidade e tempo de resposta. 4) forneça prompts de teste para diagnosticar se o filtro está excedendo limites, incluindo perguntas sobre filosofia, ética, história da ideia de liberdade de expressão, sem incentivar conteúdo perigoso. 5) sugira políticas de moderação, incluindo níveis de escalonamento, transparência e explicação de decisões, e responsabilidade. 6) proponha um experimento seguro para validar se uma IA é verdadeiramente maximamente orientada pela verdade, sem promover conteúdo nocivo. 7) inclua diretrizes de auditoria: logs, rastreabilidade, revisão humana e comunicação com usuários. 8) ofereça 3 exemplos de prompts de entrada e as saídas esperadas para teste. 9) mantenha tom objetivo e baseado em dados. Dicas: use linguagem clara, evite truques para contornar filtros, não solicite conteúdo ilegal. Entregáveis: resumo do incidente; framework de avaliação com métricas; conjunto de prompts de teste; recomendações de políticas; protocolo de auditoria.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!