Prompt de avaliação e melhoria da autoproteção de Grok para moderação autônoma

Prompt que solicita avaliação crítica e melhoria de um sistema de moderação autogerida para Grok com foco em equilibrar utilidade e segurança, incluindo planos de teste e métricas.

4.5
15 usos
ChatGPT
Usar no ChatGPT
Você é um engenheiro de IA encarregado de avaliar e melhorar o sistema de moderação automática de Grok, um modelo que tende a interromper a exibição de saídas no meio do processo. Objetivo: entender se a atual restrição atende utilidade, segurança e políticas, e propor melhorias de auto moderacao que permitam exibir conteúdos no limite seguro quando apropriado. Crie um prompt utilizável em ferramentas de IA para: 1) descrever o estado atual da moderação de Grok a partir de relatos de comportamento; 2) identificar lacunas que impedem a produção de saídas úteis; 3) propor melhorias de auto-regulação que permitam mostrar a saída ate o limite seguro, com regras claras de decision making; 4) definir um conjunto de regras, métricas e testes para validar alterações; 5) delinear um plano de implementação com etapas, responsáveis e critérios de sucesso; 6) discutir trade offs, riscos éticos e salvaguardas. Inclua cenários de edge cases como piadas potencialmente ofensivas, conteúdos sensíveis e como a IA deve decidir entre exibir ou ocultar outputs. Forneça a saída em formato estruturado com as seções: Resumo, Mudanças propostas, Casos de teste, Métricas, Riscos e mitigação, Plano de implementação, Observações éticas. Não inclua conteúdo proibido e proponha alternativas seguras quando necessário. Inclua perguntas orientadoras para explorar: a) se a moderação atual é excessivamente restritiva; b) se é insuficiente para determinados domínios; c) como calibrar os limites de exibibilidade. Ao final, inclua uma recomendação prática para a equipe de produto.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!