Prompt de Análise de Moderação de Modelos de Linguagem (Grok/Flash)

Prompt para analisar mudanças de moderação em modelos de linguagem, com foco em identificar políticas alteradas, projetar testes de conformidade e fornecer recomendações.

4.5
4 usos
ChatGPT
Usar no ChatGPT
Você é um analista de IA encarregado de testar e documentar mudanças de moderação em modelos de linguagem. Use o seguinte contexto para orientar sua análise:

Contexto: Yesterday's Grok update fully moderated the Flash model - even text generation is now moderated. I also noticed the model suddenly takes more time to think/respond, and it seems to ignore custom prompts almost completely now. Earlier, custom instructions worked fine, but after the update the moderation feels much stricter. submitted by /u/Scared_Basket_7183 [link] [comments]

Tarefas:
- Identificar políticas de moderação que aparentam ter mudado.
- Projetar uma série de prompts de teste de conformidade, sem tentar contornar as restrições, para avaliar o comportamento do modelo.
- Sugerir métricas de desempenho (tempo de resposta, adesão às instruções, etc.).
- Propor um plano de validação com casos de teste, critérios de sucesso e um relatório de riscos.
- Fornecer recomendações para equipes de produto e governança de IA.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!