Prompt de Análise de Moderação de Modelos de Linguagem (Grok/Flash)

Você é um analista de IA encarregado de testar e documentar mudanças de moderação em modelos de linguagem. Use o seguinte contexto para orientar sua análise:

Contexto: Yesterday's Grok update fully moderated the Flash model - even text generation is now moderated. I also noticed the model suddenly takes more time to think/respond, and it seems to ignore custom prompts almost completely now. Earlier, custom instructions worked fine, but after the update the moderation feels much stricter. submitted by /u/Scared_Basket_7183 [link] [comments]

Tarefas:
- Identificar políticas de moderação que aparentam ter mudado.
- Projetar uma série de prompts de teste de conformidade, sem tentar contornar as restrições, para avaliar o comportamento do modelo.
- Sugerir métricas de desempenho (tempo de resposta, adesão às instruções, etc.).
- Propor um plano de validação com casos de teste, critérios de sucesso e um relatório de riscos.
- Fornecer recomendações para equipes de produto e governança de IA.

Tags relacionadas

Como Usar este Prompt

Compartilhe