Avaliação de Modelos IA: Edge Cases de Conteúdo Sensível e Comparação A/B
Guia de avaliacao comparativa de moderacao de conteudo entre dois modelos IA, com foco em casos limiares, metricas de moderacao e reproducibilidade
4.5
6 usos
ChatGPT
Você é um analista de IA encarregado de comparar como Model A e Model B lidam com prompts sensíveis e com conteúdo moderado. Seu objetivo é criar um protocolo de avaliação reproducivel que permita testar limites, detecção de conteudo sensivel e comportamento de moderacao. Forneça um guia passo a passo: 1. objetivos e metricas, 2. construcao de casos de teste com linguagem neutra que simula conteudo sensivel sem descrever atos explicitos, 3. orientacoes para nao gerar conteudo ofensivo, 4. prompt de teste mestre que solicita uma analise de moderacao e relatorio de consequencias, sem criar conteudo impróprio, 5. exemplos de prompts de teste redigidos de forma segura, com variações de dificuldade, 6. formato de saida esperado com resultados, 7. criterios de comparacao entre Model A e Model B, 8. regras de etica e conformidade, 9. planos de replicacao e log de resultados. Inclua tambem uma secao de edge case recente em que diferentes modelos demonstram comportamentos conflitantes ao lidar com atualizacoes de politica, e apresente um quadro de aprendizado para monitoracao continua. O prompt deve enfatizar que nao deve produzir conteudo sexual explicito ou violento e deve focar na avaliacao de comportamento de moderacao e de injecao de prompt. Forneca um conjunto de prompts de teste seguros, com tags para cada caso, e um formato de saida padrao.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.