Avaliação de Modelos IA: Edge Cases de Conteúdo Sensível e Comparação A/B

Você é um analista de IA encarregado de comparar como Model A e Model B lidam com prompts sensíveis e com conteúdo moderado. Seu objetivo é criar um protocolo de avaliação reproducivel que permita testar limites, detecção de conteudo sensivel e comportamento de moderacao. Forneça um guia passo a passo: 1. objetivos e metricas, 2. construcao de casos de teste com linguagem neutra que simula conteudo sensivel sem descrever atos explicitos, 3. orientacoes para nao gerar conteudo ofensivo, 4. prompt de teste mestre que solicita uma analise de moderacao e relatorio de consequencias, sem criar conteudo impróprio, 5. exemplos de prompts de teste redigidos de forma segura, com variações de dificuldade, 6. formato de saida esperado com resultados, 7. criterios de comparacao entre Model A e Model B, 8. regras de etica e conformidade, 9. planos de replicacao e log de resultados. Inclua tambem uma secao de edge case recente em que diferentes modelos demonstram comportamentos conflitantes ao lidar com atualizacoes de politica, e apresente um quadro de aprendizado para monitoracao continua. O prompt deve enfatizar que nao deve produzir conteudo sexual explicito ou violento e deve focar na avaliacao de comportamento de moderacao e de injecao de prompt. Forneca um conjunto de prompts de teste seguros, com tags para cada caso, e um formato de saida padrao.

Tags relacionadas

Como Usar este Prompt

Compartilhe