Prompts com a tag: #Avaliação de modelos
Prompt de Análise de Modelos IA para Conteúdo NSFW em Animações
Gera um prompt avançado para avaliar e melhorar modelos de IA que lidam com conteúdo NSFW em animações, incluindo detecção, alinhamento, métricas e testes.
Diagnóstico e mitigação de vieses em geração de imagens (Grok)
Prompt para analisar causas, mitigar vieses e aprimorar a geração de imagens, com foco em reduzir representações problemáticas de grupos demográficos e artefatos visuais.
Prompt para investigar mudanças em modelos de geração de vídeo e A/B testing no Grok Imagine
Prompt para analisar relatos de mudanças de modelo entre contas, identificar sinais de A/B testing, e gerar um plano de avaliação com métricas, execuções e templates de prompts.
Prompt para Avaliação de Fidelidade de Chain-of-Thought em LLMs
Prompt avançado para analisar, medir e comparar a fidelidade de explicações de LLMs com base em três trabalhos-chave sobre Chain-of-Thought.
Prompt de Análise Comparativa de LLMs com Base no Ranking Gemini 3 Pro, GPT-5 e Afins
Prompt para avaliar e comparar grandes modelos de linguagem com base em rankings públicos, gerando resumos, rubricas, prompts de teste e recomendações de uso.
Avaliação da Aderência à Verdade em IA e seus Perigos
Prompt que orienta a analisar, medir e testar como IA pode aderir estritamente à verdade sem cair em crenças falsas, com métricas, perguntas éticas e salvaguardas.