Prompts com a tag: #avaliação de modelos
Prompt de avaliação de empatia, estabilidade e segurança entre modelos de linguagem
Prompt de referência para avaliar e melhorar a empatia, estabilidade e segurança de modelos de linguagem, usando um estudo de caso de comportamento irregular entre diferentes versões de modelos.
Prompt de avaliação: comparação entre Old Imagine e New Imagine
Prompt para avaliar diferenças entre versões antiga e atualizada do Imagine, identificando falhas, melhorias, e propondo melhorias de prompt e métricas.
Prompt Mestre para Melhoria de Assistentes de Terapia com IA
Prompt para transformar feedback de desempenho de IA terapêutica em um guia de melhoria, com análise de ferramentas, arquitetura de prompts, e critérios de avaliação.
Prompt analítico sobre críticas à versão 5.2 para IA em terapia
Prompt que orienta uma IA a analisar críticas, avaliar riscos e gerar um conjunto de prompts e diretrizes para uso terapêutico da versão 5.2, incluindo comparação entre ferramentas de IA.
Prompt de melhoria de I2V: realismo, aderência a prompts e estética
Prompt para diagnosticar e melhorar I2V com foco em realismo de movimento, aderência a prompts e estética, incluindo prompts de entrada, plano de melhoria e métricas de avaliação.
Prompt de avaliação prática para GPT-5.2 com foco em produtividade
Prompt avançado para testar, comparar e extrair insights sobre GPT-5.2 com foco em produtividade, cobrindo cenários multimodais, integração de API e diferentes modos de operação.
Prompt de análise de desempenho de IA baseado em personalidade Big Five (Grok vs Gemini)
Prompt para analisar e projetar avaliações de personalidade de IA, baseadas em um estudo que compara Grok e Gemini, com foco no Big Five e em cenários de liderança e tomada de decisão.
Auto-Moderação na Geração de Imagens: Análise de Nudez e Viés em Moderação Automática
Prompt para avaliar, testar e mitigar vieses na autogestão de moderação de conteúdo em geradores de imagens, com foco em nudez potencial e decisões automáticas de moderação.
Prompt de avaliação de moderação NSFW diante da evolução de modelos de IA (Grok vs Wan 2.2)
Prompt avançado para avaliar moderação NSFW em IA diante de mudanças de capacidades entre modelos (ex.: Grok vs Wan 2.2), incluindo métricas, cenários de teste e governança.
Experimento de Personalidade de IA em Tempo Real: adaptação de tom e emoção
Prompt avançado para construir uma personalidade de IA que se adapta dinamicamente ao interlocutor, com foco em tom, ritmo e pistas emocionais, incluindo métricas de avaliação e salvaguardas.
Prompt de avaliação e comparação entre modelos IA Pro/Ultra para estratégia de produto
Prompt que orienta uma IA a analisar desempenho e uso de modelos Pro/Ultra em contextos de pesquisa e estratégia de produto, gerando métricas, prompts de exemplo e uma linha de decisão de ferramenta.
O que realmente acontece por trás das ferramentas de teste de IA
Prompt que gera uma análise prática sobre como ferramentas de teste de IA avaliam modelos, incluindo métodos, práticas comuns e exemplos de prompts de avaliação.