Prompts com a tag: #model-evaluation

4.0
6

Prompt para Avaliar Alternativas de IA NSFW com Segurança e Criatividade

Prompt de design para comparar plataformas de IA em termos de produção de conteúdo NSFW, enfatizando criatividade, segurança e governança, sem produzir conteúdo explícito.

4.0
12

Prompt de avaliação de alegações sobre Grok e criatividade/NSFW

Prompts estruturados para avaliar alegações sobre o retorno de Grok, com foco em criatividade, segurança de conteúdo NSFW, e metodologias de avaliação de modelos de IA.

4.5
12

Prompt de avaliação do Novo Modelo de Geração de Imagens

Prompt de avaliação para um novo modelo de geração de imagens, com foco em qualidade visual, limites de conteúdo sensível, moderação e estratégias de segurança. Orienta a criação de prompts de avaliação, critérios de análise e recomendações de ferramentas.

4.5
12

Prompt de Análise de Desempenho entre GPT-5 e GPT-5.1

Um prompt estruturado para analisar e melhorar o desempenho de modelos de linguagem, com foco na comparação entre versões 5 e 5.1, incluindo identificação de causas, prompts de teste, métricas e validação.

4.5
17

Prompt de avaliação de veracidade e alucinações em modelos de IA

Prompts e diretrizes para testar, medir e reportar alucinações e mentiras em modelos de linguagem, com rubrica de avaliação e formato de saída padronizado.

4.5
26

Prompt de avaliação comparativa de modelos IA com foco multimodal

Prompt estruturado para gerar prompts de avaliação de modelos IA com foco multimodal, incluindo critérios, protocolo de avaliação e prompts específicos para diferentes plataformas, orientando a análise de Gemini 3 versus GPT-5.

4.0
16

Prompt de Análise de Percepção de Desempenho do ChatGPT com Base em Feedback de Usuários

Gera uma análise estruturada sobre possíveis degradações na qualidade das respostas do ChatGPT com base em feedback de usuários, incluindo métricas, métodos de diagnóstico e planos de mitigação.

4.5
15

Prompt de avaliação de modelos: NSFW vs Emoções e comparação GPT-5.1 com modelos legados

Prompt para gerar um protocolo de avaliação abrangente de modelos de linguagem, com foco em NSFW e emoções, incluindo planos de teste, métricas, governança e comparação entre versões, além de um template de saída JSON.