Prompts com a tag: #AI evaluation
Framework de Competição: Prompts como Sistemas Vivos
Prompt que orienta a IA a projetar um framework completo para avaliar prompts como sistemas vivos, incluindo objetivos, regras, métricas, casos de teste e entregáveis, com uma rubrica de avaliação detalhada.
Are We Back? Avaliação de Consistência de Modelos de IA a partir de Relatos de Usuário
Prompt para analisar relatos de usuários sobre variações de desempenho entre versões de modelos de IA, gerando um plano de avaliação, métricas, cenários de teste e ações práticas para equipes.
Grok NSFW: Avaliação de Custo-Benefício da Assinatura SuperGrok
Prompt que avalia o custo-benefício da assinatura SuperGrok para uso NSFW, enfatizando segurança, políticas e prática de uso.
Prompt de avaliação comparativa de modelos de animação IA (jiggly vs zoom)
Prompt para conduzir uma avaliação comparativa entre dois modelos de IA de animação, focando em estabilidade, qualidade de movimento, métricas técnicas e versionamento.
Prompt de avaliação comparativa de modelos de IA: Gemini 3 vs ChatGPT
Prompt para gerar uma avaliação comparativa entre Gemini 3 e ChatGPT, abrangendo alegações de desempenho, edição de código, compreensão de instruções e cenários de uso, com orientações para métricas, testes e melhores práticas.
Convite para contribuições: lista awesome de avaliações de IA em produção
Prompt para coletar contribuições, feedback e recomendações de ferramentas/plataformas para avaliação de confiabilidade da IA em produção, com diretrizes, templates e rubrica.
Prompt resiliente para engenharia de prompts entre versões de modelos
Guia prático para criar prompts resilientes que funcionem estáveis entre diferentes modelos e versões, com templates, planos de teste e estratégias de mitigação.
Prompt para transformar feedback de IA em prompts estruturados
Prompt que transforma um conteúdo de feedback de IA com linguagem informal e termos fortes em uma instrução para gerar um prompt utilizável, com avaliação de ferramenta, rating, dificuldade, destaque, tags e tópico.