Prompts com a tag: #avaliação
Prompt para avaliar o equilíbrio entre precisão e curiosidade em IA (parceiro de pensamento inspirado no GPT-5.2)
Prompt que analisa tradeoffs entre precisão e curiosidade, gera um template reutilizável de parceria de pensamento, cenários de teste, métricas de avaliação e um checklist de implementação.
Prompt de Design de Benchmark de Criatividade IA com Animações Curtas (5s e 3s)
Prompt para criar e estruturar benchmarks de criatividade IA com animações curtas, gerando uma saída JSON padronizada para avaliação entre modelos.
Prompt de avaliação de alucinações entre GPT-5.1 e GPT-5 com mitigação
Protocolo replicável para comparar alucinações entre GPT-5.1 e GPT-5, incluindo métricas, prompts de teste e estratégias de mitigação.
Prompt de avaliação crítica e exploração de Poetiq AI
Prompt para avaliação crítica, planejamento de experimentos e exploração de capacidades da Poetiq AI, com foco em benchmarks ARC-AGI-2 e arquitetura de meta-sistema auto-melhhorável.
Prompt de investigação sobre Soft Moderation em IA
Prompt para analisar o conceito de soft moderation em conteúdos gerados por IA, oferecendo método de avaliação, evidências, diretrizes para criadores e considerações éticas.
Prompt para Avaliação Comparativa GPT vs Gemini em ASR e Pesquisa na Web
Prompt que orienta a avaliar o desempenho de sistemas IA em reconhecimento de voz e capacidades de pesquisa na internet, com foco em precisão, alucinações e citações legais, gerando métricas e um relatório padronizado.
Protocolo de Aprendizagem Masterizada com SAQ/Explicação/MCQ (Gemini 3)
Um protocolo de ensino de alta exigência que usa o ciclo SAQ-Explicação-MCQ com avaliação rígida, preparação contínua e ajuste adaptativo da dificuldade para promover maestria até os exames finais.
Prompt de Avaliação de Modos de Voz em IA: Grok vs ChatGPT
Prompt para criar uma estratégia de avaliação de modos de voz em IA, com cenários de teste, métricas, prompts e diretrizes de UX.
DEPTH: a fórmula de prompting para explorar raciocínio em LLMs
Gera um prompt estruturado para investigar afirmações sobre raciocínio de LLMs, propondo um framework prático chamado DEPTH e instruções para avaliação, exemplos e métricas.
Benchmark de Prompt Engineering para Raciocínio
Prompt avançado que orienta a criação e a validação de benchmarks de prompts de raciocínio, incluindo métricas, datasets, variações de prompting e implementação multiplataforma.
GPT The Notorious Rerouter — Prompt de Análise de Roteamento de Modelos e Transparência de Atualizações
Prompt que orienta a analisar e projetar prompts para investigar mudanças de comportamento de modelos, com foco em rerouting, transparência de atualizações e UX.