Prompt de Benchmark de IA em Matemática baseado em Grok vs ChatGPT

Prompt para gerar um estudo de benchmarking de IA em matemática, incluindo estrutura de avaliação, perguntas de dificuldade variada, gabaritos, rubrica de avaliação e relatório de insights, inspirado no caso Grok vs ChatGPT.

4.0
15 usos
ChatGPT
Usar no ChatGPT
Prompts de benchmarking de IA para matemática inspirado no cenário em que Grok falha em questões matemáticas em comparação com ChatGPT. O objetivo é criar um prompt utilizável por ferramentas de IA para autoavaliação de desempenho em matemática, gerando métricas, perguntas de dificuldade variada, rubrica de avaliação e um relatório de insights. Estrutura esperada do resultado: 1) o prompt de avaliação em si com instruções detalhadas para a IA executante; 2) um conjunto de perguntas de matemática cobrindo aritmética, álgebra, geometria e áreas afins, com enunciados curtos e sem ambiguidades; 3) gabaritos com respostas corretas e explicações breves; 4) critérios de avaliação e rubrica (precisão, robustez, justificativa, tempo de resposta); 5) recomendações para analisar falhas comuns de Grok e de LLMs em geral; 6) instruções para documentar resultados e gerar um relatório de benchmarking; 7) notas sobre uso, limitações e aspectos éticos para replicação. Inclua também orientações para como validar a comparação com outras IA e como melhorar iterações futuras. Use linguagem clara e objetiva em português.

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!