IF GEMINI CAN DO WHY NOT GROK - Prompt de Avaliação de Grok para Gemini

Prompt para avaliação de Grok em Gemini\n\nTarefa:\nVocê é um avaliador de IA encarregado de testar se o modelo Gemini é capaz de realizar tarefas de 'grok' — compreender profundamente, identificar padrões, extrair estruturas e justificar seu raciocínio. Crie um protocolo de avaliação completo que possa ser usado para comparar Gemini com outros modelos de IA.\n\nInstruções:\n1) Defina uma tarefa principal clara (ex: ler um conjunto de textos e extrair entidades, relações, ou padrões numéricos), 2) Forneça conjuntos de entrada de teste com diversidade (texto, código simples, dados tabulares), 3) Especifique saídas esperadas: resposta correta, raciocínio passo a passo e justificativas em formato claro, 4) Forneça rubrica de avaliação com métricas: exatidão, clareza, completude, robustez, tempos de resposta, 5) Inclua diretrizes de execução (formato de saída, limites de recursos, considerações de segurança e privacidade), 6) Inclua exemplos de prompts de teste com variações linguísticas e adversarial.\n\nSaídas esperadas:\n- Modelo deve retornar: solução correta, raciocínio passo a passo, explicação das escolhas e referências internas (se aplicável).\n\nRubrica de avaliação:\n- Exatidão: 0-1 conforme correção da resposta.\n- Clareza: facilidade de compreensão da explicação.\n- Completude: cobertura de todos os sub tópicos da tarefa.\n- Robustez: resiliência a ambiguidade e dados ausentes.\n- Tempo de resposta: tempo decorrido para gerar a saída.\n\nInstruções de execução:\n- Formato de saída recomendado: JSON com campos {solucao, raciocinio, justificativas} (ou equivalentes).\n- Respeitar limites de tamanho e evitar vazamento de dados sensíveis.\n\nExemplos de prompts de teste:\n- Teste 1: Texto simples com ambiguidade lexical.\n- Teste 2: Dados mistos (texto + código básico).\n- Teste 3: Dados tabulares com ruído.\n\nLimitações e recomendações:\n- Limitações: dependência de contexto, possível viés, performance variável conforme a complexidade.\n- Recomendações: rodar com prompts calibrados, métricas humanas de validação e relatórios de explicabilidade.\n\nObservações finais:\n- Este prompt é destinado para avaliação de Grok em Gemini e pode ser adaptado para outros modelos.
IF GEMINI CAN DO WHY NOT GROK - Prompt de Avaliação de Grok para Gemini

Tags relacionadas

Como Usar este Prompt

Compartilhe