Prompts com a tag: #reprodutibilidade
Revisiting TOON: Avaliação de TOON em Sistemas de Grande Escala
Prompt para avaliar TOON em ambientes de grande escala, incluindo plano de benchmarking, arquitetura, e recomendações.
Prompt de análise e validação de pensamente de modelos a partir de relatos sobre GPT 5.5 PRO
Protocolo de prompt para investigar relatos de comportamento de pensamento em LLMs, com foco em reproduzir, medir e relatá-lo de maneira responsável.
Prompts Reprodutíveis para Saídas Analíticas de Alta Qualidade
Prompt que orienta a criar rotinas de prompt engineering para saídas analíticas estáveis e reprodutíveis, com um caso de estudo neutro e artefatos de reprodutibilidade.
Prompt de Exploração de LLMs em PyTorch: Recriar GPT-2, Llama 3 e DeepSeek
Prompt para gerar um guia técnico completo para reproduzir arquiteturas de LLM em PyTorch, incluindo resumo técnico, código de exemplo, comparação de componentes, plano experimental e materiais de referência.
Avaliação de Prefixos de Prompt para Claude: protocolo de replicação com 40 prefixos, 5 categorias e avaliação cega
Prompt que orienta a projetar e executar um estudo controlado para testar a eficácia de prefixos de prompt em LLMs, com replicação entre versões de modelo, avaliação cega e relatório completo.
Prompts Robustos: Transformando Ambiguidade em Tarefas Reprodutíveis (Caso Carro)
Prompt avançado para analisar ambiguidade, elicitar suposições e criar versões de prompts com foco em consistência e reprodutibilidade, usando o case do carro como estudo de caso.
Prompt de avaliação de desempenho de GPT: analisar alegações de 99º percentile e construir um benchmark confiável
Prompt para criar um framework de avaliação de desempenho de LLM, com foco em alegações de 99º percentil e construção de benchmarks reprodutíveis
Prompt de Avaliação de Modelos Grok Imagine 10s para Geração Musical
Prompt para gerar um relatório comparativo entre o modelo atual e o novo Grok Imagine 10s, focalizando a geração musical de 10 segundos com evidência de vídeos de demonstração.
Diagnóstico de variação de estilo em geração de imagens entre dias
Prompt para investigar variações de estilo na geração de imagens entre dias, identificando causas, propondo experimentos reprodutíveis e gerando um relatório claro.
Prompt para Construção de Casos de Teste Realistas para Avaliação de Prompts de LLM
Guia avançado para criar, gerenciar e executar casos de teste realistas para avaliação de prompts de LLMs, com foco em dados de uso real, pipeline de avaliação, templates de prompts e exemplos.
Prompt IA para colaboração em simulação de espaço-tempo discreto 3+1D com IA
Prompt para orientar IA na criação, depuração e documentação de uma simulação de espaço-tempo discreto 3+1D, com foco em IA para código Python, LaTeX e derivação simbólica, incluindo pipeline de reprodutibilidade e questões de design de operadores.