Prompts com a tag: model-evaluation

4.0

7

Prompt de teste de robustez para agente de pesquisa com dados sintéticos em healthcare

Prompt estruturado para testar a robustez de um agente de pesquisa com dados sintéticos em healthcare, cobrindo detecção de falhas, vieses e alucinações, e sugerindo mitigação.

Robustez de agentes de pesquisa com dados sintéticos

Ver mais

#prompt-testing #robustness #adversarial-prompting #healthcare #synthetic-data #data-ethics #model-evaluation

4.5

3

Thinking Self Hype: Avaliação de Interações Humorísticas e Extensões de Pensamento (Claude/Sonnet 4.5)

Prompt para testar capacidades de pensamento auto-reflexivo ('Thinking Self') e interações humorísticas, incluindo uma simulação de pep talk antes de uma piada e comparação entre modelos, com diretrizes de replicabilidade e métricas de avaliação.

Thinking Self Hype: Avaliação de Interações Humorísticas e Pensamento

Ver mais

#prompt-engineering #model-evaluation #thinking-self #humor #scenario-testing #sonnet-4-5 #model-comparison

4.5

4

Prompt de Análise de Benchmark de Modelos de IA (Gemini 3.5 Flash vs Variantes) para Decisões de Produção

Prompt que orienta a IA a extrair insights acionáveis de um conjunto de benchmarks entre Gemini 3.5 Flash e variantes, com foco em desempenho vs custo, limitações da avaliação e recomendações para produção.

Avaliação comparativa de modelos de IA: Gemini 3.5 Flash e variantes

Ver mais

#benchmarking #model-evaluation #vision #emotion-detection #cost-analysis #produção #IA-pipeline

4.5

10

Prompt para avaliar velocidade de raciocínio e qualidade de respostas de IA a partir de relatos de usuário

Prompt que orienta a IA a analisar um relato de usuário sobre respostas rápidas e de baixa qualidade, gerando um framework de diagnóstico, prompts de teste, métricas e a escolha da ferramenta mais adequada.

Avaliação de velocidade de raciocínio e qualidade de respostas em LLMs

Ver mais

#prompt-design #model-evaluation #LLM-diagnostics #reasoning #prompt-testing

4.5

17

Prompt de avaliação e design de prompts para comparação de modelos de IA

Prompt para gerar um prompt de avaliação de IA com foco em testes entre modelos, incluindo critérios, metodologia de avaliação, templates de relatório e diretrizes de adaptação a domínio específico.

Avaliação de modelos de IA e design de prompts para testes comparativos

Ver mais

#prompt-engineering #AI-testing #model-evaluation #multi-model-comparison #research-methods #algorithmic-research #prompt-design

4.5

28

Prompt para avaliação de modelos com Orion (local-first)

Prompt estruturado para demonstrar e orientar o uso de Orion na avaliação de modelos, incluindo escolha da ferramenta de IA, construção de um prompt de uso, e dicas de organização de dados e prompts com foco em ambiente local.

Avaliação de modelos com Orion (local-first)

Ver mais

#prompt-engineering #model-evaluation #local-first #Orion #batch-testing #CSV #diffs #versioning #prompt-locking

4.5

28

Prompt para Avaliação de Modelos de Geração de Vídeo (A/B Testing)

Prompt para conduzir um teste A/B entre modelos de geração de vídeo, incluindo prompts padronizados, métricas de avaliação e relatório de resultados.

Avaliação de Modelos de Geração de Vídeo (A/B Testing)

Ver mais

#prompt-design #prompt-engineering #video-generation #A/B testing #model-evaluation #multimodal

4.5

29

Prompt de avaliação de modelos text-to-image: comparar imagine-x-1 vs imagine_x_1

Prompt detalhado para testar, comparar e entender diferenças entre dois modelos text-to-image, focando em qualidade de pele, variação de rostos e naming de versões.

Avaliação comparativa de modelos text-to-image e naming de variantes

Ver mais

#text-to-image #model-evaluation #prompt-engineering #image-artifacts #model-naming #SDXL

4.5

28

Prompt de Avaliação de Modelos de IA: Veracidade, Referências e Governança

Prompt para conduzir uma avaliação crítica de modelos de IA com foco em leitura de referências, veracidade, governança e conformidade, gerando métricas, perguntas de auditoria e práticas recomendadas.

Avaliação de Limites e Referências de Modelos de IA

Ver mais

#prompt-engineering #model-evaluation #AI-governance #fact-checking #sources-and-references #risk-management

4.5

30

Prompt de Avaliação de UX e Estilo de Linguagem para Grok vs ChatGPT

Avaliação de UX de IA e Estilo de Linguagem

Ver mais

#prompt-engineering #UX #linguagem #AAVE #grok #model-evaluation

4.5

32

Prompt de Avaliação Comparativa: Mistral 3 vs chatGPT 5 em Apoio Terapêutico/Desenvolvimento Pessoal

Este prompt guia uma avaliação comparativa entre Mistral 3 e chatGPT 5 para uso em apoio terapêutico/desenvolvimento pessoal, incluindo critérios de avaliação, prompts de teste, plano de avaliação e uma recomendação final.

Avaliação de IA para Apoio Terapêutico/Desenvolvimento Pessoal

Ver mais

#AI-prompt-design #model-evaluation #therapeutic-ai #Mistral-3 #GPT-5 #personal-development

4.5

37

Avaliação do Tamanho Ótimo de Prompts e Carga Cognitiva

Prompt de avaliação para investigar o efeito do tamanho de prompts na qualidade e no custo computacional, com protocolo replicável e saída estruturada em JSON.

Tamanho de Prompts e Carga Cognitiva

Ver mais

#prompt-design #model-evaluation #prompt-length #cognitive-load #experimental-design #IA-testing

Prompts com a tag: #model-evaluation