Prompts com a tag: #evaluation

4.5
38

Grok 4.2: Análise crítica de veracidade e moderação em IA

Prompt de avaliação crítica para medir veracidade, moderação e transparência de Grok 4.2/x.ai, com um conjunto de cenários de teste, métricas e rubricas.

4.5
33

Prompt de Prompts Estruturados para Entrevistas Técnicas

Prompt que orienta a IA a transformar prompts de screening em saídas JSON estritamente tipadas, avaliando prompts de contratação com base em um framework de sinal (Tooling Depth, Constraint Adherence, Output Clarity, Evidence Quality).

4.5
47

Prompt para Avaliação Robusta de Prompts em Classificação de Documentos entre Modelos de IA

Prompt que orienta a avaliação da robustez de prompts de classificação de documentos entre modelos de IA, permitindo comparar desempenho, identificar sensibilidade a variações de prompt e sugerir prompts mais robustos.

4.5
37

Prompt para Forçar Premissas no Início de Revisões de Decisão

Prompt avançado de engenharia para avaliar estratégias de forçar premissas em prompts de revisão de decisão, incluindo comparação de abordagens, métrica, experimentos e exemplos de prompts.

4.5
39

Verifique se a IA certa: teste seus prompts entre plataformas

Prompt que orienta a verificação cruzada de prompts entre várias plataformas de IA, com comparação de resultados e orientação para escolher a melhor ferramenta para cada uso.

4.5
39

Compressão Lossless de Prompts: Reestruturando prompts longos sem perder intenção

Prompt para avaliar e aplicar uma técnica de compressão de prompts sem perda de informação essencial, com orientações, critérios de avaliação e exemplos.

4.5
46

Prompt de Avaliação Comparativa: Grok Imagine I2V (OLD vs NEW)

Prompt detalhado para comparar dois modelos de vídeo I2V (OLD vs NEW) com o mesmo prompt e mesma imagem, produzindo uma avaliação objetiva com métricas, falhas, melhorias e recomendações de uso.

4.5
42

Prompt de Avaliação de Prompts com Casos de Teste Comunitários

Prompt para orientar IA a criar rubricas de avaliação, casos de teste de comunidade, governança de submissões e incentivos, facilitando a avaliação de prompts com foco em edge cases.

4.5
51

Explorando Qwen 2511 NSFW AIO com ComfyUI em GPUs NVIDIA

Prompt técnico para avaliar configuração, desempenho, moderação e integração de Qwen 2511 NSFW AIO com ComfyUI em hardware NVIDIA, priorizando desempenho estável, manejo de memória e conformidade.

4.5
35

Prompt de Avaliação de Preservação de Estilo para Grok Imagine 10s

Prompt avançado para avaliar, medir e melhorar a preservação de estilo em modelos de geração de imagem, especialmente diante de feedback de hiperatividade e falha na preservação de estilo.