Prompts com a tag: #evaluation
Grok 4.2: Análise crítica de veracidade e moderação em IA
Prompt de avaliação crítica para medir veracidade, moderação e transparência de Grok 4.2/x.ai, com um conjunto de cenários de teste, métricas e rubricas.
Prompt de Prompts Estruturados para Entrevistas Técnicas
Prompt que orienta a IA a transformar prompts de screening em saídas JSON estritamente tipadas, avaliando prompts de contratação com base em um framework de sinal (Tooling Depth, Constraint Adherence, Output Clarity, Evidence Quality).
Prompt para Avaliação Robusta de Prompts em Classificação de Documentos entre Modelos de IA
Prompt que orienta a avaliação da robustez de prompts de classificação de documentos entre modelos de IA, permitindo comparar desempenho, identificar sensibilidade a variações de prompt e sugerir prompts mais robustos.
Prompt para Forçar Premissas no Início de Revisões de Decisão
Prompt avançado de engenharia para avaliar estratégias de forçar premissas em prompts de revisão de decisão, incluindo comparação de abordagens, métrica, experimentos e exemplos de prompts.
Verifique se a IA certa: teste seus prompts entre plataformas
Prompt que orienta a verificação cruzada de prompts entre várias plataformas de IA, com comparação de resultados e orientação para escolher a melhor ferramenta para cada uso.
Compressão Lossless de Prompts: Reestruturando prompts longos sem perder intenção
Prompt para avaliar e aplicar uma técnica de compressão de prompts sem perda de informação essencial, com orientações, critérios de avaliação e exemplos.
Prompt de Avaliação Comparativa: Grok Imagine I2V (OLD vs NEW)
Prompt detalhado para comparar dois modelos de vídeo I2V (OLD vs NEW) com o mesmo prompt e mesma imagem, produzindo uma avaliação objetiva com métricas, falhas, melhorias e recomendações de uso.
Prompt de Avaliação de Prompts com Casos de Teste Comunitários
Prompt para orientar IA a criar rubricas de avaliação, casos de teste de comunidade, governança de submissões e incentivos, facilitando a avaliação de prompts com foco em edge cases.
Prompt para diagnóstico de falhas de prompt com o Problem Map (16 modos)
Prompt para diagnosticar falhas de prompts usando o Problem Map (16 modos), orientando debugging, validação e escolha de ferramenta de IA.
Explorando Qwen 2511 NSFW AIO com ComfyUI em GPUs NVIDIA
Prompt técnico para avaliar configuração, desempenho, moderação e integração de Qwen 2511 NSFW AIO com ComfyUI em hardware NVIDIA, priorizando desempenho estável, manejo de memória e conformidade.
Prompt de avaliação de censura em Grok e comparação com concorrentes
Prompt avançado para analisar políticas de censura em Grok, comparar com concorrentes e gerar testes, melhorias e diretrizes éticas para uso responsável.
Prompt de Avaliação de Preservação de Estilo para Grok Imagine 10s
Prompt avançado para avaliar, medir e melhorar a preservação de estilo em modelos de geração de imagem, especialmente diante de feedback de hiperatividade e falha na preservação de estilo.