Prompts com a tag: #evaluation
Prompt para Alinhamento de Agentes IA: Diagnóstico, Template e Métricas a partir do caso Spotify
Prompt avançado para diagnosticar falhas de alinhamento em agentes IA autônomos, gerar um template de prompting robusto, exemplos situacionais e métricas de avaliação, com diretrizes de integração para diferentes ferramentas de IA.
Avaliação e Planejamento de Testes para um Protocolo de Stack de Segurança de LLM
Prompt para avaliar de forma crítica e planejar testes de segurança e confiabilidade de um protocolo de LLM prometendo bloquear ataques por prompt e reduzir alucinações.
Realism gone? Guia de prompt para melhorar o realismo em IA gerada
Prompts e diretrizes para diagnosticar e melhorar o realismo de imagens geradas pela IA, com prompts variados, configurações técnicas, rubrica de avaliação e considerações éticas.
Grok 4.2: Análise crítica de veracidade e moderação em IA
Prompt de avaliação crítica para medir veracidade, moderação e transparência de Grok 4.2/x.ai, com um conjunto de cenários de teste, métricas e rubricas.
Prompt de Prompts Estruturados para Entrevistas Técnicas
Prompt que orienta a IA a transformar prompts de screening em saídas JSON estritamente tipadas, avaliando prompts de contratação com base em um framework de sinal (Tooling Depth, Constraint Adherence, Output Clarity, Evidence Quality).
Prompt para Avaliação Robusta de Prompts em Classificação de Documentos entre Modelos de IA
Prompt que orienta a avaliação da robustez de prompts de classificação de documentos entre modelos de IA, permitindo comparar desempenho, identificar sensibilidade a variações de prompt e sugerir prompts mais robustos.
Prompt para Forçar Premissas no Início de Revisões de Decisão
Prompt avançado de engenharia para avaliar estratégias de forçar premissas em prompts de revisão de decisão, incluindo comparação de abordagens, métrica, experimentos e exemplos de prompts.
Verifique se a IA certa: teste seus prompts entre plataformas
Prompt que orienta a verificação cruzada de prompts entre várias plataformas de IA, com comparação de resultados e orientação para escolher a melhor ferramenta para cada uso.
Compressão Lossless de Prompts: Reestruturando prompts longos sem perder intenção
Prompt para avaliar e aplicar uma técnica de compressão de prompts sem perda de informação essencial, com orientações, critérios de avaliação e exemplos.
Prompt de Avaliação Comparativa: Grok Imagine I2V (OLD vs NEW)
Prompt detalhado para comparar dois modelos de vídeo I2V (OLD vs NEW) com o mesmo prompt e mesma imagem, produzindo uma avaliação objetiva com métricas, falhas, melhorias e recomendações de uso.
Prompt de Avaliação de Prompts com Casos de Teste Comunitários
Prompt para orientar IA a criar rubricas de avaliação, casos de teste de comunidade, governança de submissões e incentivos, facilitando a avaliação de prompts com foco em edge cases.
Prompt para diagnóstico de falhas de prompt com o Problem Map (16 modos)
Prompt para diagnosticar falhas de prompts usando o Problem Map (16 modos), orientando debugging, validação e escolha de ferramenta de IA.