Prompts com a tag: #evaluation

4.5
4

Prompt para Alinhamento de Agentes IA: Diagnóstico, Template e Métricas a partir do caso Spotify

Prompt avançado para diagnosticar falhas de alinhamento em agentes IA autônomos, gerar um template de prompting robusto, exemplos situacionais e métricas de avaliação, com diretrizes de integração para diferentes ferramentas de IA.

4.5
3

Avaliação e Planejamento de Testes para um Protocolo de Stack de Segurança de LLM

Prompt para avaliar de forma crítica e planejar testes de segurança e confiabilidade de um protocolo de LLM prometendo bloquear ataques por prompt e reduzir alucinações.

4.5
6

Realism gone? Guia de prompt para melhorar o realismo em IA gerada

Prompts e diretrizes para diagnosticar e melhorar o realismo de imagens geradas pela IA, com prompts variados, configurações técnicas, rubrica de avaliação e considerações éticas.

4.5
6

Grok 4.2: Análise crítica de veracidade e moderação em IA

Prompt de avaliação crítica para medir veracidade, moderação e transparência de Grok 4.2/x.ai, com um conjunto de cenários de teste, métricas e rubricas.

4.5
8

Prompt de Prompts Estruturados para Entrevistas Técnicas

Prompt que orienta a IA a transformar prompts de screening em saídas JSON estritamente tipadas, avaliando prompts de contratação com base em um framework de sinal (Tooling Depth, Constraint Adherence, Output Clarity, Evidence Quality).

4.5
11

Prompt para Avaliação Robusta de Prompts em Classificação de Documentos entre Modelos de IA

Prompt que orienta a avaliação da robustez de prompts de classificação de documentos entre modelos de IA, permitindo comparar desempenho, identificar sensibilidade a variações de prompt e sugerir prompts mais robustos.

4.5
12

Prompt para Forçar Premissas no Início de Revisões de Decisão

Prompt avançado de engenharia para avaliar estratégias de forçar premissas em prompts de revisão de decisão, incluindo comparação de abordagens, métrica, experimentos e exemplos de prompts.

4.5
10

Verifique se a IA certa: teste seus prompts entre plataformas

Prompt que orienta a verificação cruzada de prompts entre várias plataformas de IA, com comparação de resultados e orientação para escolher a melhor ferramenta para cada uso.

4.5
12

Compressão Lossless de Prompts: Reestruturando prompts longos sem perder intenção

Prompt para avaliar e aplicar uma técnica de compressão de prompts sem perda de informação essencial, com orientações, critérios de avaliação e exemplos.

4.5
11

Prompt de Avaliação Comparativa: Grok Imagine I2V (OLD vs NEW)

Prompt detalhado para comparar dois modelos de vídeo I2V (OLD vs NEW) com o mesmo prompt e mesma imagem, produzindo uma avaliação objetiva com métricas, falhas, melhorias e recomendações de uso.

4.5
19

Prompt de Avaliação de Prompts com Casos de Teste Comunitários

Prompt para orientar IA a criar rubricas de avaliação, casos de teste de comunidade, governança de submissões e incentivos, facilitando a avaliação de prompts com foco em edge cases.