Prompts com a tag: #evaluation-framework
Agent Marketplace - Validação de Prompts e Cadeias de Agentes
Prompt para gerar um plano de validação e design de um marketplace de agentes com IO padronizado, avaliação, discovery e pricing.
Prompt de Análise Crítica do PRISM Persona Paper
Gera uma análise crítica aprofundada do PRISM Persona Paper, propondo um framework de avaliação independente e 3 experimentos para melhorar prompts de persona e alinhamento.
Prompt para Avaliar e Projetar Gestão de Contexto em IA (Claude, Notion, Kuse, MyMind)
Prompt que elabora um framework de avaliação de gestão de contexto em IA, compara abordagens existentes, propõe 3 híbridos, define um plano de MVP e um formato de avaliação, além de considerações éticas e indicação de ferramenta ideal.
Prompt como Sistema Vivo: Competição e Benchmarking de Prompts
Prompt criado para estruturar uma competição/benchmark que trate prompts como sistemas vivos, definindo regras, métricas e fluxos de avaliação para melhoria contínua em tempo real.
Prompt para avaliação de geração de vídeo com moderação, qualidade e testes seguros
Prompt abrangente para avaliar moderração de conteúdo e qualidade em geração de vídeo, com framework de métricas, prompts de teste seguros e recomendações de melhoria.
ModelMatch Prompt: Avaliação de recomendação de modelos open source por caso de uso
Prompt de avaliação para ModelMatch que gera prompts de entrada, critérios de avaliação por domínio, plano de validação e recomendações de ferramenta de IA, além de métricas de usabilidade e mitigação de riscos.