Prompts com a tag: evaluation-framework

4.5

21

Agent Marketplace - Validação de Prompts e Cadeias de Agentes

Prompt para gerar um plano de validação e design de um marketplace de agentes com IO padronizado, avaliação, discovery e pricing.

Mercado de Agentes

Ver mais

#agent-marketplace #prompt-engineering #standardized-IO #evaluation-framework #pricing #discovery #integration

4.5

23

Prompt de Análise Crítica do PRISM Persona Paper

Gera uma análise crítica aprofundada do PRISM Persona Paper, propondo um framework de avaliação independente e 3 experimentos para melhorar prompts de persona e alinhamento.

PRISM Persona Prompt Evaluation

Ver mais

#prompt-engineering #prompt-critique #AI-alignment #persona-prompts #evaluation-framework #self-referential-pipelines #NLP-research #robustness

4.5

47

Prompt para Avaliar e Projetar Gestão de Contexto em IA (Claude, Notion, Kuse, MyMind)

Prompt que elabora um framework de avaliação de gestão de contexto em IA, compara abordagens existentes, propõe 3 híbridos, define um plano de MVP e um formato de avaliação, além de considerações éticas e indicação de ferramenta ideal.

Gestão de Contexto em IA

Ver mais

#context-management #LLM #prompt-engineering #evaluation-framework #system-prompts #document-context #human-curation

4.5

46

Prompt como Sistema Vivo: Competição e Benchmarking de Prompts

Prompt criado para estruturar uma competição/benchmark que trate prompts como sistemas vivos, definindo regras, métricas e fluxos de avaliação para melhoria contínua em tempo real.

Prompts como Sistemas Vivos – Competição e Benchmark

Ver mais

#prompt-engineering #evaluation-framework #benchmark #live-systems #competition #ai-testing

4.5

55

Prompt para avaliação de geração de vídeo com moderação, qualidade e testes seguros

Prompt abrangente para avaliar moderração de conteúdo e qualidade em geração de vídeo, com framework de métricas, prompts de teste seguros e recomendações de melhoria.

Avaliação de Geração de Vídeo e Moderação de Conteúdo

Ver mais

#video-generation #moderation #ethics #prompt-engineering #evaluation-framework

4.0

52

ModelMatch Prompt: Avaliação de recomendação de modelos open source por caso de uso

Prompt de avaliação para ModelMatch que gera prompts de entrada, critérios de avaliação por domínio, plano de validação e recomendações de ferramenta de IA, além de métricas de usabilidade e mitigação de riscos.

ModelMatch: Recomendação de Modelos Open Source por Caso de Uso

Ver mais

#open-source #model-recommendation #evaluation-framework #rubrics #domain-specific #prompt-design

Prompts com a tag: #evaluation-framework

Agent Marketplace - Validação de Prompts e Cadeias de Agentes

Prompt de Análise Crítica do PRISM Persona Paper

Prompt para Avaliar e Projetar Gestão de Contexto em IA (Claude, Notion, Kuse, MyMind)

Prompt como Sistema Vivo: Competição e Benchmarking de Prompts

Prompt para avaliação de geração de vídeo com moderação, qualidade e testes seguros

ModelMatch Prompt: Avaliação de recomendação de modelos open source por caso de uso