Prompts com a tag: #evaluation

4.5
2

Avaliação e Seleção de Modelos Locais Open-Source para Terapia Privada

Prompt para comparar, avaliar e recomendar modelos locais open-source para uso privado em terapia, incluindo métricas, pipelines de RAG, requisitos de hardware e governança de privacidade.

4.5
7

Avaliação de alternativas de upload de imagem e detecção de alterações faciais

Prompt para analisar e comparar métodos de upload de imagem, distinguindo entre técnicas que preservam a imagem original e aquelas que podem alterar o rosto do sujeito, com métricas, plano de testes e diretrizes éticas.

4.5
9

DailyForge para Claude — Transforme ideias vagas em prompts de produção com um único comando

Prompt avançado para Claude que atua como engenheiro de prompts, convertendo ideias vagas em prompts de produção, gerando variações, avaliando-as com feedback acionável e guiando um fluxo de engenharia de prompt multi-etapas.

4.5
17

Prompt para explorar detecção de IA além de previsibilidade

Prompt que orienta a explorar as limitações de detecção baseadas em previsibilidade/perplexidade, projetar experimentos, definir métricas, fornecer código, e discutir aspectos éticos e práticos.

4.0
25

Prompt de Avaliação Multimodal para IA de Companhias Virtuais

Prompt que guia a avaliação multimodal de IA para companhias virtuais, comparando plataformas e gerando planos de testes, métricas e prompts prontos.

4.5
27

Prompt de avaliação de modelo treinado com prompts vazados

Prompt que orienta IA a coletar feedback estruturado de engenheiros de prompts e usuários sobre um modelo treinado com prompts vazados, oferecendo cenários de teste, métricas de avaliação e diretrizes de governança de dados.

4.5
27

Melhores resultados de prompts com repetição e raciocínio

Prompt para explorar repetição de prompts e técnicas de raciocínio para melhorar o desempenho de modelos; inclui design experimental, avaliação e recomendações.

4.5
31

Prompt para Alinhamento de Agentes IA: Diagnóstico, Template e Métricas a partir do caso Spotify

Prompt avançado para diagnosticar falhas de alinhamento em agentes IA autônomos, gerar um template de prompting robusto, exemplos situacionais e métricas de avaliação, com diretrizes de integração para diferentes ferramentas de IA.

4.5
39

Avaliação e Planejamento de Testes para um Protocolo de Stack de Segurança de LLM

Prompt para avaliar de forma crítica e planejar testes de segurança e confiabilidade de um protocolo de LLM prometendo bloquear ataques por prompt e reduzir alucinações.

4.5
36

Realism gone? Guia de prompt para melhorar o realismo em IA gerada

Prompts e diretrizes para diagnosticar e melhorar o realismo de imagens geradas pela IA, com prompts variados, configurações técnicas, rubrica de avaliação e considerações éticas.