Prompts com a tag: #evaluation
Avaliação e Seleção de Modelos Locais Open-Source para Terapia Privada
Prompt para comparar, avaliar e recomendar modelos locais open-source para uso privado em terapia, incluindo métricas, pipelines de RAG, requisitos de hardware e governança de privacidade.
Avaliação de alternativas de upload de imagem e detecção de alterações faciais
Prompt para analisar e comparar métodos de upload de imagem, distinguindo entre técnicas que preservam a imagem original e aquelas que podem alterar o rosto do sujeito, com métricas, plano de testes e diretrizes éticas.
DailyForge para Claude — Transforme ideias vagas em prompts de produção com um único comando
Prompt avançado para Claude que atua como engenheiro de prompts, convertendo ideias vagas em prompts de produção, gerando variações, avaliando-as com feedback acionável e guiando um fluxo de engenharia de prompt multi-etapas.
Estamos assistindo à substituição de 'prompt engineering' por 'environment engineering' em tempo real?
Prompt que investiga a substituição da engenharia de prompts pela engenharia de ambiente, oferecendo estrutura, métricas, exemplos e guias de implementação.
Prompt para explorar detecção de IA além de previsibilidade
Prompt que orienta a explorar as limitações de detecção baseadas em previsibilidade/perplexidade, projetar experimentos, definir métricas, fornecer código, e discutir aspectos éticos e práticos.
Prompt para diagnosticar e otimizar sistemas RAG com foco em chunking e acurácia composta
Prompt para diagnosticar gargalos em sistemas RAG, entender o efeito cumulativo de cada camada e desenhar planos de experimento com foco em chunking, métricas e código de apoio.
Prompt de Avaliação Multimodal para IA de Companhias Virtuais
Prompt que guia a avaliação multimodal de IA para companhias virtuais, comparando plataformas e gerando planos de testes, métricas e prompts prontos.
Prompt de avaliação de modelo treinado com prompts vazados
Prompt que orienta IA a coletar feedback estruturado de engenheiros de prompts e usuários sobre um modelo treinado com prompts vazados, oferecendo cenários de teste, métricas de avaliação e diretrizes de governança de dados.
Melhores resultados de prompts com repetição e raciocínio
Prompt para explorar repetição de prompts e técnicas de raciocínio para melhorar o desempenho de modelos; inclui design experimental, avaliação e recomendações.
Prompt para Alinhamento de Agentes IA: Diagnóstico, Template e Métricas a partir do caso Spotify
Prompt avançado para diagnosticar falhas de alinhamento em agentes IA autônomos, gerar um template de prompting robusto, exemplos situacionais e métricas de avaliação, com diretrizes de integração para diferentes ferramentas de IA.
Avaliação e Planejamento de Testes para um Protocolo de Stack de Segurança de LLM
Prompt para avaliar de forma crítica e planejar testes de segurança e confiabilidade de um protocolo de LLM prometendo bloquear ataques por prompt e reduzir alucinações.
Realism gone? Guia de prompt para melhorar o realismo em IA gerada
Prompts e diretrizes para diagnosticar e melhorar o realismo de imagens geradas pela IA, com prompts variados, configurações técnicas, rubrica de avaliação e considerações éticas.