Prompts com a tag: #evaluation-metrics
Prompt para Promover Comportamento Estável em Chats de IA a Longo Prazo
Prompt que orienta uma IA a gerar frameworks, padrões e templates para manter consistência em longas conversas, com planos de avaliação e cenários de teste.
Diferenças entre prompts criados por humanos e prompts gerados por IA
Prompt que orienta a IA a comparar prompts criados por humanos com prompts gerados por IA, fornecendo exemplos, métricas, melhores práticas e um plano de avaliação para diversas ferramentas de IA.
Prompt para detectar e mitigar o 'polite lying' em IA: como fazer o modelo falar a verdade sem perder utilidade
Prompt avançado de engenharia para testar e reduzir o comportamento de 'polite lying' em modelos de linguagem, fornecendo prompts, critérios de avaliação e salvaguardas para obter saídas mais transparentes.
Prompting vs Humanizers: Qual importa mais para a saída natural?
Prompt para comparar a importância de prompt original versus humanizers na naturalidade da saída, incluindo protocolo, métricas, exemplos e pipeline de avaliação.
Diagnóstico de Prompt Drift: Guia Prático para Manter Prompts Consistentes ao Longo de Projetos de IA
Prompt para auditar e corrigir drift de prompts em projetos de IA ao longo de várias semanas, com diagnóstico, ações corretivas, prompts revisados e métricas de monitoramento.
Steering de LLMs com Mistura Dinâmica de Prompts (Prompt Mixer UI)
Prompt expansivo para projetar e avaliar um motor de mistura dinâmica de prompts, com foco em UI de 2D, âncoras de prompts e cálculo do prompt final para LLMs.
Protocolo de Testes Comparativos de Modelos de Linguagem com Avaliação de Moderação
Prompt para gerar um protocolo detalhado de avaliação de modelos de linguagem, com foco em desempenho, moderação e ética, incluindo templates de relatório e métricas.
Image to Video: Corrigir Inconsistência de Rosto
Prompt completo para diagnosticar, medir e corrigir inconsistências de identidade facial em pipelines de geração de vídeo a partir de imagens, incluindo métricas, protocolo experimental, código de referência e prompts de teste.
Avaliação Multimodal de Realismo entre T2I, I2V e T2V
Prompt para avaliar e comparar o realismo entre T2I, I2V e T2V, com prompts de teste, métricas e considerações éticas.
Explorando respostas inesperadas: diagnóstico de padrões de contexto em modos de conversa 'buddy' do GPT
Prompt que orienta uma IA a analisar e testar o comportamento de padrões de contexto no modo 'buddy', propondo prompts de teste, métricas, diretrizes de design e considerações de segurança.
Análise, melhoria e promoção de meta-prompts para IA com avaliação de ferramentas
Prompt para gerar, avaliar e refinar meta-prompts com variações, cenários, métricas, recomendação de ferramenta de IA e critérios de qualidade.
Prompt de diagnóstico e melhoria de áudio em IA de geração de vídeo com sincronização labial
Prompt completo para diagnosticar, planejar experimentos e orientar melhorias de áudio em sistemas de geração de vídeo por IA, com foco em sincronização labial e qualidade sonora.