Prompts com a tag: #robustness
Prompt de teste de robustez para agente de pesquisa com dados sintéticos em healthcare
Prompt estruturado para testar a robustez de um agente de pesquisa com dados sintéticos em healthcare, cobrindo detecção de falhas, vieses e alucinações, e sugerindo mitigação.
Prompt Robustness Evaluator: Avaliação de Clarity, Estrutura, Especificidade e Robustez
Prompt para avaliar prompts com foco em robustez, fornecendo métricas de desempenho por dimensão e recomendações de melhoria.
Prompt para avaliação e robustez de prompts em LLMs
Prompt que orienta a criação de um protocolo de avaliação de robustez de prompts em LLMs, incluindo testes adversários, métricas, templates para várias ferramentas e diretrizes de design.
Prompt: Robustez a hábitos de digitação humana e contagem de tokens
Prompt projetado para ensinar IA a lidar com variações de digitação humana e manter a intenção, além de estimar contagens de tokens entre modelos.
Prompt de design de habilidade de extração de dados resistente a contextos
Prompt para criar e testar uma habilidade de extração de dados resiliente a mudanças de contexto entre diferentes agentes/prompts, com ênfase em evitar mapeamentos ambíguos e falhas de substituição de termos.
Prompt de Análise Crítica do PRISM Persona Paper
Gera uma análise crítica aprofundada do PRISM Persona Paper, propondo um framework de avaliação independente e 3 experimentos para melhorar prompts de persona e alinhamento.
Robust Prompting: Diagnóstico e Mitigação de Throttling e Saídas Inesperadas (Grok)
Prompt para diagnosticar e mitigar throttling de extensões, repetição de prompts e saídas bizarras em modelos de linguagem, com geração de prompts de teste e métricas de validação.
Método 'Failure First' para agentes de codificação: Prompts defensivos para código robusto
Prompt que ensina a aplicar Break the Spec e Defensive Prompting para gerar código mais robusto, incluindo cenários de falha, salvaguardas e padrões de teste.
Prompt de Destruição Criativa: o que destruiria isto para testar robustez
Prompt que transforma a avaliação de qualidade em uma busca por falhas potenciais, gerando falhas, impactos e ações de mitigação para melhorar a robustez de código, negócios, escrita e design.
Prompt de Verificação Auto via Três Caminhos (Self-Consistency)
Instrui o modelo a construir três caminhos de raciocínio Independentes, comparar resultados, identificar falhas e fornecer uma solução final verificada, com foco em detecção de erros e robustez por meio de Self-Consistency.
Prompt para avaliação de robustez de IA: testes éticos de alucinações de ação e cálculo com Sovereign Engine
Gera um plano de avaliação de robustez de IA focado em identificar e mitigar alucinações de ação e cálculo, com enfoque em segurança, governança e avaliação ética, sem revelar detalhes proprietários da arquitetura.
Amplificador de Casos Limite para LLMs: Identificação de falhas e reforço de robustez
Prompt estruturado para testar e reforçar a robustez de modelos de linguagem, enfatizando a identificação de edge cases, explicação de falhas comuns e apresentação de soluções resilientes.