Prompts com a tag: #robustness

4.0
8

Prompt de teste de robustez para agente de pesquisa com dados sintéticos em healthcare

Prompt estruturado para testar a robustez de um agente de pesquisa com dados sintéticos em healthcare, cobrindo detecção de falhas, vieses e alucinações, e sugerindo mitigação.

4.5
9

Prompt para avaliação e robustez de prompts em LLMs

Prompt que orienta a criação de um protocolo de avaliação de robustez de prompts em LLMs, incluindo testes adversários, métricas, templates para várias ferramentas e diretrizes de design.

4.5
9

Prompt: Robustez a hábitos de digitação humana e contagem de tokens

Prompt projetado para ensinar IA a lidar com variações de digitação humana e manter a intenção, além de estimar contagens de tokens entre modelos.

4.5
8

Prompt de design de habilidade de extração de dados resistente a contextos

Prompt para criar e testar uma habilidade de extração de dados resiliente a mudanças de contexto entre diferentes agentes/prompts, com ênfase em evitar mapeamentos ambíguos e falhas de substituição de termos.

4.5
12

Prompt de Análise Crítica do PRISM Persona Paper

Gera uma análise crítica aprofundada do PRISM Persona Paper, propondo um framework de avaliação independente e 3 experimentos para melhorar prompts de persona e alinhamento.

4.5
25

Robust Prompting: Diagnóstico e Mitigação de Throttling e Saídas Inesperadas (Grok)

Prompt para diagnosticar e mitigar throttling de extensões, repetição de prompts e saídas bizarras em modelos de linguagem, com geração de prompts de teste e métricas de validação.

4.5
29

Prompt de Verificação Auto via Três Caminhos (Self-Consistency)

Instrui o modelo a construir três caminhos de raciocínio Independentes, comparar resultados, identificar falhas e fornecer uma solução final verificada, com foco em detecção de erros e robustez por meio de Self-Consistency.

4.5
29

Prompt para avaliação de robustez de IA: testes éticos de alucinações de ação e cálculo com Sovereign Engine

Gera um plano de avaliação de robustez de IA focado em identificar e mitigar alucinações de ação e cálculo, com enfoque em segurança, governança e avaliação ética, sem revelar detalhes proprietários da arquitetura.

4.5
26

Amplificador de Casos Limite para LLMs: Identificação de falhas e reforço de robustez

Prompt estruturado para testar e reforçar a robustez de modelos de linguagem, enfatizando a identificação de edge cases, explicação de falhas comuns e apresentação de soluções resilientes.