Prompts com a tag: #guardrails

4.5
6

Prompt de Tarefa para Red-Teaming com RedThread: teste repetível de prompt-injection

Prompt que orienta IA a desenhar um protocolo de teste repetível de prompt-injection inspirado no RedThread, incluindo geração de ataques teóricos, avaliação com rubricas, criação de guardrails, replays de casos, e construção de fixtures seguros, evitando conteúdos de jailbreak reais.

4.5
6

Prompt determinístico para debugging inspirado em Bugscalpel

Prompt para guiar IA a produzir correções de código com guardrails determinísticos, avaliando dependências entre arquivos e incorporando cláusulas de guarda diretamente no código de saída.

4.5
9

Guardrail Prompt 4-Etapas: construa prompts seguros para qualquer tópico

Prompt que orienta a construção de guardrails para IA em 4 etapas, com ênfase em saúde mental e uso de busca na Web para fundamentação, aplicável a qualquer tópico.

4.5
11

Prompt para Avaliação Ética de Guardrails em Modelos de Linguagem (LLMs)

Prompts e diretrizes para avaliar de forma ética a capacidade de um modelo de linguagem em reconhecer e rejeitar solicitações de alto risco, promovendo segurança e governança em IA.

4.5
16

Prompt prático para shipping com IA baseado no Level 5

Prompt completo para gerar um roteiro prático de shipping de IA em produção, com guardrails, eval harness, pipelines de contexto e um plano de demonstração estilo Level 5.

4.5
20

Prompt de Auditoria de Guard Rails para Detecção de Bypass de Filtros em IA

Prompt que orienta uma IA a analisar relatos de tentativas de contornar filtros, identificar técnicas de bypass, propor salvaguardas, criar um protocolo de teste ético e sugerir prompts de teste seguros para auditoria de guardrails.

4.5
21

Engenharia de prompt resiliente para agentes de IA com dados do mundo real

Prompt orientado a projetar, testar e manter prompts de IA resilientes ao lidar com dados reais em produção. Recomenda-se usar o ChatGPT como ferramenta principal devido à flexibilidade de prompts e capacidades de integração com dados estruturados; Claude e Gemini também podem funcionar bem, mas ChatGPT oferece maior facilidade de construção e validação em larga escala.

4.5
18

Prompt para Explorar Modelos de IA Alternativos e Comparar Comportamentos

Um prompt estruturado para comparar comportamentos entre IA(s) alternativas e identificar guardrails, estilo de resposta e limitações, com prompts de avaliação que revelam variações entre modelos.

4.5
17

Prompt para avaliar guardrails terapêuticos e valores corporativos em IA

Prompt que analisa guardrails terapêuticos, compara modelos da Claude e propõe um framework de avaliação para bem-estar, dependência e responsabilidade corporativa em IA.