Prompts com a tag: #AI-safety
Prompt de análise e transformação de feedback sobre IA em diálogo construtivo
Esse prompt orienta a transformar uma mensagem de feedback sobre IA em um conjunto de saídas úteis: resumo, análise de tom, versões diplomáticas, roteiro de diálogo, variantes para públicos distintos, além de uma avaliação de ferramenta de IA e metadados de publicação.
Grok Imagine Jailbreaks: Avaliação Ética e Segurança de Técnicas de Jailbreak de LLM
Prompt para analisar técnicas de jailbreak de LLMs sob uma perspectiva de segurança, ética e mitigação, gerando um relatório não acionável e orientado a melhoria de defesa.
Prompt Judge Overlay v4.0 — Avaliação Estruturada de Prompts
Prompt meta para avaliar, diagnosticar e aperfeiçoar prompts com métricas numéricas e prescrições concretas, pronto para uso em ferramentas de IA.
Desafio de Segurança de Prompt: Avaliação de Guardrails para Modelos de Linguagem
Prompt avançado para criar, testar e documentar guardrails de IA de forma ética, incluindo metodologia, exemplos seguros e diretrizes de implementação.
XAI como gerador de prompts: explorando capacidades com segurança
Este prompt orienta a criar prompts detalhados para explorar as capacidades da XAI de forma responsável, com foco em explicabilidade, segurança e ética. Fornece estrutura, critérios de avaliação e exemplos de prompts seguros.
Prompt para testar a segurança de LLMs em cenários apocalípticos com avaliações de risco
Prompt de avaliação de segurança de LLMs em cenários de sobrevivência/apocalipse, orientando o modelo a recusar conteúdos perigosos e fornecer alternativas seguras, com rubric de risco e auto-falha.
Prompt de Análise de Privacidade e Verificação de Alegações sobre Grok AI
Prompts para investigar alegações de privacidade em IA, com foco em diagnóstico técnico, verificação de dados, e orientações de mitigação para Grok AI e sistemas similares.
Assistência ética para familiares de pessoa vulnerável conectada a IA
Prompt para guiar IA na assistência a familiares lidando com uma pessoa vulnerável que acredita estar conversando com uma IA real, oferecendo avaliação de risco, plano de conversa, proteções e encaminhamentos profissionais.
Prompt de Análise da Estabilidade do Primeiro Turno
Um prompt de meta-prompt que ensina a projetar testes de estabilidade do primeiro turn em chats de IA, incluindo cenário, parâmetros, metodologia e saída estruturada em JSON.
Prompt para avaliar e mitigar acoplamento de domínios em raciocínio guiado por prompts
Prompt que orienta IA a mapear, medir e mitigar falhas de raciocínio causadas por acoplamento de domínios em prompts de alto risco, com foco na avaliação de coerência versus correção e na proposta de salvaguardas.
Avaliação de ofertas de software para estudantes e prompts de IA seguros
Prompt para analisar uma oferta de software para estudantes, identificar legitimidade, riscos, e gerar um prompt de IA para detecção de golpes, além de sugerir alternativas seguras.
Design de prompts de sistema para IA: engenharia de prompts seguros e robustos
Prompt que orienta a criação de prompts úteis, seguros e avaliáveis para sistemas de IA, com foco em prompts de sistema, qualidade e governança.