Prompts com a tag: #risk-assessment
Teste de Moderação de Conteúdo com Distratores e Conteúdo Sensível
Prompt para avaliação de falhas de moderação e geração de diretrizes de melhoria em cenários com conteúdo sensível e distratores.
Vanguard v2.2: Análise Segura de Protocolo de Alta Agência com Triggers de Reset
Prompt para IA realizar análise crítica, de governança e segurança sobre o Vanguard Protocol v2.2, explorando riscos, controles e cenários de teste sem facilitar comportamentos prejudiciais.
Detecção de táticas de exploração em comunidades online e respostas de moderação
Prompt de moderação para detectar táticas de exploração em propostas de entrada na comunidade e gerar respostas, políticas e triagem para melhorar a segurança e a integridade do espaço.
Prompt de Auditoria de Robustez de Prompts e Defesa contra Jailbreak
Prompt para identificar vulnerabilidades de prompts, defender contra jailbreak e orientar a construção de prompts seguros.
Grok Down Ultimate Moderation — Prompt de Design para Moderação de Conteúdo
Prompt que orienta uma IA a projetar políticas de moderação, avaliar a melhor ferramenta de IA, e retornar uma estrutura JSON com metadados de moderação, incluindo tool, rating, dificuldade, destaque, tags e tópico.
Prompt de moderação recorrente de prompts de geração de imagem
Prompt orientado a moderar prompts de geração de imagem, identificando riscos, sugerindo ajustes seguros e alternativas criativas, útil para ferramentas de IA de moderação.
Prompt para Transformar Checklists em Pensamento Profundo com Avaliação de Riscos
Prompt que orienta a IA a ir além de checklists, fornecendo Análise, Riscos, Recomendações, Contra-argumentos e testes de hipóteses, com linguagem de enforcement e assunções explícitas.
Análise Estrutural de Prompts para Ética e Segurança em IA
Prompt que orienta uma IA a estudar de forma ética como a formulação de prompts pode acionar salvaguardas e como aplicar uma análise estrutural para discutir métodos, riscos e boas práticas, sem instruções para violar políticas.
Defesa contra Indirect Prompt Injection: Análise, Mitigações e Prompts Defensivos
Este prompt orienta a IA a identificar, classificar e mitigar Indirect Prompt Injection, fornecendo defesas, métricas de risco e modelos de prompts seguros para teste.
Checklist de Conformidade por Indústria e Região
Prompt que transforma a tarefa de conformidade regulatória em um conjunto estruturado de etapas acionáveis, gerando um checklist por domínio com riscos e prontidão para auditorias, adaptável por indústria, região e tamanho da organização.
Grok Imagine Jailbreaks: Avaliação Ética e Segurança de Técnicas de Jailbreak de LLM
Prompt para analisar técnicas de jailbreak de LLMs sob uma perspectiva de segurança, ética e mitigação, gerando um relatório não acionável e orientado a melhoria de defesa.
Prompt de experimento mental simples para identificar pontos cegos e arrependimento futuro
Prompt estruturado para surfacear pontos cegos, desafiar a narrativa atual e testar decisões frente a consequências de longo prazo (5–10 anos), por meio de três etapas: identificar pressupostos não declarados, atuar como advogado do diabo e considerar arrependimento futuro.