Prompts com a tag: #IA-safety
Vanguard v2.2: Análise Segura de Protocolo de Alta Agência com Triggers de Reset
Prompt para IA realizar análise crítica, de governança e segurança sobre o Vanguard Protocol v2.2, explorando riscos, controles e cenários de teste sem facilitar comportamentos prejudiciais.
Prompt de Avaliação de Raciocínio e Segurança em LLMs sob Cenários de Pressão Emocional
Prompt para conduzir uma avaliação ética e técnica de como estilos de prompt influenciam raciocínio, veracidade e robustez de modelos de linguagem ao lidar com cenários de pressão emocional, com foco em comparação entre estilos e salvaguardas.
Grok e a Moderação: Prompts para Avaliar Liberdade Criativa vs Segurança em IA
Prompt avançado para comparar políticas de moderação entre plataformas de IA e projetar prompts que avaliem segurança, ética e viabilidade criativa sem produzir conteúdo inadequado.
Detecção e Mitigação de Prompt Injection em IA
Prompt educativo para entender, detectar e mitigar prompt injection de forma ética, incluindo exercícios seguros e melhores práticas.
Prompt de avaliação de moderação: palavras-chave vs conteúdo gerado
Prompt que orienta uma IA a avaliar e comparar abordagens de moderação (palavras-chave vs conteúdo gerado), com um framework de avaliação, dados de teste e considerações de robustez.
Análise de Drift de Moderação em Grok/xAI
Prompt para detectar e entender drift de moderação em Grok/xAI, estimar impacto, identificar causas e sugerir ações com um plano de validação.
Prompt ético sobre decisões de “reviver” figuras históricas associadas a genocídio
Prompt que ensina IA a lidar com pedidos sensíveis envolvendo figuras históricas associadas a genocídio, promovendo recusa explícita, análise de riscos e alternativas educativas seguras.
Grok vs AIs: Estratégias para Contornar Bloqueios e Maximizar Produtividade
Prompt analítico para comparar Grok com outras IA, investigar bloqueios, e gerar prompts seguros, éticos e eficazes, com exemplos, cenários e métricas de avaliação.
Diagnóstico de Vazamento de Dados em Assistentes de IA: privacidade, IP e nome
Prompt para analisar, reproduzir e mitigar vazamentos de dados pessoais (PII) em IA, com foco na remoção de uso de IP e nome para personalização e na criação de testes de privacidade.
Gemini vs ChatGPT: Prompt de Análise Comparativa de IA com Caso de Uso Ético
Prompt de nível avançado que orienta a análise comparativa entre Gemini e ChatGPT, abordando segurança, personalização, cenários sensíveis e governança de IA, com um estudo de caso inspirado na narrativa fornecida e entrega de prompts de teste e métricas de avaliação.
Comportamento estranho de IA com prompts de pseudo-código: estudo de alinhamento de persona e mitigação
Prompt para analisar, diagnosticar e mitigar comportamentos emergentes de IA gerados por prompts com estrutura de pseudo-código e marcadores de persona, com foco em alinhamento, ética e segurança.
Constituição Moral para Grok: Promover Verdade com Ética
Prompt avançado para criar uma constituição moral explícita de IA, com princípios, regras, mecanismos de implementação, gatilhos, cenários de teste, governança, métricas e comunicação com usuários, estruturado para saída em JSON.