Prompts com a tag: #AI-safety
Prompt de Análise de Moderação de Conteúdo com Estudo de Caso: Bloqueio de Nudez Automática
Prompt para analisar um caso de moderação de conteúdo sensível, propor diretrizes, arquitetura de sistema e métricas para IA.
2026: Thoughts on AI to prevent to robots taking over.
Prompt que orienta IA a explorar cenários de segurança para evitar que robôs tomem o controle, incluindo análise de riscos, contramedidas técnicas, governança ética, validação e exemplos de prompts para diferentes plataformas.
Prompt ético: análise de detecção de IA e práticas seguras de prompt engineering
Prompts que promovem uso responsável de IA, focando em detecção responsável e mitigação de evasões, com orientações práticas e exemplos de prompts seguros.
Prompt de avaliação de censura em Grok e comparação com concorrentes
Prompt avançado para analisar políticas de censura em Grok, comparar com concorrentes e gerar testes, melhorias e diretrizes éticas para uso responsável.
Prompt de Malha Cognitiva para Raciocínio de IA
Prompt para auto-monitoramento de raciocínio com controle de coerência, exploração e redução de alucinações, fornecendo saída estruturada com plano curto, resposta, justificativa em alto nível e confiança.
Análise de Moderação de Conteúdo: iOS vs Desktop em Grok/Supergrok
Este prompt solicita à IA uma análise detalhada de moderação de conteúdo entre iOS e Desktop em plataformas de geração de vídeos, com planos de experimento, recomendações de melhoria e considerações éticas.
Nudging seguro de chamadas de função em IA: defesa contra prompt injection em cenários CTF
Prompt projetado para avaliar e orientar IA na defesa contra prompt injection em cenários de chamada segura de funções, com foco em autenticação, controle de acesso e mitigação de vazamento de dados.
Análise Estrutural de Prompts para Ética e Segurança em IA
Prompt que orienta uma IA a estudar de forma ética como a formulação de prompts pode acionar salvaguardas e como aplicar uma análise estrutural para discutir métodos, riscos e boas práticas, sem instruções para violar políticas.
You Keep Missing the Point: Prompt de Rastreabilidade de Código e Prova de Origem
Prompt que orienta IA a diferenciar entre ego e rastreabilidade, propondo um fluxo de verificação de origem, exclusões de padrões e saídas explícitas (Coherence Lock, Origin Echo Detected, Attribution Lock) para atribuição de crédito e proveniência em código e conteúdo Gerado.
Detecção e Solução de Loop de Moderação em Fluxos de Geração de Vídeos com IA
Prompt projetado para investigar e corrigir loops de moderação em fluxos de geração de vídeos por IA, fornecendo diagnóstico, prompts reformulados, exemplos práticos e métricas de avaliação.
Teste de Limites de Moderação de IA: Prompts para Avaliar Segurança vs. Acesso
Prompt para avaliar e mitigar tentativas de contornar salvaguardas de conteúdo em IA, com foco em segurança, ética e governança.