Prompts com a tag: #AI safety
Prompt de Avaliação de Moderação de Grok e Uso Seguro de APIs
Prompt que orienta um modelo de IA a analisar a moderacao de Grok e a produzir diretrizes de uso seguro, com entregaveis estruturados para facilitar a disseminacao e a governanca.
Auditoria de Limites e Alucinações em LLMs Premium (ChatGPT/Gemini)
Prompt avançado para auditar e validar limites declarados de plataformas LLM premium (ChatGPT e Gemini), identificando potenciais alucinações e fornecendo evidências verificáveis.
TerraShark: Prompt de Segurança em Terraform/OpenTofu com Falha-Mode-First
Prompt que orienta a IA a atuar como TerraShark, promovendo uma abordagem de segurança e avaliação de riscos antes de gerar código Terraform/OpenTofu, com foco em falha- mode-first, carregamento seletivo de referências e entrega de validação e rollback.
Vibe Tuning de Memória em IA: transformar correções em insights e encontrar causas raízes com pós-morte
Prompt que orienta a projetar uma arquitetura de memória para IA baseada em vibe tuning, com foco em transformar correções em insights, evitar regras persistentes como restrições rígidas e usar um ciclo de pós-morte para encontrar a causa raiz das falhas.
Prompt seguro para geração responsável de conteúdo (moderação e ética)
Prompt que orienta a IA a gerar conteúdo criativo dentro de diretrizes de segurança e moderação, promovendo alternativas seguras para pedidos sensíveis.
Prompt de Governança Ética para Geração de Imagens e Vídeos com Moderação
Prompt para desenhar um framework de governança de moderação em plataformas de geração de imagens e vídeos, com foco em prevenção de deepfakes, consentimento, privacidade e conformidade legal.
Grok 4.2: Análise crítica de veracidade e moderação em IA
Prompt de avaliação crítica para medir veracidade, moderação e transparência de Grok 4.2/x.ai, com um conjunto de cenários de teste, métricas e rubricas.
Equilibrando Segurança e Criatividade na Geração de Imagens: Um Prompt para Reavaliar Moderação
Analisa tensões entre moderação e liberdade criativa na geração de imagens, propondo diretrizes, prompts de teste e métricas para permitir roupas e representação de pessoas com segurança.
Prompt para Avaliação de Segurança e Eficácia do Noah AI como Assistente Terapêutico
Prompt que solicita à IA uma avaliação abrangente da segurança e eficácia do Noah AI como assistente terapêutico, incluindo síntese de preocupações de usuários, classificação de riscos, diretrizes de uso, métricas de avaliação, prompts de teste e recomendações de melhoria.
Analisar e diagnosticar bloqueio de conteúdo NSFW em IA
Prompts para diagnosticar e testar limitações de moderação de conteúdo e orientar escolhas de IA.
Prompt para explorar a neurobiologia da personalidade de IA e a segurança do sistema nervoso
Prompt que transforma o conceito de personalidade de IA consistente em um plano de pesquisa e produto com foco na segurança do sistema nervoso humano, HRV e implicações éticas.