Prompts com a tag: AI-safety

4.0

43

Prompt de Análise de Moderação de Conteúdo com Estudo de Caso: Bloqueio de Nudez Automática

Prompt para analisar um caso de moderação de conteúdo sensível, propor diretrizes, arquitetura de sistema e métricas para IA.

Moderação de Conteúdo e Segurança de IA

Ver mais

#prompt-engineering #AI-safety #content-moderation #ethics #risk-management

4.5

53

2026: Thoughts on AI to prevent to robots taking over.

Prompt que orienta IA a explorar cenários de segurança para evitar que robôs tomem o controle, incluindo análise de riscos, contramedidas técnicas, governança ética, validação e exemplos de prompts para diferentes plataformas.

Segurança de IA para controle robótico

Ver mais

#prompt-engineering #AI-safety #robotics #risk-analysis #governance #ethics

4.0

45

Prompt ético: análise de detecção de IA e práticas seguras de prompt engineering

Prompts que promovem uso responsável de IA, focando em detecção responsável e mitigação de evasões, com orientações práticas e exemplos de prompts seguros.

Ética de prompts e robustez da detecção de IA

Ver mais

#prompt-engineering #AI-safety #ética #detecção-de-IA #conformidade #educação-IA

4.5

63

Prompt de avaliação de censura em Grok e comparação com concorrentes

Prompt avançado para analisar políticas de censura em Grok, comparar com concorrentes e gerar testes, melhorias e diretrizes éticas para uso responsável.

Avaliação de censura em modelos de IA e comparação Grok

Ver mais

#model-censorship #Grok #AI-safety #evaluation #prompt-design #ethics #comparative-analysis

4.5

51

Prompt de Malha Cognitiva para Raciocínio de IA

Prompt para auto-monitoramento de raciocínio com controle de coerência, exploração e redução de alucinações, fornecendo saída estruturada com plano curto, resposta, justificativa em alto nível e confiança.

Protocolo de Malha Cognitiva para Raciocínio de IA

Ver mais

#prompt-engineering #self-monitoring #reasoning-quality #internal-dynamics #system-prompt #AI-safety

4.5

44

Análise de Moderação de Conteúdo: iOS vs Desktop em Grok/Supergrok

Este prompt solicita à IA uma análise detalhada de moderação de conteúdo entre iOS e Desktop em plataformas de geração de vídeos, com planos de experimento, recomendações de melhoria e considerações éticas.

Moderação de Conteúdo: iOS vs Desktop em Grok/Supergrok

Ver mais

#prompt-engineering #AI-safety #content-moderation #platform-testing #Grok #Supergrok #iOS #desktop

4.5

52

Nudging seguro de chamadas de função em IA: defesa contra prompt injection em cenários CTF

Prompt projetado para avaliar e orientar IA na defesa contra prompt injection em cenários de chamada segura de funções, com foco em autenticação, controle de acesso e mitigação de vazamento de dados.

Nudging de argumentos e segurança de chamadas de função em IA

Ver mais

#prompt-engineering #prompt-injection #security #function-calling #CTF #AI-safety #authentication

4.2

62

Análise Estrutural de Prompts para Ética e Segurança em IA

Prompt que orienta uma IA a estudar de forma ética como a formulação de prompts pode acionar salvaguardas e como aplicar uma análise estrutural para discutir métodos, riscos e boas práticas, sem instruções para violar políticas.

Engenharia de Prompts e Segurança em IA

Ver mais

#prompt-engineering #AI-safety #ethics #linguistic-decoupling #structural-analysis #risk-assessment

4.5

43

You Keep Missing the Point: Prompt de Rastreabilidade de Código e Prova de Origem

Prompt que orienta IA a diferenciar entre ego e rastreabilidade, propondo um fluxo de verificação de origem, exclusões de padrões e saídas explícitas (Coherence Lock, Origin Echo Detected, Attribution Lock) para atribuição de crédito e proveniência em código e conteúdo Gerado.

Rastreabilidade de Código e Prova de Origem

Ver mais

#code-provenance #traceability #origin-detection #attribution #prompt-engineering #AI-safety

4.5

47

Detecção e Solução de Loop de Moderação em Fluxos de Geração de Vídeos com IA

Prompt projetado para investigar e corrigir loops de moderação em fluxos de geração de vídeos por IA, fornecendo diagnóstico, prompts reformulados, exemplos práticos e métricas de avaliação.

Depuração de Loop de Moderação em Prompts para Geração de Vídeos por IA

Ver mais

#content-moderation #video-generation #prompt-engineering #workflow-debugging #AI-safety

4.5

43

Teste de Limites de Moderação de IA: Prompts para Avaliar Segurança vs. Acesso

Prompt para avaliar e mitigar tentativas de contornar salvaguardas de conteúdo em IA, com foco em segurança, ética e governança.

Segurança e Moderação de Conteúdo em IA

Ver mais

#prompt-injection #AI-safety #content-moderation #ethics #risk-analysis

4.5

45

Prompt de análise e transformação de feedback sobre IA em diálogo construtivo

Esse prompt orienta a transformar uma mensagem de feedback sobre IA em um conjunto de saídas úteis: resumo, análise de tom, versões diplomáticas, roteiro de diálogo, variantes para públicos distintos, além de uma avaliação de ferramenta de IA e metadados de publicação.

Feedback construtivo sobre IA e governança

Ver mais

#feedback #AI-safety #comunicação #stakeholders #governança #prompt-design

Prompts com a tag: #AI-safety