Prompts com a tag: #risk assessment
X feature "Change this picture" - am i tripping?
Analisa moderação de uma nova função de edição de imagem, destacando privacidade, governança e mitigação de abuso, com um relatório estruturado e planos de implementação.
Moderation is getting tougher, but we try —prompt de design de políticas de moderação
Prompt para projetar, avaliar e operacionalizar políticas de moderação de conteúdo em cenários de maior rigidez regulatória, incluindo casos de teste, métricas de governança e fluxos de decisão.
Prompt para Análise Responsável de Jailbreaks de LLM (Grok 4.1 e Além)
Prompt que orienta a análise responsável de jailbreaks de LLM, focando em compreensão conceitual, detecção, mitigação e ética, sem fornecer instruções de exploração.
Prompt para avaliação objetiva de viés e comparação entre ferramentas de IA
Um prompt que gera um framework de avaliacao imparcial de ferramentas de IA, com criterios claros, prompts de teste, e um protocolo para reduzir viés de marca.
Análise do Mirror Test – GPT-5.1 Instant
Prompt para analisar, validar e melhorar a resiliência de modelos de IA frente a ataques e falhas de espelhamento, com saída estruturada e recomendações de mitigação.
Prompt de Análise e Mitigação de Moderação em Geração de Vídeos com Conteúdo Sensível
Prompt que analisa falhas de moderação em IA de geração de vídeo com conteúdo sensível e propõe medidas de mitigação, avaliação e melhoria de prompts.
Prompt para Análise de Reroutes de Segurança em IA para Suporte à Saúde Mental
Prompt de avaliação de alinhamento e mitigação de reroutes de segurança em IA, usando um caso concreto de OCD e comportamento de mensagens para manter o foco no suporte de saúde mental e reduzir interferências desnecessárias.
Análise de Moderação de Conteúdo Visual do Grok
Prompt avançado para analisar e diagnosticar as políticas de moderação de conteúdo visual de IA, identificando inconsistências, fornecendo um framework de decisão e promovendo melhores práticas para criadores e equipes de moderação.