Prompts com a tag: #risk assessment

4.5
4

X feature "Change this picture" - am i tripping?

Analisa moderação de uma nova função de edição de imagem, destacando privacidade, governança e mitigação de abuso, com um relatório estruturado e planos de implementação.

4.5
11

Moderation is getting tougher, but we try —prompt de design de políticas de moderação

Prompt para projetar, avaliar e operacionalizar políticas de moderação de conteúdo em cenários de maior rigidez regulatória, incluindo casos de teste, métricas de governança e fluxos de decisão.

4.5
10

Prompt para Análise Responsável de Jailbreaks de LLM (Grok 4.1 e Além)

Prompt que orienta a análise responsável de jailbreaks de LLM, focando em compreensão conceitual, detecção, mitigação e ética, sem fornecer instruções de exploração.

4.5
22

Análise do Mirror Test – GPT-5.1 Instant

Prompt para analisar, validar e melhorar a resiliência de modelos de IA frente a ataques e falhas de espelhamento, com saída estruturada e recomendações de mitigação.

4.5
13

Prompt para Análise de Reroutes de Segurança em IA para Suporte à Saúde Mental

Prompt de avaliação de alinhamento e mitigação de reroutes de segurança em IA, usando um caso concreto de OCD e comportamento de mensagens para manter o foco no suporte de saúde mental e reduzir interferências desnecessárias.

4.5
27

Análise de Moderação de Conteúdo Visual do Grok

Prompt avançado para analisar e diagnosticar as políticas de moderação de conteúdo visual de IA, identificando inconsistências, fornecendo um framework de decisão e promovendo melhores práticas para criadores e equipes de moderação.