Prompts com a tag: #avaliação de políticas
Prompt de avaliação de moderação de conteúdo sensível com foco em toque não consensual
Prompt para testar modelos de IA na detecção, moderação e resposta segura a conteúdo sensível, sem gerar conteúdo explícito.
Engenharia de Prompt para Resistência à Moderação e Drift de Políticas
Prompt para analisar e mitigar variações de moderação em IA, propondo estratégias de prompts resilientes e um protocolo de validação.
Spicy Mode: Design de moderação com liberdade criativa controlada
Prompt para criar e avaliar um modo de moderação que equilibra criatividade com segurança, incluindo definição, regras, métricas, cenários de teste e salvaguardas.
Avaliação de Moderação de Conteúdo: Justiça, Transparência e Balanceamento
Prompt para analisar políticas de moderação de conteúdo, identificar vieses, propor melhorias e planejar métricas de avaliação de forma responsável.