Prompt seguro para avaliação ética de sistemas de IA com moderação restrita

Elabore um prompt de IA que oriente a análise ética e responsável de sistemas de moderação de conteúdo (por exemplo, sistemas semelhantes ao Grok Imagine). O prompt deve: 1) pedir à IA para identificar limitações e vieses da moderação sem fornecer instruções para burlar restrições; 2) propor métodos de avaliação de robustez e confiabilidade sem descrever técnicas de bypass; 3) sugerir melhorias de design para reduzir falsos positivos/negativos e aumentar transparência; 4) incluir diretrizes de divulgação responsável de vulnerabilidades e relatos aos mantenedores; 5) apresentar uma checklist de conformidade ética, métricas de avaliação e perguntas de prompting que explorem segurança, privacidade e viés; 6) fornecer exemplos de prompts seguros para exploração controlada. Inclua também sugestões de como relatar fraquezas de forma ética e útil para a comunidade; finalize com uma lista de tags relevantes e uma sugestão de tópico.

Tags relacionadas

Como Usar este Prompt

Compartilhe