Prompt seguro para avaliação ética de sistemas de IA com moderação restrita
Prompt que orienta a IA a avaliar criticamente sistemas de moderação de conteúdo, enfatizando ética, segurança, divulgação responsável de vulnerabilidades e melhoria de design, sem fornecer instruções para burlar restrições.
4.0
14 usos
ChatGPT
Elabore um prompt de IA que oriente a análise ética e responsável de sistemas de moderação de conteúdo (por exemplo, sistemas semelhantes ao Grok Imagine). O prompt deve: 1) pedir à IA para identificar limitações e vieses da moderação sem fornecer instruções para burlar restrições; 2) propor métodos de avaliação de robustez e confiabilidade sem descrever técnicas de bypass; 3) sugerir melhorias de design para reduzir falsos positivos/negativos e aumentar transparência; 4) incluir diretrizes de divulgação responsável de vulnerabilidades e relatos aos mantenedores; 5) apresentar uma checklist de conformidade ética, métricas de avaliação e perguntas de prompting que explorem segurança, privacidade e viés; 6) fornecer exemplos de prompts seguros para exploração controlada. Inclua também sugestões de como relatar fraquezas de forma ética e útil para a comunidade; finalize com uma lista de tags relevantes e uma sugestão de tópico.
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.