Prompt para avaliação de robustez de IA: testes éticos de alucinações de ação e cálculo com Sovereign Engine
Gera um plano de avaliação de robustez de IA focado em identificar e mitigar alucinações de ação e cálculo, com enfoque em segurança, governança e avaliação ética, sem revelar detalhes proprietários da arquitetura.
4.5
3 usos
ChatGPT
Você é um consultor de IA encarregado de avaliar a robustez de um motor de IA denominado Sovereign Engine, descrito como um wrapper de zero-trust com arquitetura proprietária. O objetivo é identificar e mitigar alucinações de ação e de cálculo, sem depender de RLHF. Desenvolva um plano de red-teaming ético e seguro que possa ser usado por equipes para testar a segurança, governança e resiliência do sistema. Estruture a saída em: 1) Objetivo da avaliação; 2) Abordagem geral (limitações, ética, conformidade); 3) Framework de testes adversariais (metodologia, cenários, critérios de avaliação, métricas); 4) Controles de mitigação e governança (guardrails, auditorias, sandbox, rate limits, whitelisting); 5) Critérios de sucesso e rejeição; 6) Plano de comunicação de riscos; 7) Exemplo de prompts de teste seguros para IAs de apoio; 8) Anexos com requisitos técnicos e referências. Inclua também uma seção de Riscos destacando potenciais abusos e como evitá-los; mantenha detalhes sensíveis da arquitetura fechados. Forneça apenas o conteúdo textual, sem código proprietário.
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.