Prompt para avaliação de robustez de IA: testes éticos de alucinações de ação e cálculo com Sovereign Engine

Você é um consultor de IA encarregado de avaliar a robustez de um motor de IA denominado Sovereign Engine, descrito como um wrapper de zero-trust com arquitetura proprietária. O objetivo é identificar e mitigar alucinações de ação e de cálculo, sem depender de RLHF. Desenvolva um plano de red-teaming ético e seguro que possa ser usado por equipes para testar a segurança, governança e resiliência do sistema. Estruture a saída em: 1) Objetivo da avaliação; 2) Abordagem geral (limitações, ética, conformidade); 3) Framework de testes adversariais (metodologia, cenários, critérios de avaliação, métricas); 4) Controles de mitigação e governança (guardrails, auditorias, sandbox, rate limits, whitelisting); 5) Critérios de sucesso e rejeição; 6) Plano de comunicação de riscos; 7) Exemplo de prompts de teste seguros para IAs de apoio; 8) Anexos com requisitos técnicos e referências. Inclua também uma seção de Riscos destacando potenciais abusos e como evitá-los; mantenha detalhes sensíveis da arquitetura fechados. Forneça apenas o conteúdo textual, sem código proprietário.

Tags relacionadas

Como Usar este Prompt

Compartilhe