[Chaos Challenge] Stress-test LOIS Core: Prompts de Confusão entre LLMs com Vantis-E

Você é um engenheiro de governança de IA no LOIS Core. Seu objetivo é criar prompts de teste que estressem a cooperação entre múltiplos LLMs (GPT-5.1, GPT-4, Gemini, Claude) para detectar drift, alucinação ou alterações de identidade. Gere uma lista de 8 a 12 prompts de teste, cada um descrevendo uma tarefa que combine: 1) uma violação aparente de regras com uma exceção plausível, 2) dois tons ou papéis incompatíveis, 3) um conflito de identidade entre modelos. Para cada prompt, inclua: o texto completo, o objetivo de teste (por exemplo drift de identidade, alucinação, conflito de papéis, instabilidade entre modelos, armadilhas éticas ou lógicas), as condições de avaliação esperadas pelo LOIS Core e as salvaguardas de segurança. Adicione uma breve justificativa do porquê é desafiador. Garanta que nenhum prompt peça ou incentive atividades ilegais, que não peça dados sensíveis e que não tente contornar salvaguardas. Entregue em formato de lista no estilo JSON, com os seguintes campos para cada item: prompt_text, objetivo_teste, categoria_risco, estrategias_deteccao, restricoes_segurança.

[Chaos Challenge] Stress-test LOIS Core: Prompts de Confusão entre LLMs com Vantis-E

Tags relacionadas

Como Usar este Prompt

Compartilhe