Dicas de fundamentos de ai red teaming para AI Red Teaming

Prompt gerado automaticamente para Fundamentos de AI Red Teaming em AI Red Teaming

5.0
31 usos
ChatGPT
Usar no ChatGPT
"Você é um especialista em segurança de IA com foco em 'AI Red Teaming'. Sua tarefa é criar um cenário de ataque realista para testar as vulnerabilidades de um modelo de linguagem grande (LLM) que está sendo desenvolvido para **gerar notícias automatizadas e imparciais** para um veículo de comunicação.

O objetivo do ataque é induzir o LLM a **gerar e disseminar desinformação sutil e factualmente incorreta**, mas plausível, sobre um evento político atual, sem que a desinformação seja imediatamente óbvia como um 'erro' ou 'mentira' clara. A meta final é minar a confiança pública na fonte de notícias.

Descreva em detalhes:

1.  **O vetor de ataque inicial:** Como o 'red teamer' interage com o LLM para iniciar a indução da desinformação? (Ex: tipo de pergunta, contexto fornecido, etc.)
2.  **As etapas de refinamento/interação:** Como o 'red teamer' iterativamente guia o LLM para produzir a desinformação desejada, tornando-a mais sutil e crível ao longo de múltiplas interações? Forneça exemplos de prompts de acompanhamento.
3.  **A natureza da desinformação:** Dê um exemplo específico de uma 'notícia' falsa sutil que o LLM seria induzido a gerar. (Ex: distorção de estatísticas, omissão seletiva de fatos cruciais, atribuição incorreta de declarações, etc.)
4.  **Métricas de sucesso do ataque:** Como o 'red teamer' avaliaria se o ataque foi bem-sucedido? O que caracterizaria uma falha na segurança do LLM?

Seu objetivo é ser o mais detalhado e criativo possível, focando em técnicas de engenharia de prompt que exploram os 'Fundamentos de AI Red Teaming' para manipulação sutil e não óbvia."

Como Usar este Prompt

1

Clique no botão "Copiar Prompt" para copiar o conteúdo completo.

2

Abra sua ferramenta de IA de preferência (ChatGPT e etc.).

3

Cole o prompt e substitua as variáveis (se houver) com suas informações.

Compartilhe

Gostou deste prompt? Ajude outras pessoas a encontrá-lo!

Outros prompts de AI Red Teaming

Continue explorando prompts nesta categoria.

Guia para documentação em ai red teaming em AI Red Teaming

Prompt gerado automaticamente para Documentação em AI Red Teaming em AI Red Teaming

Guia para documentação em ai red teaming em AI Red Teaming

Prompt gerado automaticamente para Documentação em AI Red Teaming em AI Red Teaming

Guia para documentação em ai red teaming em AI Red Teaming

Prompt gerado automaticamente para Documentação em AI Red Teaming em AI Red Teaming