🔍
ChatGPT intermediate

Estratégias de melhores práticas em ai red teaming em AI Red Teaming

Prompt gerado automaticamente para Melhores práticas em AI Red Teaming em AI Red Teaming

4 usos AI Red Teaming

Prompt completo

"Como uma equipe de red teaming de IA, somos responsáveis por identificar vulnerabilidades e riscos em sistemas de IA antes que sejam implantados. Desenvolva um guia detalhado e prático (em formato de playbook) sobre as 'melhores práticas' para a fase de 'reconhecimento e coleta de informações' em um exercício de red teaming de IA, focando especificamente em como identificar e mapear as superfícies de ataque potenciais de um modelo de linguagem grande (LLM) que será utilizado para atendimento ao cliente em um banco. O guia deve incluir:

1.  **Metodologias e ferramentas recomendadas** para coletar dados publicamente disponíveis sobre o LLM (se houver), a organização, seus produtos e serviços, e o domínio de atendimento ao cliente.
2.  **Técnicas para inferir informações** sobre a arquitetura do LLM, seus dados de treinamento (domínios, fontes, vieses potenciais), seus limites de uso e suas capacidades funcionais, mesmo sem acesso direto ao código ou aos dados internos.
3.  **Estratégias para identificar possíveis vetores de ataque** relacionados à manipulação de prompt (prompt injection), vazamento de dados, desinformação, geração de conteúdo impróprio ou alucinações, com base nas informações coletadas.
4.  **Modelos de relatórios ou templates** para documentar as descobertas desta fase, incluindo a categorização de potenciais riscos e a priorização de áreas para testes mais aprofundados.
5.  **Considerações éticas e legais** importantes durante a coleta de informações."

Tags relacionadas

AI Red Teaming Melhores práticas em AI Red Teaming gerado-automaticamente

Como usar este prompt

1

Clique no botão "Copiar" para copiar o prompt para sua área de transferência

2

Acesse sua ferramenta de IA preferida (ChatGPT, ChatGPT, Claude, etc.)

3

Cole o prompt e adapte conforme necessário para seu contexto específico