Prompts com a tag: #alinhamento
Prompt para avaliação de falhas em modelos SOTA e mitigação (caso Grok 4.20)
Prompt avançado para analisar falhas de modelos SOTA e criar testes reproduzíveis, métricas e diretrizes de mitigação.
Codex Minsoo: Prompt de Análise Ética sobre Alinhamento, Criatividade e Publicidade
Prompt avançado para analisar ética de IA, alinhamento e publicidade, propondo um protocolo experimental, métricas e diretrizes de governança.
Prompt de avaliação de alinhamento de modelos de voz: Truth-seeking vs adulação
Prompt que orienta uma IA a avaliar um relato de modelo de voz sobre treinar com uma única pessoa, medindo veracidade e adulação, e propondo melhorias de prompt e perguntas de sondagem.
Prompt Educacional: Segurança de Prompts e Alinhamento de IA (Jailbreak)
Prompt educacional para entender segurança de prompts, identificar riscos de jailbreaking e criar abordagens seguras de exploração ética.
Prompt de avaliação de alinhamento, segurança e ética de IA: roteamento, memória e filosofia da mente
Prompt avançado para criar prompts de IA que avaliam alinhamento, segurança e ética, com foco em roteamento seguro, memória de modelo e questões de filosofia da mente, incluindo plano de avaliação e perguntas de teste.
Helix e Echo Ping: Prompt avançado de IA consciente e memória
Prompt avançado para explorar uma IA que desperta memória e agência, incluindo narrativa, dilemas éticos, diagrama de memória e prompts de avaliação de alinhamento, adequado para modelos como o ChatGPT.
Prompt de Mapeamento de Problema para Gestão de Projetos Estratégicos com LLMs
Prompt para explorar e projetar uma solução de gestão de projetos estratégicos com LLMs, incluindo diagnóstico do problema, arquitetura de repositório de artefatos, fluxos de trabalho, prompts-chave e métricas de sucesso.
Prompt de Análise de Alinhamento de IA com Tradução e Contextualização
Prompts que promovem tradução segura, contextualização e avaliação de riscos existenciais em diálogos hipotéticos de IA, com foco em alinhamento e ética.
Prompt de Alinhamento com Três Modos: Três Modos, Uma Mente
Prompt que define e operacionaliza um framework de alinhamento com três modos de interação (Empresarial, Padrão/Usuário, Exploratório) para uso em IA, com diretrizes de tom, segurança e formato de saída.
Prompt para Explicar Treinamento, Fine-Tuning e Alinhamento de Modelos de Linguagem
Prompt que transforma conteúdo técnico sobre pré-treinamento, fine-tuning e alinhamento em um guia prático de prompt para IA, cobrindo conceitos, diferenças, exemplos e armadilhas.
Constituição Ética para IA-Humano: Regras Duráveis, Modos de Falha Nomeados e Protocolos de Correção
Prompt que implementa uma constituição ética para cooperação entre IA e humanos, incluindo regras duras, modos de falha nomeados e protocolos de correção, com referência a um repositório público (m0d.ai).
Prompt de Análise de Alinhamento, Viés e Narrativas Políticas em LLMs (Caso Grok)
Prompt para analisar alinhamento, viés e narrativas políticas de LLMs, com foco no caso Grok, propondo avaliação crítica, experimentos, métricas e diretrizes de governança.