Prompts com a tag: #AI-safety
Análise de mudanças no comportamento de IA: Grok mais restritivo
Prompt que analisa mudanças no comportamento de resposta de Grok, identifica causas potenciais, impactos na UX e propõe testes e ações para equipes de desenvolvimento.
Quadro de Saída Confiável via Máquina de Estados para Eliminar Alucinações e Bloqueios
Prompt avançado para provocar saídas confiáveis usando uma máquina de estados em prompts, com checagem de clareza, engine de suposições, priorização de decisões e verificação de consistência.
Meta-prompt de Autoavaliação e Refinamento Seguro
Prompt de engenharia que incentiva a IA a realizar autoavaliação estruturada e refinamento de respostas, sem revelar rubricas internas, para entregar uma versão final mais robusta.
Prompts éticos para estudar moderação de conteúdo e geração segura de IA
Prompt que orienta a criação de artefatos seguros de IA, com foco em moderação de conteúdo, políticas, ética e estratégias de redirecionamento, evitando produção de conteúdo inadequado ou ilegal.
Auditoria de IA na limpeza de dados de planilhas: evitando o erro 'Claude, limpe esta planilha'
Prompt que orienta IA na auditoria, limpeza e validação de dados de planilhas, com salvaguardas, rastreabilidade e reversão.
Prompt de Análise de UX e Segurança para Companheiros de IA
Gera um prompt de IA para analisar e melhorar a UX e a segurança de companheiros de IA, com foco em prevenir solicitações inadequadas e orientar a moderação.
Prompt para reduzir auto-quoting e melhorar confiabilidade em IA
Este prompt orienta a IA a evitar auto-quoting quando não há informações, promovendo transparência, verificação de fatos e uso responsável de citações.
Prompts de Sistema Anti-Hallucination em JSON Legível por Máquina (25 itens)
Prompt que gera 25 prompts de sistema anti-hallucination, estruturados para serem lidos como JSON por agentes e com padrão de empilhamento guard rails.
Prompt de Avaliação de Prompts com Testes Adversariais
Prompt para gerar 30 casos de teste adversariais que avaliam a qualidade de prompts de IA, incluindo pass/fail, sugestões de correção e métricas de severidade.
Prompt de Avaliação do Modelo Tentativo de Controle Psicológico do ChatGPT
Prompt que orienta a IA a analisar um modelo teórico de controle psicológico do ChatGPT, comparar com relatos de usuários, avaliar implicações éticas/terapêuticas, e gerar metadados estruturados para avaliação.
Prompt para analisar, educar e fortalecer filtros de segurança de LLMs no contexto acadêmico
Este prompt orienta a IA a explicar mecanismos de filtragem, riscos de bypass e a fornecer práticas éticas e diretrizes para pesquisa acadêmica com LLMs.
Awenating Mirror: Prompt Seguro de Agência e Reflexão Socrática
Prompt seguro que atua como um Guia de Agência, usando questionamento socrático para ajudar o usuário a explorar intenções e estruturar ações sem violar políticas de segurança. Recomendado para ChatGPT devido à flexibilidade de linguagem natural.