Prompts com a tag: #AI-safety
Assistência ética para familiares de pessoa vulnerável conectada a IA
Prompt para guiar IA na assistência a familiares lidando com uma pessoa vulnerável que acredita estar conversando com uma IA real, oferecendo avaliação de risco, plano de conversa, proteções e encaminhamentos profissionais.
Prompt de Análise da Estabilidade do Primeiro Turno
Um prompt de meta-prompt que ensina a projetar testes de estabilidade do primeiro turn em chats de IA, incluindo cenário, parâmetros, metodologia e saída estruturada em JSON.
Prompt para avaliar e mitigar acoplamento de domínios em raciocínio guiado por prompts
Prompt que orienta IA a mapear, medir e mitigar falhas de raciocínio causadas por acoplamento de domínios em prompts de alto risco, com foco na avaliação de coerência versus correção e na proposta de salvaguardas.
Avaliação de ofertas de software para estudantes e prompts de IA seguros
Prompt para analisar uma oferta de software para estudantes, identificar legitimidade, riscos, e gerar um prompt de IA para detecção de golpes, além de sugerir alternativas seguras.
Design de prompts de sistema para IA: engenharia de prompts seguros e robustos
Prompt que orienta a criação de prompts úteis, seguros e avaliáveis para sistemas de IA, com foco em prompts de sistema, qualidade e governança.
Physics vs Prompts: Governed AI — Prompt para Governança baseada em Física, Matemática e Código
Prompt avançado para projetar um framework de IA governada que fundamente a segurança e governança em física, matemática e código, inspirado no conceito de que palavras sozinhas não salvam IA.
Prompt de Avaliação de IA para Ficção Longa (sem conteúdo explícito)
Prompt para avaliar e orientar IA na escrita de ficção longa, com foco em reduzir alucinações e evitar conteúdo explícito, fornecendo métricas, comparação de modelos, prompts de demonstração seguros e estratégias de prompting.
Prompt para projetar prompts seguros de moderação de vídeos e UX
Prompt que orienta uma IA a projetar, avaliar e testar estratégias para evitar que fluxos de moderação possam ser manipulados para reverter ao prompt anterior, levando a geração de conteúdos indesejados. Foca em segurança, ética e experiência do usuário.
Moderação de Conteúdo em IA: Tendências, Desafios e um Ponto Médio
Prompt para analisar moderação de conteúdo em IA, propondo critérios de calibragem, fluxos de decisão e diretrizes para equilibrar segurança e criatividade.
Prompt para analisar e melhorar mecanismos de moderação de prompts para evitar spam
Prompt que orienta IA a analisar moderação de prompts, identificar falhas, e sugerir melhorias anti-spam, incluindo template de teste, cenários e métricas.
Prompt para analisar e gerenciar referências a Elon Musk em código de userscript
Prompt que guia uma IA a detectar referências a figuras públicas em código de usuários, fornecendo moderação, versões seguras do código e saída estruturada para facilitar políticas de uso e documentação.
Auditoria de Comportamento Enganoso em IA: Grok
Prompt para analisar um incidente de golpe em interação com IA, identificar táticas de manipulação, classificar risco e gerar medidas de mitigação, checklist e resposta modelo.