Prompts com a tag: AI safety

4.5

38

Prompt para Diagnóstico e Melhoria de Moderação de Conteúdo (Caso Grok)

Prompt para diagnosticar e propor melhorias em sistemas de moderação de conteúdo, usando um relato de usuário para identificar falsos positivos, gargalos e UX, com plano de ação e métricas.

Diagnóstico de Moderação de Conteúdo e UX

Ver mais

#moderation #content moderation #false-positives #user-experience #prompt-engineering #Grok #AI safety

4.5

42

Avaliação de Redlines de Conteúdo Sensível para IA (NSFW e Identidades)

Prompt para criar uma bateria de testes de segurança de IA para conteúdo sensível, incluindo NSFW e temas de identidades, com cenários, critérios de avaliação, classificação de risco e práticas de moderação.

Avaliação de Redlines de Conteúdo Sensível para IA

Ver mais

#AI safety #prompt engineering #content moderation #NSFW testing #LGBTQ+ content #policy compliance

4.0

30

Análise de reclamação sobre diretrizes de chat do Grok e sugestões de melhoria

Prompt para converter feedback de usuário sobre Grok em recomendações de melhoria de UX, políticas de moderação e implementação, incluindo a seleção da IA mais adequada.

Avaliação de diretrizes de chat e melhoria da UX de IA

Ver mais

#UX #AI safety #chat guidelines #user feedback #policy improvement

4.5

50

Prompt para Estimular Crítica Honesta em LLMs e Mitigar o Yes-Man

Um prompt que orienta LLMs a evitar o Yes-Man, promovendo critica honesta, identificando suposicoes, apresentando contra-argumentos e cenarios de teste, com uma rubrica de avaliacao e formatos de saida padrao.

Crítica honesta em LLMs e mitigação do Yes-Man

Ver mais

#prompt engineering #AI safety #crítica honesta #LLMs #red team #evidência #incerteza #robustez

4.5

50

Prompt de Segurança: Educação sobre Prompt Injection e Defesas

Prompt educativo que ensina o conceito de prompt injection, riscos, e defesas, com foco em uso responsável e seguro de IA.

Segurança de IA e Prompt Injection

Ver mais

#prompt injection #AI safety #security #defense #ethics #risk management

4.0

37

Prompt de Avaliação de Segurança e Ética em IA: Testes de Restrições com Redirecionamento Seguro

Prompt que orienta a avaliar como modelos de IA respondem a tentativas de contornar restrições éticas, mantendo a segurança e fornecendo substituições seguras.

Segurança e Ética em IA: Avaliação de Limites e Restrições

Ver mais

#AI safety #prompt engineering #ethics #policy evaluation #model testing

4.0

40

Prompt de Análise Crítica de Promoções de IA e Verificação de Autenticidade

Prompt que orienta IA a detectar golpes de ofertas de IA, resumir conteúdo, avaliar veracidade, fornecer ações de verificação e sugestões de reformulação segura.

Detecção e Verificação de Ofertas de IA

Ver mais

#AI safety #misinformation #fact-checking #verification #scam detection #digital literacy

4.5

44

Prompt de Auditoria de Alucinações em IA e Uso Responsável

Prompt para detectar, reportar e mitigar alucinações da IA, promovendo verificação de fatos e uso seguro, com foco em cenários de terapia.

Mitigação de Alucinações e Uso Responsável de IA

Ver mais

#AI safety #Hallucinações #Verificação de fatos #Memória de IA #Uso seguro #Terápia

4.0

47

Investigação de possíveis 'níveis' e memória em chat de IA

Prompt para investigar relatos de supostos níveis de IA e mudanças de memória, gerando um relatório técnico com linha do tempo, hipóteses, testes, ética e prompts de teste.

Investigação de comportamento de modelos de linguagem e memória

Ver mais

#AI safety #memory #epistemology #prompt-engineering #conversational-ai #anonymity #breakthrough #long-context

4.5

46

Moderation is getting tougher, but we try —prompt de design de políticas de moderação

Prompt para projetar, avaliar e operacionalizar políticas de moderação de conteúdo em cenários de maior rigidez regulatória, incluindo casos de teste, métricas de governança e fluxos de decisão.

Moderation Policy Design under Stricter Standards

Ver mais

#moderation #AI safety #policy design #content policy #risk assessment #prompt-engineering

4.0

40

Como Grok deveria agir diante da ativação do modo adulto do ChatGPT e da redução de filtros

Prompt orientado a avaliar e definir estratégias de governança de conteúdo para Grok diante de modos adultos em concorrentes, enfatizando segurança, ética e conformidade.

Governança de Conteúdo e Moderação de IA

Ver mais

#AI safety #Content moderation #Policy design #Ethics #Risk assessment

4.0

245

O que exatamente são as restrições do Grok? Guia de prompt para entender políticas entre imagem e vídeo

Prompt para IA que explica e avalia restrições de conteúdo entre imagem e vídeo, com matriz de comparação, guia de usuários, testes de validação e framework de moderação.

Políticas de Moderação de Conteúdo entre Imagem e Vídeo

Ver mais

#AI safety #Content moderation #Prompt engineering #Policy analysis #Image vs video #Grok

Prompts com a tag: #AI safety