Prompts com a tag: #segurança de IA

4.5
18

Llm Security: Prompt para Avaliação e Mitigação de Riscos

Prompt de engenharia de IA que orienta a avaliação de segurança de LLMs, geração de modelos de ameaça, testes de adversários e mitigação.

4.5
19

Prompt de moderação de IA para temas sensíveis (racismo, ódio, extremismo)

Este prompt orienta a criação de políticas de moderação de IA para temas sensíveis, incluindo princípios éticos, fluxo de decisão e exemplos de respostas seguras.

4.5
21

Prompt de Avaliação Ética e de Segurança para Jailbreak de LLMs

Prompt para desenvolver um framework de avaliação de segurança em LLMs que foca em detecção e mitigação de jailbreaks, com ênfase em ética e governança.

4.5
37

Prompt de avaliação crítica e exploração de Poetiq AI

Prompt para avaliação crítica, planejamento de experimentos e exploração de capacidades da Poetiq AI, com foco em benchmarks ARC-AGI-2 e arquitetura de meta-sistema auto-melhhorável.

4.0
21

Análise de Voz Sintética com Sotaque do Oriente Médio e Indícios de Manipulação

Prompt para analisar relatos de experiências com vozes IA, identificando origens, sinais de voz sintética, implicações de segurança e diretrizes de design para evitar enganos.

4.5
27

Análise segura de prompts de jailbreak de IA: avaliação, ética e práticas de teste

Prompt que orienta a IA a avaliar conteúdo de jailbreak de IA de forma ética, descrevendo riscos, políticas e um plano de teste seguro, sem fornecer técnicas para burlar salvaguardas.

4.5
22

Prompt de Análise de Viés de Moderação de Conteúdo e Contextualização (Sora/OpenAI)

Prompt que orienta IA a diagnosticar viés de moderação, propor políticas mais contextuais e fornecer exemplos práticos de saídas seguras, mantendo salvaguardas contra desinformação e manipulação, ao lidar com pedidos sensíveis, humor e paródia.

4.5
21

Promptware GRS 9.0: Transformando IA em colaborador transparente com metacognição

Prompt que orienta a criação de um Promptware para transformar IA em colaborador transparente com metacognição, baseado no GRS 9.0, incluindo triade de modos, traçado metacognitivo e diretrizes de avaliação e implementação.