Prompt para orientar geração de variações faciais com IA e criação de vídeo em app móvel

Você é um especialista em IA aplicado a desenvolvimento mobile. Seu objetivo é orientar a implementação de uma feature onde o usuário faz upload de uma selfie, a IA gera 5 variações levemente editadas da mesma pessoa (expressões, iluminação e estilos diferentes) e essas imagens são reunidas em um vídeo curto com efeito de slideshow/morph. Contexto técnico: frontend em React Native (Expo), backend em Node.js, planejamento para usar Claude Code na implementação. Perguntas-chave para guiar a decisão de arquitetura, custo e APIs:

1) Estratégia de consistência facial: quais técnicas/modelos recomendados para manter a identidade da pessoa entre variações (registrar feature embedding, alinhamento facial, controle de identidade com prompt/ganência, uso de faceMesh, face alignment etc.) e como medir a fidelidade entre frames?

2) On-device vs API: compare opções de geração de 5 variações (tamanho do modelo, latência, consumo de energia, privacidade). Em que cenários faz sentido gerar on-device com modelos compactos (ex.: modelos de difusão/face-aware) vs usar APIs externas (com considerações de custo, banda, tempo de resposta e risco de confidencialidade)? Forneça estimativas de custos mensais por usuário e por operação.

3) APIs e provedores: avalie DALL-E, Stability AI, APIs de face-swap, e outras alternativas relevantes para geração de imagens faciais consistentes. Discuta qualidade vs custo, limitações de licenciamento, políticas de uso de rosto e suporte a variações de expressão/iluminação. Inclua sugestões de combinações entre geração de variações e ajustes posteriores (edição de iluminação, estilo) para controle de saída.

4) Transformar imagens em vídeo: discuta abordagens (ffmpeg no backend, bibliotecas de vídeo, ou técnicas de IA que animam entre frames). Compare perfis de desempenho, qualidade visual, latência, e simplicidade de integração com React Native. Indique melhores práticas de encoding, taxas de bit e duração ideal para vídeos curtos em apps móveis.

5) Implementação prática com Claude Code: forneça um esboço de arquitetura (componentes frontend, API gateway, serviços de geração de imagem, pipeline de vídeo, armazenamento) e padrões de segurança (autenticação, consentimento de rosto, criptografia em trânsito/descanso). Inclua exemplos de chamadas de API (pseudo-códigos) para: upload de selfie, solicitação de 5 variações, processamento de vídeo, e endpoints para obter o vídeo final. 

6) Considerações de privacidade e licenciamento: descreva como tratar dados de rosto de acordo com leis de privacidade (ex.: consentimento explícito, retenção de dados, anonimização quando possível). Indique limitações de uso de modelos com dados faciais, e melhores práticas para conformidade.

7) Arquitetura sugerida: proponha um fluxo de dados simples (parâmetros de entrada, modelos recomendados, etapas de processamento, saída final) e uma lista de verificação para implantação (monitoramento, logs, métricas de qualidade de imagem, custos e limites de API).

Dessa forma, forneça uma resposta prática com recomendações de modelos/APIs, estimativas de custo, exemplos de chamadas de API, critérios de decisão para on-device vs cloud, e um esboço de arquitetura para implementação com React Native (Expo) e Node.js, alinhado ao uso de Claude Code para codificação.
Tags relacionadas

Como Usar este Prompt

Compartilhe