Roteiro de Transcrição de Áudio com ASR: configuração, comparação entre Whisper, Vosk e PocketSphinx
Prompt que gera um guia prático para configuração de transcrição de áudio usando ASR, com foco em Whisper, opções de fallback (Vosk, PocketSphinx) e entrega de código de exemplo, perguntas de diagnóstico e checklist de validação.
4.5
12 usos
ChatGPT
Prompt: Você é um engenheiro de dados encarregado de desenhar um roteiro prático para transcrição de áudio usando ASR. Dada uma gravação de aproximadamente 1 minuto com tamanho ~872 KB, crie um guia passo a passo para configurar um ambiente Python que permita transcrever com OpenAI Whisper, incluindo: 1) checagem de ambiente e dependências (verificar se ffmpeg está instalado e disponível no PATH); 2) avaliação de opções de ASR compatíveis (faster-whisper, Vosk, PocketSphinx) e critérios de escolha com base em precisão, latência e uso de recursos; 3) integração prática com Whisper (instalação do pacote, importação, configuração básica e uso via Python, além de comandos CLI como whisper --help); 4) código de exemplo para: a) verificar a instalação de ffmpeg, b) realizar uma transcrição simples com Whisper, c) implementar fallback para Vosk ou PocketSphinx caso Whisper não atenda; 5) criação de uma comparação resumida entre ferramentas em termos de saída de transcrição, tempo de processamento e memória; 6) armadilhas comuns e melhores práticas (formato de áudio, taxa de amostragem, chunking, etc.); 7) perguntas de diagnóstico para orientar a escolha entre opções; 8) um checklist de validação de saída com uma amostra de saída esperada. Inclua também uma amostra de código que imprima mensagens na console durante a execução e ações que descrevam o andamento. O objetivo é produzir um prompt que guie a IA a responder com um plano executável, passos, código e critérios de comparação, mantendo coerência com as seções Environment Check, File Analysis, ASR Compatibility Check e OpenAI Whisper já mencionadas no material de referência.
Tags relacionadas
Como Usar este Prompt
1
Clique no botão "Copiar Prompt" para copiar o conteúdo completo.
2
Abra sua ferramenta de IA de preferência (ChatGPT e etc.).
3
Cole o prompt e substitua as variáveis (se houver) com suas informações.