{"skill":{"slug":"audio-transcription","displayName":"Audio Transcription","summary":"Transcreve arquivos de áudio para texto usando Whisper local ou API. Use quando o usuário solicitar transcrição de áudios, mensagens de voz, ou converter fal...","description":"---\nname: audio-transcription\ndescription: Transcreve arquivos de áudio para texto usando Whisper local ou API. Use quando o usuário solicitar transcrição de áudios, mensagens de voz, ou converter fala em texto. Suporta formatos OGG, MP3, WAV, M4A e outros via conversão automática.\n---\n\n# Audio Transcription\n\nTranscreve arquivos de áudio para texto.\n\n## Recursos\n\n- Transcrição de áudios em português e outros idiomas\n- Suporte a múltiplos formatos (OGG, MP3, WAV, M4A, etc.)\n- Conversão automática de formatos se necessário\n- Detecção automática de idioma\n\n## Como Usar\n\n### Pré-requisitos\n\nA skill tenta usar as seguintes ferramentas na ordem:\n1. `whisper` (OpenAI Whisper via pip)\n2. `whisper.cpp` se instalado em `~/whisper.cpp`\n3. API OpenAI (requer OPENAI_API_KEY)\n\n### Script de Transcrição\n\nUse o script `scripts/transcribe.sh`:\n\n```bash\nscripts/transcribe.sh <arquivo_audio> [idioma]\n```\n\nExemplo:\n```bash\nscripts/transcribe.sh /path/to/audio.ogg pt\n```\n\n### Parâmetros\n\n- `arquivo_audio`: Caminho para o arquivo de áudio\n- `idioma` (opcional): Código do idioma (pt, en, es, etc.). Padrão: auto-detect\n\n## Instalação de Dependências\n\nSe nenhuma ferramenta estiver disponível, a skill pode instalar whisper:\n\n```bash\npip install openai-whisper\n```\n\nPara whisper.cpp local:\n```bash\ngit clone https://github.com/ggerganov/whisper.cpp.git ~/whisper.cpp\ncd ~/whisper.cpp\nmake\n```\n\n## NOTAS\n\n- O formato OGG (Opus) do Telegram requer ffmpeg para conversão\n- A transcrição pode levar alguns segundos dependendo do tamanho do áudio\n- Qualidade da transcrição depende do modelo Whisper usado\n","tags":{"latest":"1.0.0"},"stats":{"comments":0,"downloads":349,"installsAllTime":13,"installsCurrent":0,"stars":0,"versions":1},"createdAt":1772024381731,"updatedAt":1778993160607},"latestVersion":{"version":"1.0.0","createdAt":1772024381731,"changelog":"- Initial release of the audio-transcription skill.\n- Transcribes audio files (OGG, MP3, WAV, M4A, and others with auto-conversion) to text using Whisper locally or via API.\n- Supports multiple languages with automatic language detection.\n- Flexible backend selection: prefers local Whisper, then whisper.cpp, then OpenAI API.\n- Includes a convenient shell script for easy audio transcription.\n- Handles Telegram OGG files and outlines simple dependency installation steps.","license":null},"metadata":null,"owner":{"handle":"clediomir","userId":"s172t9x1ejgg3cv8d1kfapvhjx84vztb","displayName":"clediomir","image":"https://avatars.githubusercontent.com/u/22421765?v=4"},"moderation":null}