🔧 Solución de Problemas (Troubleshooting)¶
Regla de Oro
Ante cualquier problema, el primer paso siempre es consultar los logs del sistema.
bash
# Ver logs en tiempo real
tail -f ~/.local/state/v2m/v2m.log
🛑 Audio y Grabación¶
No se escucha nada / Transcripción vacía¶
- Síntoma: La grabación inicia y termina, pero no se genera texto.
- Diagnóstico: Ejecuta el script de diagnóstico de audio:
- Soluciones:
- Driver de Audio: Voice2Machine usa
SoundDevice. Asegúrate de que tu sistema (PulseAudio/PipeWire) tenga un micrófono predeterminado activo. - Permisos: En Linux, tu usuario debe pertenecer al grupo
audio(sudo usermod -aG audio $USER).
Frases cortadas o incompletas¶
- Causa: El detector de silencio (VAD) es demasiado agresivo.
- Solución:
Ajusta la configuración en
config.tomlo desde la GUI: - Reduce el
threshold(ej. de0.35a0.30). - Aumenta el
min_silence_duration_ms(ej. a800ms).
🐢 Rendimiento y GPU¶
Transcripción lenta (> 2 segundos)¶
- Causa Probable: Whisper está ejecutándose en CPU en lugar de GPU.
- Verificación:
- Solución:
- Instala drivers NVIDIA actualizados (compatible con CUDA 12).
- Verifica que
config.tomltengadevice = "cuda". - Si no tienes GPU dedicada, cambia el modelo a
distil-medium.enobase.
Error CUDA out of memory¶
- Causa: Tu GPU no tiene suficiente VRAM para el modelo seleccionado.
- Solución:
- Cambia
compute_typeaint8_float16(reduce uso de VRAM a la mitad). - Usa un modelo más ligero (
distil-large-v3consume menos quelarge-v3original).
🔌 Conectividad y Demonio¶
"Connection refused" en GUI o Scripts¶
- Causa: El proceso backend (Python) no está corriendo o el puerto está ocupado.
- Solución:
- Verifica el estado:
- Si no corre, inícialo manualmente para ver errores de arranque:
- Si dice "Address already in use", mata el proceso existente:
Atajos de teclado no responden¶
- Causa: Problema de permisos o ruta incorrecta en la configuración del gestor de ventanas.
- Solución:
- Ejecuta el script manualmente en terminal:
scripts/v2m-toggle.sh. - Si funciona, el error está en tu configuración de atajos (ej. ruta relativa
~/en lugar de/home/...). - Si no funciona, verifica permisos:
chmod +x scripts/*.sh.
🧠 Errores de IA (LLM)¶
Error 401/403 con Gemini¶
- Causa: API Key inválida o expirada.
- Solución: Regenera tu clave en Google AI Studio y actualiza el archivo
.envo la variable de entornoGEMINI_API_KEY.
"Connection refused" con Ollama¶
- Causa: El servidor de Ollama no está corriendo.
- Solución: Ejecuta
ollama serveen otra terminal.