🗣️ Voice2Machine: Dictado por Voz Local¶
🎯 Propósito¶
El objetivo es simple:
Poder dictar texto en cualquier lugar del sistema operativo.
La idea es transcribir audio utilizando tu GPU local para obtener la máxima velocidad y precisión, sin importar la aplicación que estés usando (editor de código, navegador, chat, etc.).
Este proyecto transforma un script simple en una aplicación modular robusta basada en un Backend Daemon (Python), diseñada bajo Arquitectura Hexagonal para garantizar mantenibilidad, escalabilidad y privacidad absoluta.
📚 Documentación¶
La documentación está organizada para servir a diferentes necesidades:
🚀 Exploración¶
- Guía Rápida: Comienza a dictar en minutos.
- Glosario: Define términos clave como Daemon, Whisper y API REST.
🛠️ Procedimientos¶
- Instalación: Guía paso a paso para Ubuntu/Debian.
- Contribución: Cómo colaborar en el proyecto.
⚙️ Referencia¶
- Configuración: Ajusta modelos, dispositivos y comportamientos.
- Atajos de Teclado: Referencia de comandos globales.
- API REST: Documentación de endpoints HTTP y WebSocket.
- API Python: Referencia de clases y métodos del backend.
🧠 Conceptos¶
- Arquitectura: Diseño Hexagonal y componentes del sistema.
- Decisiones (ADR): Registro de decisiones técnicas importantes.
🔧 Mantenimiento¶
- Solución de Problemas: Diagnóstico y corrección de errores comunes.
- Changelog: Historial de cambios del proyecto.