Glosario¶

Este glosario define términos técnicos y de dominio utilizados en Voice2Machine.

Términos Generales¶

Local-First¶

Filosofía de diseño donde los datos (audio, texto) se procesan y almacenan exclusivamente en el dispositivo del usuario, sin depender de la nube.

Daemon¶

Proceso en segundo plano (escrito en Python) que gestiona la grabación, transcripción y comunicación con el frontend.

API REST¶

Mecanismo de comunicación entre el Daemon (Python) y los clientes (scripts, frontends). Utilizamos FastAPI con endpoints HTTP estándar y WebSocket para eventos en tiempo real.

Componentes Técnicos¶

Whisper¶

Modelo de reconocimiento de voz (ASR) desarrollado por OpenAI. Voice2Machine utiliza faster-whisper, una implementación optimizada con CTranslate2.

Workflows (Flujos de Trabajo)¶

Componentes especializados de coordinación que gestionan el ciclo de vida completo de una tarea específica (ej: RecordingWorkflow, LLMWorkflow). Reemplazan al antiguo "Orchestrator" monolítico para una mejor trazabilidad y mantenibilidad.

Features (Características)¶

Módulos autocontenidos que agrupan la lógica de dominio y sus adaptadores de infraestructura (audio, llm, transcripción). Representan las capacidades core del sistema.

BackendProvider¶

Componente del frontend (React Context) que gestiona la conexión con el Daemon y distribuye el estado a la UI.

TelemetryContext¶

Sub-contexto de React optimizado para actualizaciones de alta frecuencia (métricas de GPU, niveles de audio) para evitar re-renderizados innecesarios de la UI principal.

Arquitectura Modular¶

Evolución de la Arquitectura Hexagonal que organiza el código en torno a módulos de negocio (Features) y flujos de ejecución (Workflows), minimizando el acoplamiento y maximizando la claridad.