Skip to content

Glosario

Este glosario define términos técnicos y de dominio utilizados en Voice2Machine.

Términos Generales

Local-First

Filosofía de diseño donde los datos (audio, texto) se procesan y almacenan exclusivamente en el dispositivo del usuario, sin depender de la nube.

Daemon

Proceso en segundo plano (escrito en Python) que gestiona la grabación, transcripción y comunicación con el frontend.

API REST

Mecanismo de comunicación entre el Daemon (Python) y los clientes (scripts, frontends). Utilizamos FastAPI con endpoints HTTP estándar y WebSocket para eventos en tiempo real.

Componentes Técnicos

Whisper

Modelo de reconocimiento de voz (ASR) desarrollado por OpenAI. Voice2Machine utiliza faster-whisper, una implementación optimizada con CTranslate2.

Workflows (Flujos de Trabajo)

Componentes especializados de coordinación que gestionan el ciclo de vida completo de una tarea específica (ej: RecordingWorkflow, LLMWorkflow). Reemplazan al antiguo "Orchestrator" monolítico para una mejor trazabilidad y mantenibilidad.

Features (Características)

Módulos autocontenidos que agrupan la lógica de dominio y sus adaptadores de infraestructura (audio, llm, transcripción). Representan las capacidades core del sistema.

BackendProvider

Componente del frontend (React Context) que gestiona la conexión con el Daemon y distribuye el estado a la UI.

TelemetryContext

Sub-contexto de React optimizado para actualizaciones de alta frecuencia (métricas de GPU, niveles de audio) para evitar re-renderizados innecesarios de la UI principal.

Arquitectura Modular

Evolución de la Arquitectura Hexagonal que organiza el código en torno a módulos de negocio (Features) y flujos de ejecución (Workflows), minimizando el acoplamiento y maximizando la claridad.