🕹️ Guía Rápida¶
Resumen Ejecutivo
Voice2Machine tiene dos superpoderes: Dictado (Voz → Texto) y Refinado (Texto → Mejor Texto).
Esta guía visual te ayuda a entender los flujos de trabajo principales para que seas productivo en minutos.
1. Flujo de Dictado (Voz → Texto)¶
Ideal para: Escribir correos, código o mensajes rápidos sin tocar el teclado.
- Foco: Haz clic en el campo de texto donde quieres escribir.
- Activa el atajo (Configurable, por defecto ejecutando
v2m-toggle.sh). Escucharás un sonido de inicio 🔔. - Habla claramente. No te preocupes por ser un robot, habla natural.
- Pulsa el atajo de nuevo para detener. Escucharás un sonido de fin 🔕.
- El texto se pegará automáticamente en tu campo activo (o quedará en el portapapeles si la auto-escritura está desactivada).
flowchart LR
A((🎤 INICIO)) -->|Grabar| B{Whisper Local}
B -->|Transcribir| C[📋 Portapapeles / Pegado]
style A fill:#ff6b6b,stroke:#333,stroke-width:2px,color:white
style B fill:#feca57,stroke:#333,stroke-width:2px
style C fill:#48dbfb,stroke:#333,stroke-width:2px
2. Flujo de Refinado (Texto → IA → Texto)¶
Ideal para: Corregir gramática, traducir o dar formato profesional a un borrador sucio.
- Selecciona y Copia (
Ctrl + C) el texto que quieres mejorar. - Activa el atajo de IA (ejecutando
v2m-llm.sh). - Espera unos segundos (la IA está pensando 🧠).
- El texto mejorado reemplazará el contenido de tu portapapeles.
- Pega (
Ctrl + V) el resultado.
flowchart LR
A[📋 Texto Original] -->|Copiar| B((🧠 ATAJO IA))
B -->|Procesar| C{Local LLM / Gemini}
C -->|Mejorar| D[✨ Texto Pulido]
style A fill:#c8d6e5,stroke:#333,stroke-width:2px
style B fill:#5f27cd,stroke:#333,stroke-width:2px,color:white
style C fill:#feca57,stroke:#333,stroke-width:2px
style D fill:#1dd1a1,stroke:#333,stroke-width:2px
💡 Consejos Pro¶
!!! tip "Mejora tu Precisión" - Habla fluido: Whisper entiende mejor el contexto de frases completas que palabras sueltas. - Hardware: Un micrófono con cancelación de ruido mejora drásticamente los resultados. - Configuración: Puedes ajustar la "temperatura" del LLM en la configuración para hacerlo más creativo o más literal.
Privacidad Garantizada
El Dictado es 100% local (ejecutado en tu GPU). El Refinado puede ser local (Ollama) o nube (Gemini), tú tienes el control total en la configuración.