Síguenos en Google News
Running Guide - DeepMind

Google DeepMind presenta Running Guide, un asistente de IA para corredores ciegos o con baja visión

Google DeepMind presentó Running Guide, un asistente de accesibilidad que busca orientar a corredores ciegos o con baja visión mediante comprensión del entorno en tiempo real. El sistema usa un Pixel 10 Pro montado en el pecho para analizar la ruta y entregar instrucciones auditivas, sin depender de líneas físicas en la pista ni de guías humanos.

Running Guide: Arquitectura híbrida y procesamiento local con Gemma 4

El requisito de seguridad exige baja latencia y funcionamiento confiable sin depender de una conexión móvil, de ahí que la base del proceso sea con el modelo local Gemma4.

Running Guide combina un modelo de segmentación que corre sin conexión en el Pixel 10 Pro con una ruta de razonamiento multimodal basada en Gemma 4 E4B, también ejecutada en el dispositivo.

El modelo entrega alertas inmediatas de detención y guías de dirección mediante sonidos direccionales, mientras que Gemma 4 E4B analiza entradas de imagen y texto para interpretar cambios relevantes del entorno. Para reducir latencia y consumo, el sistema no procesa todos los fotogramas, sino que selecciona aquellos con mayor variación, como cambios bruscos de terreno o aparición de obstáculos.

Esquema técnico de Running Guide, con entradas de video y audio, análisis local en el Pixel 10 Pro, agentes especializados y salida mediante audio espacial y asistencia por voz. | Créditos: Google DeepMind.

Coordinación inteligente mediante tres agentes especializados

El funcionamiento de Running Guide se apoya en tres agentes especializados que coordinan la planificación previa, la asistencia durante la carrera y la gestión de pausas. Esta división permite que el sistema entregue instrucciones según el momento del entrenamiento, sin mezclar alertas críticas con acciones de preparación o descanso.

1. Agente de pausas: Permite que el atleta interrumpa la actividad física y retome la sesión cuando lo necesite, sin cortar la continuidad del guiado ni perder el registro del avance.

2. Agente planificador: Usa llamadas a funciones de Gemma 4 para consultar Google Maps y datos meteorológicos, dialogar con el corredor, definir objetivos del entrenamiento y calibrar la línea de partida digital.

3. Agente de asistencia en carrera: Entrega avisos verbales breves durante el recorrido, con una jerarquía que prioriza peligros inmediatos, luego obstáculos o corredores cercanos y, finalmente, alertas de menor riesgo como curvas próximas.

Transición hacia lentes inteligentes y desarrollo colaborativo

El soporte inicial usa el Pixel 10 Pro montado en el pecho del corredor, pero Google DeepMind también prueba Running Guide en lentes inteligentes.

La idea es aprovechar cámaras integradas para obtener un campo visual más amplio y estable, con transmisión directa al teléfono Pixel donde se procesa la información.

Vista del corredor a través de lentes inteligentes, una alternativa que Google DeepMind prueba para ampliar y estabilizar la captura visual de Running Guide. | Crédito: Google DeepMind.

El desarrollo también contempla pruebas con SG Enable, agencia de Singapur enfocada en discapacidad e inclusión. Según Google, esa colaboración conecta a los equipos de ingeniería con corredores ciegos o con baja visión para ajustar el diseño a condiciones reales de uso.

Google no entrega una fecha de disponibilidad para Running Guide. El interés se enfoca en la combinación de visión por cámara, razonamiento multimodal, procesamiento local y audio espacial para una tarea donde la latencia puede afectar directamente la seguridad.

Síguenos en Google News