VaultGemma: el modelo de lenguaje más avanzado con privacidad diferencial

La IA hoy en día está en todas partes, desde tu propio smartphone, el televisor, o la misma lavadora; de hecho, hasta las mismas redes de telefonía son gestionadas por IA. Este crecimiento implica que los modelos no solo deban ser potentes, sino que además estén diseñados con privacidad diferencial, lo que asegura que la información sensible quede protegida desde el inicio.

Con ese objetivo, Google Research presentó VaultGemma, un modelo de lenguaje de gran escala (LLM) entrenado desde cero con privacidad diferencial (DP, por sus siglas en inglés). Este enfoque marca un cambio importante, porque asegura que el modelo procese datos sin exponer detalles sensibles ni memorizar ejemplos específicos.

La Revolución de la IA: Modelos de Lenguaje de Gran Tamaño (LLM) explicados

¿Qué es y cómo funciona la privacidad diferencial en modelos de lenguaje?

La privacidad diferencial es una técnica que agrega un ruido matemático, una especie de constante, al modelo cuando realiza cálculos mientras es entrenada. La idea que plantea Google, es que con este subterfugio matemático, es disfrazar la información, de modo que no pueda ser rastreable un dato particular de la data inicial.

Entendamos la idea con este ejemplo: hay un coro de personas cantando (data inicial) y, desde luego, cada persona tiene un timbre único que representaría un dato particular. Lo que propone la gran G, es incorporar un leve ruido a cada voz, de modo que no sea factible reconocer la voz de cada cantante; sin embargo, el resultado final del grupo (coro cantando), transmite la esencia de la canción sin exponer quién cantó qué nota.

Con esto es factible garantizar que las respuestas que da el modelo, no muestre información delicada a partir de lo que aprendió al ser entrenada.

Por otra parte, esta técnica tiene dos problemas:

Exige más recursos de cómputo
Mayores lotes de datos más grandes

Esto se puede comparar con atender una videollamada en un café lleno de gente. Es posible seguir la conversación, pero el ruido obliga a concentrarse más y demanda un esfuerzo adicional para lograrlo.

Estructura de las leyes de escalamiento con privacidad diferencial. Se observa cómo los presupuestos de cómputo, privacidad y datos interactúan para estimar la pérdida de entrenamiento. | Créditos: Google Reasearch

Escalamiento: cómo influyen el cómputo, los datos y la privacidad

Los investigadores desarrollaron leyes de escalamiento para entender cómo se relacionan tres elementos en el entrenamiento de modelos con privacidad diferencial:

Cómputo disponible,
Cantidad de datos
El nivel de privacidad aplicado.

Dentro de este marco aparece la relación ruido-lote, un concepto central que mide cuánto y cómo el ruido agregado en comparación con el tamaño de los lotes de datos. Sus efectos se pueden resumir así:

Con lotes pequeños, el ruido domina el aprendizaje y el modelo tiene más dificultad para captar patrones.
Con lotes grandes, el ruido se diluye y el modelo logra identificar regularidades con mayor claridad.

Relación entre el presupuesto de privacidad (epsilon) y el presupuesto de cómputo (tamaño de lote). El gráfico muestra que aumentar solo uno de los dos ofrece beneficios decrecientes, mientras que combinarlos entrega mejoras consistentes y más estables. | Créditos: Google Research

Imagina que tiene un vaso y un gran balde con agua, ¿qué ocurre con el sabor del agua en cada caso al verterle una cucharadita de sal a cada uno?

El sabor del vaso con agua, lo más probable es que sea salado.
En el caso del balde, al ser tan grande, esa cuchara no le va a cambiar el sabor.

Si llevamos esta idea al entrenamiento de los LLM al agregar un pequeño ruido (sal) a un conjunto de datos por lotes (balde con agua), no debería verse afectado, controlando el impacto del ruido en el entrenamiento.

Configuraciones óptimas, resultados prácticos y rendimiento comparativo

Los experimentos mostraron que entrenar con privacidad diferencial requiere ajustar prioridades:

No conviene centrarse en aumentar el tamaño del modelo.
Lo más eficiente es usar un modelo más pequeño con lotes mucho más grandes.
Este enfoque equilibra mejor los recursos y compensa la interferencia del ruido agregado.

Pérdida de entrenamiento predicha en función de iteraciones, tamaño de lote y tamaño del modelo. Los gráficos muestran cómo optimizar la configuración según el presupuesto disponible. | Créditos: Google Research.

VaultGemma fue evaluado frente a otros modelos y los resultados arrojaron lo siguiente:

Su contraparte no privada, Gemma3 1B, tuvo un rendimiento muy parecido.
Frente al modelo más antiguo GPT-2 1.5B, VaultGemma mostró una utilidad equivalente a la de modelos no privados de hace cinco años.
Estos hallazgos validan que la privacidad diferencial puede aplicarse sin eliminar la utilidad práctica de los modelos.

Con estos números, se puede suponer que VaultGemma logra un equilibrio: mantiene niveles de rendimiento cercanos a modelos no privados de años anteriores, pero con certezas claras en cuanto a seguridad de datos.

Comparación de desempeño entre VaultGemma 1B (con privacidad diferencial), Gemma3 1B (sin privacidad) y GPT-2 1.5B en distintos benchmarks académicos. | Créditos: Google Reaserch

Conclusiones del estudio

El desarrollo de VaultGemma permite extraer varios aprendizajes:

Es posible entrenar modelos grandes con privacidad diferencial sin perder toda su utilidad práctica.
El modelo alcanza un rendimiento comparable a modelos no privados de hace cinco años.
Se confirma que los lotes grandes y modelos más pequeños son más eficientes en contextos con privacidad diferencial.
Los resultados validan las leyes de escalamiento propuestas, que orientan la distribución de recursos de cómputo, datos y privacidad.
Aún existe una brecha de rendimiento frente a los modelos no privados más recientes, pero la investigación muestra un camino para reducirla.
VaultGemma establece una base sólida para futuros sistemas que busquen combinar potencia, seguridad y respeto por los datos.

WhatsApp agrega nuevas funciones dedicadas para los grupos

POCO lanza en Chile la nueva Serie POCO M8

RayNeo Air 4 Pro debutan con las primeras pantallas AR HDR10 del mundo #CES2026

Primeras impresiones del nuevo ecosistema de accesorios de Motorola #CES2026

Primeras Impresiones del Motorola Razr Fold #CES2026

Primeras Impresiones del Motorola Signature #CES2026

El iPad mini 8 podría llegar con el chip A20 Pro

Filtran más detalles del próximo iPhone plegable que se espera para el 2026

Xiaomi estaría desarrollando un smartphone delgado y con una batería de 10.000 mAh

Hiram Monroy de AMD: «La colaboración es el habilitador central de la IA»

Nicolás Cánovas de AMD: “La IA no es una carrera de 100 metros, es un Ironman y apenas estamos empezando”

[Video] Conversamos con Elías Inostroza de Samsung Chile sobre el nuevo Galaxy Z Flip7 y Galaxy S25 FE y su alianza con Pokémon GO

¿Qué esperar de Samsung en #CES2026 y qué presentará para consumidores?

Qué es Q-Symphony y cómo puedes usarlo en tu televisor y barra de sonido Samsung

¿Cuándo me toca MagicOS 10 de HONOR? Estos son los dispositivos compatible

PlayStation 6 y futura Xbox podrían retrasarse por la escasez y alza de precio de la RAM

Stardew Valley se actualiza y llega oficialmente con su versión para la Nintendo Switch 2

Sorteo Ghost of Yotei: revisamos la Collector’s Edition y regalamos el juego

VaultGemma: el modelo de lenguaje más avanzado con privacidad diferencial

¿Qué es y cómo funciona la privacidad diferencial en modelos de lenguaje?

Escalamiento: cómo influyen el cómputo, los datos y la privacidad

Configuraciones óptimas, resultados prácticos y rendimiento comparativo

Conclusiones del estudio

HONOR Win y HONOR Win RT son presentados oficialmente con batería de nada menos que 10.000 mAh

Osmo FrameTap: un nuevo accesorio de DJI llegaría junto a la Osmo Pocket 4

La nueva TV Micro LED de 140 pulgadas de Samsung presenta biseles muy reducidos en #CES2026

Llegan oficialmente los nuevos Moto Buds Bass a Chile con un precio de CLP $39.990

Samsung prepara cambios en las cámaras de la serie Galaxy S26, y One UI 8.5 nos entregó las claves

VaultGemma: el modelo de lenguaje más avanzado con privacidad diferencial

¿Qué es y cómo funciona la privacidad diferencial en modelos de lenguaje?

Escalamiento: cómo influyen el cómputo, los datos y la privacidad

Configuraciones óptimas, resultados prácticos y rendimiento comparativo

Conclusiones del estudio

Suscríbete