Financial Times informó que Google puso límites al uso de sus modelos Gemini por parte de Meta, después de que la compañía solicitara más capacidad de cómputo de la que el grupo podía entregar. La restricción sigue vigente y ha retrasado algunos proyectos internos de IA en Meta, según fuentes del medio.
Meta reduce el consumo de tokens mientras Google enfrenta presión por infraestructura
La limitación de hardware llevó a Meta a pedir a sus equipos un uso más eficiente de tokens, las unidades que miden el uso de modelos de IA. La medida afecta a una compañía que ha usado Gemini en procesos internos de seguridad, atención al cliente, soporte publicitario, flujos de trabajo y programación.
La demanda por inferencia, es decir, por ejecutar modelos ya entrenados en servicios reales, está presionando chips, centros de datos y suministro eléctrico incluso entre empresas que invierten decenas de miles de millones de dólares en infraestructura.
Sundar Pichai, CEO de Google, ya había reconocido esa restricción en la presentación de resultados del primer trimestre. El ejecutivo señaló que la unidad de nube de la compañía habría crecido más si Google hubiera podido responder a toda la demanda disponible.
«Obviamente, estamos limitados por la capacidad de cómputo en el corto plazo. Y, como ejemplo, nuestros ingresos de Cloud habrían sido mayores si hubiéramos podido satisfacer la demanda».
Sundar Pichai, CEO de Google
Google también ha buscado capacidad adicional fuera de su propia red, en Tabulado se indicó que la empresa firmó este mes un acuerdo de US$920 millones mensuales para arrendar capacidad de cómputo a SpaceX, mientras Anthropic cerró un acuerdo similar el mes pasado.
Meta, que no tiene un negocio de nube como Google, depende de infraestructura propia y de modelos externos mientras desarrolla sus sistemas de IA. La compañía comenzó a priorizar Muse Spark en algunos usos internos, un modelo que varias personas citadas por el medio consideran más competitivo frente a Gemini.

