Luego de que DeepSeek tomara por asalto el mundo de la Inteligencia Artificial borrando ganancias históricas de empresas como NVIDIA, ahora se sabe que el modelo corre en chips de Huawei. Y es que el modelo chino no deja de sorprender.
Se confirma que DeepSeek corre en chips de Huawei
Así, se ha confirmado que el DeepSeek R1 LLM fue entrenado en Nvidia H100, pero utiliza un chip Ascend 910C para la inferencia, que es la acción de utilizar el modelo entrenado para generar respuestas. Justamente este es el chip de Huawei. En este procedimiento, el modelo entrenado se alimenta con nuevos datos y se le pide que tome decisiones sin ejemplos del resultado deseado.
En pocas palabras, aplica los patrones aprendidos para generar contenido o tomar decisiones sobre el comando dado.
La información procede de @Dorialexander, que señala que los chips Ascend no se ocupan del entrenamiento, por lo que los requisitos de potencia de la GPU no son tan elevados. Sin embargo, el rendimiento relativamente inferior del Ascend 910C limita su idoneidad para el entrenamiento.
Huawei planea solucionar este problema con el próximo chip 920C, que pretende competir con Blackwell B200, el chipset de Nvidia líder en operaciones de IA.