Síguenos en Google News
Imagen vía Pexels (Abdelrahman Ahmed)

El nuevo modelo de DeepSeek se retrasa por usar chips chinos, según Financial Times

La compañía china de inteligencia artificial (IA) trabaja en el desarrollo de su nuevo modelo DeepSeek. Pero, dicho producto habría experimentado retrasos. Esos retrasos vienen por utilizar chips de Huawei ante nuevos límites impulsados por Beijing para reemplazar la tecnología estadounidense, según reporta Financial Times.

Las autoridades locales instaron a implementar semiconductores Ascend de Huawei en reemplazo de los sistemas de NVIDIA tras lanzar su primer modelo, el R1, en enero pasado. Lo anterior lo informaron tres personas familiarizadas con el asunto mantenidas en el anonimato.

Sin embargo, DeepSeek sufrió problemas técnicos persistentes durante su proceso de entrenamiento. Ello llevó a adoptar chips NVIDIA para el entrenamiento. En cambio, para la inferencia apostaron por los de Huawei. El entrenamiento abarca aprender un gran conjunto de datos por parte del modelo. La inferencia se refiere al paso de utilizar un modelo entrenado para hacer predicciones o generar una respuesta, como una consulta de chatbot.

Esos inconvenientes suponen la principal razón del retraso en su lanzamiento desde mayo pasado. A la par, refleja cómo los circuitos integrados de China aún están por detrás de los de Estados Unidos. Esto también dificulta la autosuficiencia pretendida por el país oriental.

Las autoridades chinas instaron a sus empresas utilizar alternativas fabricadas por Huawei y Cambricon, en lugar de los H20 de NVIDIA. No obstante, expertos indicaron que los componentes chinos sufren problemas de estabilidad, una conectividad entre chips más lenta y un software inferior en comparación con los productos de la firma americana.

Huawei envió un equipo de ingenieros a las oficinas de DeepSeek para ayudar a la organización a usar su chip de IA en el desarrollo del modelo R2, de acuerdo a dos fuentes. Aunque, a pesar de contar con el equipamiento, a DeepSeek le habría resultado inviable realizar una prueba de entrenamiento exitosa con chips Ascend. DeepSeek todavía colaboraría con Huawei para hacer que el modelo sea compatible con Ascend para la inferencia.

Asimismo, los reportes señalan otra cosa. El fundador Liang Wenfeng ha dicho internamente estar insatisfecho con el progreso de R2. Como consecuencia, habría presionado para dedicar más tiempo a construir un modelo avanzado, el cual pueda sostener el liderazgo de la compañía en el campo de la IA.

Ritwik Gupta, investigador de IA de la Universidad de California, Berkeley, dijo: «Los modelos son productos básicos que se pueden intercambiar fácilmente. Muchos desarrolladores utilizan Qwen3 de Alibaba, que es potente y flexible». Además, señaló que Qwen3 adoptó los conceptos centrales de DeepSeek. Eso incluye su algoritmo de entrenamiento para posibilitar que el modelo sea capaz de razonar, pero los hizo más eficientes de usar.

«Que no veamos modelos líderes entrenados en Huawei hoy no significa que no vaya a suceder en el futuro. Es cuestión de tiempo», agregó Gupta. Por su parte, DeepSeek y Huawei declinaron responder a una solicitud de comentarios.

Fuente: Financial Times

Síguenos en Google News