El fabricante Nvidia acaba de presentar dos nuevos servicios de inteligencia artificial (AI, por sus siglas en inglés) de la nube (cloud computing) para lo que denomina Modelos de Idiomas Grandes, o Grandes Modelos de Idiomas. Esa denominación deviene del inglés Large Language Model (LLM).
Los productos en cuestión son el Servicio Nvidia NeMo Large Language Model y el Servicio Nvidia BioNeMo LLM. Ambos posibilitan a los desarrolladores adaptar los LLM e implementar aplicaciones de AI personalizadas para la generación de contenido, resumen de texto, chatbots, desarrollo de código, así como estructura de proteínas y predicciones de propiedades biomoleculares, y más.
Servicio Nvidia NeMo LLM
Este servicio adapta modelos de fundación entrenados con anterioridad por medio del método aprendizaje rápido (Prompt Learning) en la infraestructura. Esta misma usa a su vez una técnica llamada p-tuning. Los desarrolladores pueden utilizar «sus propios datos de entrenamiento para personalizar modelos de base que van desde 3.000 millones de parámetros, hasta Megatron 530B, uno de los LLM más grandes del mundo», comentan desde la compañía. Megatron 530B dispone de más de 530.000 millones de parámetros.
Los desarolladores también tienen la opción de personalizar diversos casos con el mismo modelo y así generar muchos tokens de prompt diferentes. «Una vez que están listos para implementarse, los modelos ajustados se pueden ejecutar en instancias de cloud, en sistemas locales o a través de una API», agregan desde la empresa.
Con la API se proporciona acceso a los modelos T5 y GPT-3 creados con el framework Nvidia NeMo Megatron, ahora disponible en versión beta abierta. Esto admite una amplia gama de aplicaciones y requisitos de servicio multilingües. «Los líderes en las industrias automotriz, de computación, educación, atención de la salud, telecomunicaciones y otras están usando NeMo Megatron para ofrecer servicios pioneros a clientes en chino, inglés, coreano, sueco y otros idiomas», informan desde Nvdia.
Servicio BioNeMo LLM
El Servicio BioNeMo LLM suma dos nuevos modelos de idiomas BioNeMo para aplicaciones de química y biología. Proporciona soporte para datos de proteínas, ADN y bioquímica.
BioNeMo permite a los investigadores ampliar el alcance de su trabajo con modelos que contienen miles de millones de parámetros. «Estos modelos más grandes pueden almacenar más información sobre la estructura de las proteínas, las relaciones evolutivas entre los genes e incluso generar nuevas biomoléculas para aplicaciones terapéuticas», aclaran desde Nvidia.
Los servicios neMo LLM y BioNeMo y las API de cloud estarán disponibles de forma anticipada desde el próximo mes. La versión beta del framework NeMo Megatron está disponible mediante Nvidia NGC y se encuentra optimizada para ejecutarse en Nvidia DGX Foundry y Nvidia DGX SuperPOD. Asimismo, puede ejecutarse como instancias de cloud aceleradas de Amazon Web Services, Microsoft Azure y Oracle Cloud Infrastructure.
Información vía comunicado de prensa