Crédito de la imagen: openai.com

GPT-4 es oficial: el nuevo modelo de inteligencia artificial de OpenAI es multimodal

OpenAI anunció algo bastante esperado por los abocados a la inteligencia artificial (IA). La compañía lanzó GPT-4, su nuevo modelo dedicado a la IA. Se trata de un modelo de lenguaje largo/grande (large language model, LLM) combinado con el aprendizaje profundo (deep learning). Además, consta de una tecnología multimodal.

Lo de multimodal aplica por aceptar entradas de texto e imágenes. Eso sí, la salida continúa solo en texto. OpenAI advierte de su capacidad menor que los humanos. Sin embargo, en ocasiones logra “puntos de referencia académicos y profesionales”. La diferencia entre GPT-4 y su predecesor GPT-3.5 puede ser sutil. Esa distinción surge ante la complejidad. El nuevo desarrollo “es más confiable, creativo y capaz de manejar instrucciones mucho más matizadas que GPT-3.5”, informan desde OpenAI.

La organización llevó a cabo diferentes comparativas entre ambos modelos. Como ejemplo, el siguiente gráfico refleja resultados en la simulación de exámenes diseñados para humanos:

Como mencionamos al comienzo, GPT-4 es un sistema multimodal. Admite la entrada de imágenes y textos. El usuario tiene la posibilidad de especificar cualquier tarea. No obstante, la tecnología otorga solo “salidas de texto (lenguaje natural, código, etc.)”. Asimismo, OpenAI hace una aclaración al respecto: “Las entradas de imágenes siguen siendo una vista previa de la investigación y no están disponibles públicamente”.

La empresa describe haber trabajado más en profundidad durante seis meses en GPT-4. Usaron lo que sus integrantes llaman “programa de pruebas contradictorias”. Ello dio mejores resultados. Están lejos de ser perfectos, pero son mejores que antes.

Los últimos dos años OpenAI reconstruyó su labor en el aprendizaje profundo (deep learning). Para esto se asoció con el departamento de Azure. Primero aprovecharon para hacer correcciones y mejoramientos en GPT-3.5. Luego profundizaron en su avance con GPT-4.

Para ChatGPT Plus

La firma avisó del lanzamiento de la entrada de texto en GPT-4 mediante ChatGPT y su API. Como condicionante, la disponibilidad se limitará a los suscriptores a ChatGPT Plus. Quienes deseen apuntarse deben anotarse en una lista de espera. Para acceder a la API de GPT-4 también toca pasar por lista de espera. Usa la misma API de ChatCompletions que GPT-3.5-Turbo.

Habrá un límite de uso. De hecho, la compañía aclara de su capacidad “muy limitada”. Esperan ampliarla en los próximos meses. Sobre esto, OpenAI agregó:

Dependiendo de los patrones de tráfico que veamos, podemos introducir un nuevo nivel de suscripción para un uso de GPT-4 de mayor volumen. También esperamos en algún momento ofrecer una cierta cantidad de consultas GPT-4 gratuitas para que aquellos que no tienen una suscripción puedan probarlo.

A la par, la organización abrió OpenAI Evals. Este es su “marco de software para crear y ejecutar puntos de referencia para evaluar modelos como GPT-4″. Posibilita inspeccionar el rendimiento muestra por muestra. Dicha herramienta sirve para el desarrollo de sus modelos. Los usuarios pueden aplicarlo para un seguimiento del rendimiento en todas las versiones del modelo. Evals es de código abierto (open source). Admite escritura de nuevas clases para implementar una lógica de evaluación personalizada.

Por otro lado, OpenAI anticipa las limitaciones de GPT-4. Dista de ser confiable al 100%. Es más, su responsable confirma que este modelo “‘alucina’ los hechos y comete errores de razonamiento”. Su antecesor (GPT-3.5) fue punto de críticas acerca de esto. De todas formas, se ha notado mejoras de hasta el 40%.

Y a ello hay que sumarle sus posibles sesgos en resultados. Su base de datos quedó limitada a un corte temporal: septiembre de 2021. Y si bien la idea es “adelantarse” en los requisitos de las personas, puede fallar. Su predicción ha avanzado, pero dista de ser perfecta, algo ya dicho.

El nuevo Bing salió con GPT-4

Como coincidencia (?) Microsoft hizo una breve publicación en su blog de Bing. Allí confirmó que el nuevo Bing lanzado hace unas semanas ejecuta GPT-4. Sabíamos del uso de una tecnología “más avanzada” que GPT-3.5. Aunque se omitió especificar cuál desarrollo era.

Microsoft declaró el beneficio de Bing devenido de los avances implementados por OpenAI. Además, anexan sus propias actualizaciones basadas en los comentarios de la comunidad.

Fuentes: OpenAI [1]OpenAI [2]Blog de Microsoft Bing