Noticias

Google presenta ImageFX, su nueva herramienta de IA generativa para conversión de texto a imagen

Google innova en IA con ImageFX y mejora MusicFX y TextFX, transformando la generación de contenido digital.

Compartir

Google ha dado un paso adelante en la tecnología de inteligencia artificial generativa con el lanzamiento de ImageFX, una novedosa herramienta de conversión de texto a imagen. Esta herramienta destaca por su interfaz única que incluye «chips expresivos», diseñados para facilitar la experimentación creativa en el campo de la generación de imágenes.

Junto con ImageFX, Google anuncia mejoras significativas en MusicFX y TextFX. La compañía ha actualizado su modelo MusicLM, logrando una generación de música más rápida y de mayor calidad. Ahora, las canciones generadas pueden tener una duración de hasta 70 segundos. Por otro lado, TextFX ha recibido actualizaciones enfocadas en mejorar la usabilidad y la experiencia general del usuario.

Un aspecto crucial de estas innovaciones es la incorporación de SynthID, una marca de agua digital en las imágenes de ImageFX y el audio de MusicFX. Esto tiene como objetivo indicar que estos elementos son creaciones de inteligencia artificial, especialmente cuando aparecen en plataformas como la Búsqueda de Google o Chrome. Además, las creaciones de ImageFX incluirán metadatos IPTC, proporcionando más información a los usuarios sobre las imágenes generadas por IA.

Estas herramientas están ahora disponibles en AI Test Kitchen para usuarios en EE. UU., Kenia, Nueva Zelanda y Australia, aunque por el momento solo en inglés.

El modelo Imagen 2 es la base de las nuevas funciones de ImageFX. Esta tecnología no solo impulsa ImageFX, sino también nuevas opciones de IA generativa en Bard, Search, Ads, Duet AI en Workspace y Vertex AI. Google destaca que Imagen 2 es clave para producir imágenes generadas por IA de alta calidad, libres de artefactos y con mejoras en áreas previamente problemáticas.

Además, Google ha realizado inversiones significativas en la seguridad de los datos de capacitación de Imagen 2. Se han implementado barreras de seguridad para limitar resultados problemáticos, como contenido violento, ofensivo o sexualmente explícito. Esto se complementa con extensas pruebas adversas para detectar y mitigar contenidos potencialmente dañinos.

Finalmente, Google anuncia la mayor disponibilidad de Gemini Pro en Bard. Ahora disponible en más de 40 idiomas y en 230 países y territorios, Gemini Pro ofrece a usuarios de todo el mundo la posibilidad de generar imágenes en Bard en inglés de forma gratuita, incluyendo marcas de agua SynthID.

¿Qué opinas sobre las innovaciones de Google en el campo de la IA generativa y cómo impactarán estas herramientas en la creación de contenido digital?

FUENTE
Juan Andrés

Los comentarios de Disqus están cargando....