Síguenos en Google News
Alejandro Pacheco (derecha) junto a quienes presidieron la conferencia CPM 2025 en Milán, Italia. | Créditos: Universidad de Chile.

Investigador chileno recibe premio internacional por resolver desafío en compresión de datos

La U. de Chile anunció que la CPM reconoció a Alejandro Pacheco —investigador del Centro de Biotecnología y Bioingeniería (CeBiB) y estudiante de doctorado en Ciencias de la Computación en la misma universidad— por resolver un problema abierto desde 2020 en el área de compresión de datos y estructuras de datos.

Su trabajo permite realizar análisis directamente sobre datos comprimidos, sin necesidad de descomprimirlos, lo que representa un avance relevante para áreas como la bioinformática y el procesamiento de información a gran escala.

El reconocimiento se entregó durante la conferencia internacional Combinatorial Pattern Matching (CPM 2025), uno de los encuentros más importantes en el área de análisis de patrones y estructuras de datos, realizada en junio en Milán, Italia.

El paper premiado se titula Counting on General Run-Length Grammars, propone un algoritmo capaz de contar patrones en textos comprimidos sin necesidad de descomprimirlos.

Expositores presentes en la CPM 2025 | Créditos: Universidad de Chile.

¿Por qué fue premiado su avance en compresión de datos en CPM 2025?

El premio reconoció una solución concreta a un problema que seguía abierto desde hace 5 años. El trabajo presenta el primer algoritmo que permite buscar y contar patrones directamente en textos comprimidos, sin necesidad de descomprimirlos.

Esta capacidad representa un cambio importante para el análisis de información a gran escala. Permite trabajar con colecciones genómicas o archivos de texto extensos de forma mucho más eficiente, reduciendo tiempos de procesamiento y uso de recursos computacionales, así lo detalló Gonzalo Navarro, uno de los autores del paper:

“Una RLCFG puede representar una colección genómica en 10 a 100 veces menos que su espacio original, permitiendo así manipularlas en computadores mucho más accesibles, transferirlas en mucho menos tiempo, y adicionalmente responder preguntas de interés bioinformático”.

Gonzalo Navarro, investigador principal del CeBiB

Alejandro Pacheco desarrolló el paper junto a Gonzalo Navarro, donde proponen una solución a un problema teórico planteado hace cinco años. Hasta ahora, no existía un método eficiente para contar patrones sobre este tipo específico de compresión basada en gramáticas.

“Desarrollamos el primer algoritmo que puede contar cuántas veces aparece un patrón en textos comprimidos sin necesidad de descomprimirlos completamente. Es como poder contar palabras directamente en las cajas comprimidas”.

Alejandro Pacheco, investigador del CeBiB y estudiante de doctorado en la Universidad de Chile

El algoritmo identifica patrones directamente en estructuras comprimidas, lo que representa una de sus principales ventajas. Para ilustrar cómo funciona, la siguiente imagen muestra un árbol gramatical junto a una grilla de búsqueda que permite localizar un patrón sin descomprimir el texto original.

Figura 1 – Representación del algoritmo aplicado al texto “abradabracadabra” Compresion de datos
Figura 1 – Representación del algoritmo aplicado al texto “abradabracadabra”. El árbol de la izquierda muestra la compresión gramatical del texto, con ocurrencias del patrón “abra” marcadas en gris. La grilla de la derecha permite buscar ese patrón de forma eficiente sin descomprimir, separándolo en “a” y “bra”. | Imagen extraída del artículo Counting on General Run-Length Grammars, presentado por Alejandro Pacheco y Gonzalo Navarro en CPM 2025

Además del aporte científico, el reconocimiento también destaca la proyección internacional del investigador y el impacto de este tipo de estudios para Chile. En esa línea, Gonzalo Navarro valoró el premio recibido en CPM 2025:

“Este premio es muy importante para la futura carrera de un estudiante, pues le da visibilidad internacional a él y a su trabajo. Por eso es una gran noticia para nosotros, para nuestro programa de doctorado, y para el CeBiB, que permite sustentar este tipo de investigación”.

Gonzalo Navarro, investigador principal del CeBiB.

Los Fondos Basales para Centros Científicos y Tecnológicos de Excelencia FB0001 de Mideplan, el proyecto Fondecyt 1-230755 y el programa Becas Chile de Doctorado de ANID financiaron este trabajo.

Síguenos en Google News