Qué es el Big Data y porqué es importante

Muchas veces hemos escuchado el término “Big Data”, y si bien de su nombre podemos tener una clara idea sobre lo que se trata, no necesariamente sabemos sobre lo que realmente es y lo que implica dentro de este mundo interconectado.

El Big Data es, justamente, una gran cantidad de datos y archivos. Sin embargo, no nos referimos a un gran cúmulo de archivos almacenados en un disco duro de un terabyte, sino que estamos hablando de cientos de teras o petabytes, incluso más, un volumen datos casi absurdo para todos nosotros.

Pero el Big Data es una cuestión que desde los inicios de la internet se maneja con mucha importancia, especialmente en el ámbito del desarrollo de varias áreas, incluyendo tecnología, gobiernos, marketing, etcétera.

El Big Data, simplificado

Tal y como mencionamos al principio, Big Data es básicamente una cantidad grande de datos. Estos conjuntos de datos masivos tienen la “gracia” de que, debido a su excelso volumen, no son fáciles de almacenar, gestionar y procesar. De hecho, aún con una computadora con lo último en especificaciones técnicas de punta, el procesar estos datos sería una tarea prácticamente imposible.

Es por esto que la gestión se realiza muchas veces a través de diversos sistemas como Haddoop, NoSQL, Map Reduce u otros basados en la nube.

Estos datos son caracterizados con diversas cualidades, siendo las más importantes:

  1. Volumen: Cuántos datos son generados, guardados, analizados y procesados. Usualmente sigue la regla de “mientras más, mejor”.
  2. Variedad: Hace referencia a los tipos de datos que se tienen a disposición. Pueden ser estructurados (como transacciones, llamados, pagos, etcétera), semiestructurados (hojas de cálculo, por ejemplo) y no estructurados (imágenes, videos, archivos PDF, etcétera).
  3. Velocidad: Se cuantifica la velocidad a la que estos datos se procesan y analizan.

Los puntos anteriores se conocen como “las tres V”, aunque hay otras dos “V” que han cobrado fuerza. En primer lugar, está la veracidad de estos datos, y tal como su nombre lo dice, hace referencia a la confianza o el grado de verdad de estos. El segundo es el valor, y en el fondo hace referencia más que todo al nivel de utilidad de estos datos.

Las fuentes de obtención de estos datos pueden ser muy variados. Por ejemplo, los mismos usuarios de teléfonos móviles generan una enorme cantidad de datos que las empresas almacenan: cantidad de horas en videos subidos a YouTube en un día, cantidad de publicaciones en Instagram, etcétera.

Todos estos datos son recopilados por las empresas prácticamente en una dosis diaria. Son varios cientos de terabytes de información capturada que posteriormente puede ser utilizada para distintas cosas que a continuación relataremos.

Análisis y aplicaciones del Big Data

El análisis de todos estos datos masivos permite la obtención de información bastante valiosa para las empresas. Estos incluyen: análisis de textos, realizar predicciones en base a ciertos patrones encontrados en estos datos, agrupación de información según tópicos o similitudes, entre otros. Todo esto tiene como fin el mejorar la fiabilidad de las respuestas que pueden ser entregadas a problemas que requieran o que pueden ser tratadas con Big Data.

Pero, ¿cuáles son sus aplicaciones o usos?. Esta es una respuesta muy variada, pues se puede vincular a diversas áreas.

Por ejemplo, el uso de Big Data en el mundo de la tecnología permite mejorar el desarrollo de sistemas de inteligencia artificial y machine learning – dos tópicos que tocaremos más adelante –, ya que de esto se pueden crear modelos de aprendizaje automático.

También se puede aplicar en el mundo de los negocios. Como se mencionó anteriormente, el análisis de estos datos permite generar predicciones en base a diversos patrones que se pueden encontrar, por lo que puede resultar útil para predecir movimientos en la bolsa bursátil. De igual manera, se puede utilizar para la creación de productos o servicios nuevos, en base a, por ejemplo, los comentarios de X cantidad de usuarios en Y red social.

En el caso del área de la salud, tecnologías como Apple Healthkit o Google Fit, recopilan información que permiten a las empresas realizar estudios masivos encontrando patrones de salud de varias personas, y así enviar dichos datos para poder encontrar anomalías que se encuentren dentro de estos patrones.

La astronomía y la ciencia en general, generan grandes cantidades de datos. Planet Hunters es un proyecto que utiliza los datos recopilados por el Satélite de Sondeo de Exoplanetas en Tránsito (TESS, por sus siglas en inglés), para que ciudadanos comunes puedan ayudar a descubrir nuevos planetas que estén fuera de nuestro Sistema Solar.

La política y el gobierno también se pueden nutrir de Big Data en un mundo ideal. Al igual que en el caso anterior, se pueden crear políticas públicas utilizando estos datos recopilados de redes sociales. Otras áreas beneficiadas pueden ser: la seguridad, el automovilismo, el periodismo, los medios, y un largo etcétera.

Por supuesto que uno de sus principales usos es el de visualizar datos y estadísticas como tal. Con la información correctamente ordenada, se pueden obtener tablas o infografías bastante certeras en cuanto a la veracidad de sus datos.

Con todo esto, nos damos cuenta de porqué el mundo de los datos masivos ha cobrado tanta importancia. Su polivalencia hace que se convierta en una herramienta sumamente importante para crear nuevas soluciones a problemas o desafíos que se van presentando en las diversas industrias y áreas del mundo.

Las principales empresas tecnológicas, como Microsoft, IBM, Dell, entre otras, año a año invierten más en cuanto a Big Data se refiere. Esto es: administración, procesamiento y análisis de los datos que las compañías obtienen, una clara muestra de cómo los datos y la información en general han pasado a dominar a este mundo cada vez más digitalizado.

Con información de: 1 | 2 | 3