Según los últimos datos publicados a principio de 2019, más de 4.300 millones de personas en el mundo están conectadas a internet, lo que supone un incremento de casi un 10% respecto del año anterior.
Asimismo, los usuarios únicos de móviles superan los 5.000 millones (en torno a un 67% de la población mundial) y más de 3.400 millones de personas usan con asiduidad las redes sociales.
En este contexto, la cantidad de información generada continua aumentado cada año, llegando a alcanzar los 33 zettabytes (33.000 millones de terabytes) en el 2018. Sin embargo, este dato se queda en nada comparado con los más de 2.000 zettabytes que se generarán en 2035 según el estudio Digital Economy Compass de Statista.
Ante esta perspectiva aparece el Big Data, capaz de gestionar este gran volúmen de datos, para posteriormente analizarlos y sacar información que es de enorme interés para las empresas.
Uno de los pilares más importantes del Big Data son las bases de datos, que pueden ser de distintos tipos, entre las que destacan las bases de datos relacionales y las no relacionales. En este artículo nos centraremos en las primeras, las más utilizadas actualmente, y estudiaremos si este tipo de base de datos tienen las características necesarias para su uso en el Big Data.
¿En qué consisten las bases de datos relacionales?
Una base de datos relacional es aquella en la que los datos se relacionan unos con otros mediante tablas y vínculos que sirven de puentes entre las distintas tablas, lográndose de esta manera la descomposición de la información.
Este tipo de bases de datos están basadas en un lenguaje estándar conocido como SQL (Structured Query Language). Su gran ventaja reside en la capacidad de relacionarse entre sí sin la necesidad de duplicar una gran cantidad de información.
Bases de datos relacionales y Big Data: ¿son compatibles?
Tal y como hemos comentado anteriormente, en las bases de datos relacionales los datos se almacenan con una relación definida sobre una estructura basada normalmente en tablas que contienen filas y columnas.
Los principales problemas a los que se enfrentan las bases de datos relacionales con el Big Data son los siguientes:
- No son flexibles y por lo tanto no están diseñadas para posibles cambios.
- Tienen problemas para manejar datos heterogéneos.
- Su diseño no está optimizado para realizar labores operativas y de análisis, resultando ineficientes.
- No están preparadas para el desarrollo de aplicaciones modernas debido a que estas recurren a lenguajes de programación orientados a objetos.
Sin embargo, estos problemas a los que se enfrentan las bases de datos SQL (o bases de datos relacionales) no implica su desaparición, sin embargo, las Bases de Datos no relacionales se adaptan mejor al entorno Big Data, lo que significa que serán cada vez más utilizadas.
Además, gracias al avance en el uso de las bases de datos no relacionales será posible combinarlas con las bases de datos relacionales para determinadas aplicaciones.
Lo que es un hecho es que los próximos años van a estar marcados por la generación continua de datos, su manejo y el posterior análisis.