El futuro del SQL: ¿Sigue siendo relevante en 2021?

No hay desarrollador ni analista de datos que desconozca los beneficios del SQL, un lenguaje de computación diseñado para trabajar conjuntos de datos y relaciones existentes entre ellos. No obstante, a menudo se obvia que el SQL pasó a ser el lenguaje estrella de los sistemas de gestión de bases de datos relacionales a finales de los 70, convirtiéndose en uno de los lenguajes de computación más antiguos que seguimos usando hoy en día.

El SQL nos permite, desde hace más de cuarenta años, trabajar con volúmenes de datos impensables para las tradicionales hojas de cálculo; un lenguaje primordial para hacer filtros y combinaciones de tablas de datos según las necesidades de cada usuario. Sin embargo, ahora que nuestra sociedad parece estar en un continuo proceso de aprendizaje automático, muchos se preguntan cómo de relevante sigue siendo el SQL.

Está claro que hoy en día los datos vienen en muchos formatos distintos, ya no son sinónimo de bases de datos relacionales, y en este panorama, es normal preguntarse qué espacio ocupa SQL. ¿Sigue valiendo la pena dominar este lenguaje? ¿Ha ido el auge de la Inteligencia Artificial en contra de estas herramientas? ¿Serán los lenguajes NoSQL la única solución a la altura de la big data?

SQL PARA DATA SCIENCE

Con el creciente auge de plataformas de analítica de datos, está claro que los data scientists se tienen que adaptar a los tipos de bases de datos de cada cliente para extraer la información pertinente. No obstante, cabe destacar que SQL sigue teniendo un peso monumental en la mayoría de las empresas, pues sirve como complemento sustancial a la hora de ordenar y estructurar datos.

Esto gana especial relevancia en el caso de las grandes empresas que, para realizar un informe, requieren de la manipulación de datos de diversas fuentes. En este marco, SQL sigue siendo el lenguaje más utilizado para crear un Data Warehouse, es decir, un repositorio unificado de todos los datos desorganizados que tiene una empresa. En este sentido, el lenguaje SQL sirve para leer datos de todos los sitios existentes, unificarlos y guardarlos en esta base de datos centralizada con el fin de manipularlos y entenderlos con mayor facilidad. Para que, desde una plataforma como Power BI, sea posible leer datos de un solo sitio, ordenarlos y analizarlos con total comodidad, el SQL sigue siendo un gran aliado.

Ahora bien, ¿qué ocurre con la big data? ¿Puede SQL soportar la lectura y el almacenaje de datos en su forma más natural y sin estructurar? Es posible que, a tal efecto, este lenguaje ya no sea suficiente, o al menos así se intuye a través de la reciente y creciente popularidad de los lenguajes NoSQL.

SQL O NO SQL: ¿POR CUÁL ME DECANTO?

Como indica su nombre, el NoSQL se aleja del modelo clásico de SGBDR; estos sistemas de gestión de bases de datos no son relacionales, por lo que no requieren de lenguaje SQL para hacer consultas y no almacenan la información en estructuras fijas. Este lenguaje apareció para poder analizar de forma más cómoda los volúmenes de datos que crecen con mucha rapidez, pues permite una gran flexibilidad que el lenguaje SQL no puede ofrecer.

Entonces, ¿el futuro es NoSQL? ¿Ya no hay motivos para seguir sirviéndose del lenguaje SQL? No exactamente, pues a pesar de sus ventajas, el primer lenguaje sigue teniendo grandes limitaciones que no acaban de ceñirse a las necesidades de las grandes empresas: Mientras que el SQL cuenta con una gran variedad de herramientas para su desarrollo (fruto, sin duda, de su larga vida), el lenguaje NoSQL carece de una estandarización, lo que afecta directamente a la consistencia de la información. La falta de recursos para complementar este lenguaje, así como el hecho de que sea una opción poco segura para la integridad de los datos, hace que la mayoría de las empresas sigan confiando en el modelo estricto del SQL, que virtualmente no deja margen de error en el análisis de datos. Además, el NoSQL, a pesar de sus atractivos atributos, requiere de un mantenimiento constante, responsabilidad que cae en manos de los desarrolladores.

MIENTRAS HAYA DATOS, HABRÁ SQL

El lenguaje SQL no va a ninguna parte. Prueba de ello son los datos que, según Statista, muestran los lenguajes de programación más utilizados por developers a lo largo del 2020:

Puede que, teniendo en cuenta la velocidad a la que avanzan las nuevas tecnologías, el SQL se considere un lenguaje arcaico, no obstante, es precisamente su larga carrera la que lo ha convertido en una herramienta de confianza muy demandada para las grandes empresas.

Al final, y como nos demuestran lenguajes más recientes como NewSQL, el gran error puede ser limitarnos a ver todas estas herramientas como antagonistas o substitutas cuando, en realidad, cumplen con funciones muy distintas que pueden complementarse a la perfección tanto para sacar los datos correctos de un informe como para analizarlos.