Visualización de datos: ¿Cómo escoger el lenguaje de programación?

visualizacion de datos lenguajes de porgramacion

Qué lenguaje de programación utilizar depende del objetivo del proyecto.

Anteriormente revisamos herramientas para crear visualizaciones, según diferentes criterios (lee aquí). Ahora comentaremos sobre lenguajes de programación. Si bien la curva de aprendizaje es alta, los lenguajes de programación permiten gran control sobre lo que queremos lograr, tanto en el procesamiento de datos como en la representación visual.

Los lenguajes de programación dan instrucciones al computador con alto nivel de control. Existe una amplia gama de lenguajes, para muchos objetivos, unos más complejos o más flexibles, muchos de los cuales permiten la creación de gráficos y visualizaciones. Las posibilidades van desde herramientas para capturar y transformar datos hasta opciones para presentar y difundir información usando gráficos estáticos o interactivos.

Las opciones para las diferentes etapas del proceso de visualización son grandes, también para los diferentes objetivos que tengamos en mente. Entonces el asunto es cuál de estos lenguajes es más pertinente. Veamos.

Visualizaciones nuevas

¿Qué pasa cuando no encontramos representaciones que sean útiles para nuestros casos? En estas situaciones debemos recurrir a la construcción de nuestras propias maneras de visualizar, para lo cual se utilizan lenguajes de programación.

Ciertos proyectos de visualización abordan problemas que requieren aproximaciones novedosas, como por ejemplo en el campo de las humanidades digitales. Manejar lenguajes de programación permite generar visualizaciones nuevas, no estandarizadas, lo que requiere habilidades técnicas. Y tiempo.

Aquí debemos hacer la distinción entre lo que significan lenguaje de programación, IDE, y librerías. Un lenguaje de programación es un conjunto de palabras que permiten escribir instrucciones o códigos, según reglas de sintaxis, y son las instrucciones que el computador puede “entender” para realizar una tarea. Estos códigos o instrucciones requieren una especie de “cuaderno” para ser escritas, estas son las IDE, o Interface Development Environment (Entorno de programación).

Las librerías, por otro lado, son un conjunto de códigos prehechos en algún lenguaje de programación, y preempaquetados para reutilizar funciones recurrentes. Por ejemplo, para hacer un gráfico de barras no necesitamos programarlo todo desde cero, sino que escribimos un código simple y le pasamos los datos, así de sencillo.

Lenguajes de programación

La variedad es muy amplia, nos centraremos en los más conocidos. Lenguajes como R y Python son ampliamente usados en Data Science principalmente para el análisis de datos. Para web, existen librerías implementadas en JavaScript, como ChartsJS o D3JS. A continuación un breve resumen de algunas de los lenguajes y sus librerías más usadas.

1. RProject: Es un lenguaje pensado para computación estadística y creación de gráficos, de uso gratuito. Un entorno para el desarrollo de proyectos es RStudio, que Incluye una consola y editor para la escritura y ejecución de código, así como numerosas paquetes para la creación de gráficos.

2. Python: Es un lenguaje de programación muy popular y reconocido por su simpleza y la elegancia de su sintaxis, haciéndolo fácil de usar y leer. Muy potente para el análisis de datos. También posee una serie de librerías para visualización, como Matplotlib y Seaborn.
Matplotlib: Es una librería para gráficos 2D con una variedad de gráficos prehechos, estáticos e interactivos, permite una gran adaptabilidad de sus gráficos.
Seaborn: Librería para gráficos estadísticos, construida sobre Matplotlib, muy integrado con Pandas (librería de Python para manejar datos), también posee una sintaxis algo más simple.

3. JavaScript: Abreviado como JS, es un lenguaje de programación que viene incorporado en los navegadores para internet, siendo muy utilizado en web para el desarrollo de interfaces dinámicas, dada su natural integración con HTML (estructura) y CSS (presentación). Es un lenguaje que permite crear visualizaciones desde cero, también se han desarrollado librerías que facilitan la creación de gráficos, como ChartJS o D3JS.
ChartsJS es una librería muy simple para gráficos, liviana y fácil de usar en web.
D3JS es sin duda una de las librerías para gráficos más usada, siendo casi un estándar para web, con una gran cantidad de opciones visuales, tanto para datos numéricos como para textos. Su nombre viene de Data Driven Documents.

¿Cómo aprender?

Hoy proliferan múltiples plataformas para aprender estos lenguajes de programación, lo que responde al creciente interés en el data science, la inteligencia artificial, y otras técnicas que usan extensivamente los lenguajes de programación.

En este sentido, plataformas como Datacamp, o Codecademy ofrecen formación en varios niveles de aprendizaje.

El panorama es muy amplio y las anteriores categorizaciones son solo propuestas para comprender un panorama muy amplio. El factor relevante está en qué queremos lograr, cuáles son nuestros objetivos, si queremos analizar o queremos comunicar las conclusiones, y quién es nuestro público, y en qué contexto verá la información. Estas son algunas de las preguntas que pueden guiar el desarrollo de nuestros proyectos de visualización.

Lee aquí sobre el curso “Visualización de Datos” de Clase Ejecutiva UC.

 





Ricardo Vega
Artículos más recientes del autor