Data Points: Visualization that Means Something
Información bibliográfica:
Autor: Nathan Yau | Lugar de edición: Madrid | Editorial: Indianapolis, Indiana | Año de publicación: 2013| Nº de páginas: 299 | ISBN: 978-1-118-46219-5 | Enlace comercial
Acceso en bibliotecas:
Presentación de los contenidos del libro:
En este ejemplar el autor hace un recorrido analítico por la visualización empezando por el primer estrato, a saber, los datos en bruto, hasta llegar a la compleja temática de los aspectos estéticos y epistemológicos de su representación gráfica. Presenta distintos tipos de datos y diversas ópticas desde las que pueden ser analizados visualmente, explicando la importancia de la geometría y el color en la visualización de datos, para llegar, finalmente, a hacer acopio de las herramientas más utilizadas para esta tarea.
La visualización de datos, tal y como el autor expone, supone un reto en el mundo de la información porque es un proceso de abstracción de algo que es una abstracción en sí. Los datos son una forma de abstracción del mundo con la que pueden crearse distintos aspectos informativos de él. Darles formato visual a esos datos vuelve a ser una forma de abstracción, pero ofrece la posibilidad de poner el foco en aspectos determinados de ellos con el fin de extraer conocimiento.
Un aspecto novedoso de esta obra a destacar es que se equipara la estadística al storytelling. Ambas técnicas o disciplinas se centran en el uso de los datos para conseguir un fin. En el caso de la estadística, realiza análisis numéricos de datos para poder hacer predicciones. Por su parte, el storytelling crea historias alrededor de acciones o eventos para captar las emociones del público receptor. Esto rompe con la idea tradicional de que el estudio y uso de la visualización de datos sólo están ligados al ámbito científico-técnico, sino que también se pueden usar en otras áreas de conocimiento relacionadas con el mundo humanístico-empresarial.
En la visualización de datos no sólo es importante la exactitud de los datos que se pretenden representar visualmente, sino que hay que priorizar también la forma de representación de estos, adaptándola a aquello que quiere transmitirse con ella y al público a la que se dirige. Es el salto del dato en “crudo” a su representación gráfica que supone un proceso mucho más complejo que utilizar un software de representación gráfica e introducir los datos. La visualización de datos conlleva una toma de decisiones previas tales como la elección de los colores, de la forma de representación, la colocación de los datos, etc., que más se ajuste a su tipología. Esto mismo ocurre cuando se diseña una infografía científica. Primero se decide qué tema quiere representarse, se toman unos datos al respecto y se les da forma y formato para adecuar la infografía a aquellos a los que queremos transmitir la información.
Al final del discurso, se presentan una serie de herramientas que el autor considera destacables para llevar a cabo la labor de visualización de datos. Divide estas herramientas en cuatro tipos y da un breve resumen de para qué se utilizan y sus bondades a la hora de hacer representaciones visuales de datos. Las herramientas mencionadas son las siguientes:
- Herramientas de visualización:
- Microsoft Excel. Quizás sea el más extendido y conocido. Es un software basado en hojas de cálculo, que permite realizar distintas acciones básicas de tratamiento y visualización de datos.
- Google Spreadsheets. Este software es esencialmente igual que el anterior, con la diferencia de que permite el trabajo colaborativo online, pudiendo ser utilizado por varios equipos a la vez.
- Tableau Software. Este software permite analizar los datos de manera mas profunda que los dos primeros, permitiendo una interacción y visualización de estos más sofisticada.
- Many Eyes. Software que permite explorar los conjuntos de datos mediante distintas herramientas de visualización.
- Herramientas para datos de una tipología específica:
- Gephi. Software de fuente abierta que permite realizar gráficos y visualizaciones con nodos en forma de racimo.
- ImagePlot. Permite explorar gran cantidad de imágenes como si fueran datos, mediante variables como el color, la fecha o la cantidad de ellas tomadas en un momento concreto. Este software es muy útil para fotógrafos o artistas.
- Treemap. Este software permite la visualización de los datos mediante rectángulos con aspectos distintos dependiendo de la variable de los datos que representen. Es muy útil para analizar datos jerárquicos.
- TileMill. Software de diseño de mapas para visualizar datos geográficos y analizarlo dependiendo de las necesidades o aspectos que se quieran conocer de ellos.
- Indiemapper. Al igual que el anterior, es un software destinado a la visualización de datos geográficos.
- GeoCommons. Similar al anterior, pero está más enfocado en el análisis de los datos geográficos, ya que se puede interactuar con puntos y áreas concretas de los datos representados gráficamente.
- ArcGIS. Software basado en Sistemas de Información Geográfica (SIG en español o GIS en inglés). Mucho más sofisticado que los demás, permite realizar visualizaciones de datos mediante la colocación de capas visibles basadas en datos de distinta naturaleza.
- Herramientas de programación:
- R. Lenguaje de programación que permite diseñar gráficos y estadísticas. Este software principal tiene varias extensiones, de entre las cuales destacan para el cometido de la visualización de datos las siguientes: ggplot2 (infraestructura de las visualizaciones estadísticas), network (para la creación de gráficos con nodos), ggmap (para visualización de datos espaciales), animation (para crear animaciones a partir de galerías de imágenes) y portfolio (para visualización de datos jerárquicos).
- Javascript, HTML, SVG y CSS. Lenguajes de programación para diseño web.
- Processing. Este lenguaje de programación que hace uso de una sintaxis sencilla y se usa para programar modelos de gráficos.
- Flash y Actionscript. Es el lenguaje de programación de Adobe Flash y permite la construcción de animaciones basadas en datos complejos y la creación de interfaces interactivas.
- Python. El más usado para el procesamiento de datos y aplicaciones web.
- PHP. Al igual que el anterior, es muy usado para programación web, con la excepción de que contiene una biblioteca de gráficos, lo que permite que se pueda usar para visualización de datos.
- Herramientas de ilustración:
- Adobe Illustrator. Software comercial que suele ser usado por diseñadores y artistas.
- Inkscape. Es el equivalente al anterior, pero de fuente abierta.
Este compendio de herramienta puede ser interesante para que el lector pueda escoger aquella que mejor se adecúe a las necesidades de sus datos y de aquello que quiere representar gráficamente de ellos.
En resumen, resulta muy útil este libro para su aplicación a las infografías científicas, ya que éstas no dejan de ser una visualización de datos combinada con información científica, de manera que se presenten los resultados de investigación de una forma visual y académica a la vez.
Autor de la reseña: Isabel María Lobón Márquez
Fecha de publicación: 27/06/2022