Medios

Buenas prácticas en la visualización de datos

La visualización de datos es parte del proceso analítico, y una disciplina en sí misma, con una comunidad próspera llena de opiniones sobre la mejor manera de comunicar datos. Sarah Leo, periodista de datos visuales del diario The Economist, compartió una colección de sus delitos más graves contra la visualización de datos de los últimos años, y cómo solucionarlos.


A continuación una lista de algunos de sus mayores fracasos en la visualización de datos:

Gráficos engañosos

Comencemos con el peor de los delitos en la visualización de datos: presentar los datos de manera engañosa. ¡Nunca se debe hacer esto a propósito! Pero sucede de vez en cuando. Aquí tres ejemplos del archivo de The Economist.

 

Error: Truncar la escala

Este gráfico muestra el número promedio de likes de Facebook en las publicaciones de las páginas de la izquierda política. El objetivo de este gráfico era mostrar la disparidad entre las publicaciones de Corbyn y otras.

El gráfico original no solo resta importancia al número de likes de Corbyn, sino que también exagera los de otros mensajes. En la versión rediseñada, se muestra la barra de Corbyn en su totalidad. Todas las demás barras permanecen visibles.

Otra cosa extraña es la elección del color. En un intento de emular el esquema de color de Labour, utilizaron tres tonos de naranja/rojo para distinguir entre Jeremy Corbyn, otros parlamentarios y partidos/grupos. Esto no está explicado. Si bien la lógica detrás de los colores puede ser obvia para muchos lectores, tal vez tenga poco sentido para los menos familiarizados con la política británica.

 

Error: Forzar una relación por una selección cuidadosa de las escalas

El cuadro de arriba acompañó una nota sobre la disminución de peso de los perros. A primera vista, parece que el peso y el tamaño del cuello de los perros están perfectamente correlacionados. Pero ¿es esto cierto? Sólo en cierta medida.

En el cuadro original, ambas escalas disminuyen en tres unidades (de 21 a 18 a la izquierda, de 45 a 42 a la derecha). En términos porcentuales, la escala izquierda disminuye en un 14%, mientras que la derecha disminuye en un 7%. En el gráfico rediseñado, conservaron la escala doble, pero ajustaron sus rangos para reflejar un cambio proporcional comparable.

Teniendo en cuenta el alegre tema de este cuadro, este error puede parecer relativamente menor. El mensaje del gráfico, después de todo, es el mismo en ambas versiones. Pero la conclusión es importante: si dos series se siguen de demasiado cerca, probablemente sea una buena idea observar más en detalle  las escalas.

 

Error: Elegir el método de visualización incorrecto

The Economist publicó esta tabla de encuestas en Espresso, la aplicación de noticias diarias. Muestra actitudes hacia el resultado del referéndum de la UE, graficado como un gráfico de líneas. Al observar los datos, parecía que los encuestados tenían una visión bastante errática del resultado del referéndum: aumentan y disminuyen en un par de puntos porcentuales de una semana a otra.

En lugar de trazar las encuestas individuales con una curva suavizada para mostrar la tendencia, conectaron los valores reales de cada encuesta individual. Esto sucedió, principalmente, porque la herramienta de gráficos internos no traza líneas suavizadas.

Otra cosa a tener en cuenta en este cuadro es la forma en que se rompió la escala. El gráfico original difunde los datos más de lo que debería. En la versión rediseñada, dejaron algo más de espacio entre el inicio de la escala y el punto de datos más pequeño. Francis Gagnon ha elaborado una buena fórmula para esto: procurar dejar libre al menos el 33% del área de la parcela bajo un gráfico de líneas que no comienza en cero.

 

Tablas confusas

No tan criminal como un gráfico engañoso, los gráficos que son difíciles de leer son una señal de un trabajo de visualización mal hecho.

 

Error: llevar el «mind-stretching» un poco demasiado lejos

En The Economist, se alienta a los periodistas a producir un periodismo de «mente abierta». Pero, a veces, toman esto demasiado lejos. El cuadro anterior muestra el déficit comercial de los Estados Unidos en bienes y el número de personas empleadas en la manufactura.

La tabla es increíblemente difícil de leer. Tiene dos problemas principales. Primero, los valores de una serie de datos (déficit comercial) son completamente negativos, mientras que los otros (empleo manufacturero) son todos positivos. Es un desafío combinar tales disparidades en un gráfico sin aplanar ninguna de las series de datos. La aparente «solución» a esto lleva al segundo problema: las dos series de datos no comparten una línea de base común. La línea de base del déficit comercial se encuentra en la parte superior del gráfico (resaltada por una línea roja dibujada en la mitad del cuerpo del gráfico). La línea de base de la escala derecha está en la parte inferior.

El gráfico rediseñado muestra que no había necesidad de combinar las dos series de datos. La relación entre el déficit comercial y el empleo en el sector manufacturero sigue siendo clara y solo requiere una cantidad mínima de espacio adicional.

 

Error: Uso confuso del color

Este cuadro compara el gasto del gobierno en beneficios de pensión con la proporción de personas mayores de 65 años para una selección de países, con un enfoque particular en Brasil. Para mantener el gráfico pequeño, el visualizador solo etiquetó una selección de países y resaltó aquellos en azul eléctrico. El promedio de la OCDE se destaca en azul pálido.

El visualizador ignoró el hecho de que un cambio de color a menudo implica un cambio categórico. A primera vista, este cuadro también parece ser el caso: todos los colores azul eléctrico parecen pertenecer a una agrupación diferente de los azules oscuros, pero no es el caso. Lo único que tienen en común es que fueron elegidos para ser etiquetados.

En la versión rediseñada, el color de los círculos sigue siendo el mismo para todos los países. Se cambió la opacidad de aquellos que no están etiquetados para que los demás se destaquen. La tipografía hace el resto: Brasil, el país de enfoque, está escrito en negrita y el promedio de la OCDE en cursiva.

 

Gráficos que ocultan su punto

Los errores en esta categoría final son menos obvios. Los gráficos como estos no son engañosos, ni son muy confusos. Simplemente no pueden justificar su existencia, a menudo porque se han visualizado incorrectamente, o porque se ha intentado abarrotar demasiado espacio.

 

Error: Incluir demasiados detalles

¡Qué arco iris! Este gráfico fue publicado en una columna sobre el superávit presupuestario de Alemania. Muestra los saldos presupuestarios y los saldos en cuenta corriente de diez países de la zona del euro. Con tantos colores, algunos de los cuales son bastante difíciles de distinguir o incluso ver porque los valores son muy pequeños, el mensaje del gráfico es imposible de distinguir. Y, lo que es más importante, dado que no están trazando todos los países de la zona del euro, no tiene ningún sentido apilar los datos.

Revisaron la nota para ver si había una manera de simplificar un poco este cuadro. La columna menciona a Alemania, Grecia, los Países Bajos, España y el total de la zona del euro. En la versión rediseñada del gráfico, decidieron resaltar solo esos. Para resolver el problema de apilar solo una selección de países, agregaron otra categoría («Otros») que incluye a todos los demás países de la zona del euro.

 

Error: Muchos datos y poco espacio

Confinados por el espacio limitado en una página, a menudo nos sentimos tentados a forzar todos los datos que tenemos en un cuadro que es demasiado pequeño. Aunque esto ahorra un espacio valioso en la página, tiene consecuencias, como se muestra en este cuadro. La historia trata de cómo la publicación científica está dominada por hombres. Todos los puntos de datos son igualmente interesantes y relevantes para la historia. Pero al presentar tantos datos (cuatro categorías de campos de investigación, así como la proporción de inventores), la información es difícil de asimilar.

Después de pensarlo mucho, decidieron no rediseñar esta tabla. Si tuvieran que guardar todos los datos, el cuadro se habría vuelto demasiado grande para lograr una historia concisa. En casos como este, sería mejor cortar algo. Alternativamente, se podría mostrar algún tipo de medida promedio, por ejemplo, el porcentaje promedio de publicaciones de mujeres en todos los campos.

Vía