sábado 18 de noviembre
Medios

4 ejemplos de pensamiento computacional en el periodismo

Paul Bradshaw, director de la Maestría en Periodismo de Datos y la Maestría en Periodismo Móvil y Multiplataforma en la Universidad de Birmingham recopiló en su blog algunos de sus ejemplos favoritos de pensamiento computacional utilizado para detectar y ejecutar artículos periodísticos de datos.


A continuación, los ejemplos más destacados:

1- ¿Qué cantante tiene el rango vocal más amplio?

Esta nota, publicada en el periódico sensacionalista británico The Mirror , es un gran ejemplo de cómo una computadora puede “ver” la información y ser capaz de ayudar a extraer de ella una historia.

La información detrás del artículo es una colección de más de 300.000 piezas de partituras. En papel, esa música sería una colección de tinta sobre papel, pero debido a que se ha digitalizado, ahora puede cuantificarse.

Eso significa que podemos realizar cálculos y comparaciones con la data. Podríamos:

  • Contar el número de notas
  • Calcular la variedad de notas
  • Identificar las notas más comunes
  • Identificar las notas con el valor máximo
  • Identificar las notas con el valor mínimo
  • Calcular un “rango” restando el mínimo del máximo

El periodista observó esto y decidió que la última opción tiene quizás el mayor potencial para ser noticia: suponemos que algunos cantantes tienen rangos más amplios que otros, y la realidad puede sorprendernos (una cualidad de interés periodístico).

Por supuesto, para llegar a esa nota se requieren una gran cantidad de habilidades técnicas: la adquisición de los datos puede necesitar la escritura de un borrador; es posible que se requiera una secuencia de comandos para identificar la nota más alta y más baja en cada canción, luego asociarla con un artista y, finalmente, agregar la nota más alta y más baja por artista.

También hay algunos filtros aquí al mirar específicamente a los artistas del Reino Unido, que pueden requerir más datos que luego deben combinarse con los datos de la partitura. Todo esto requiere un mayor pensamiento computacional.

Pero la idea fundamental no es la habilidad técnica, es editorial y lógica.

 

2- Diálogos de género en guiones cinematográficos

El segundo ejemplo, “She Giggles, He Gallops”, es un ejemplo de reconocimiento de patrones: el autor se da cuenta de que puede investigar la representación de género en películas buscando los verbos que aparecen después de las palabras “él” y “ella”.

El texto, como la música, no es más que tinta sobre papel en un mundo analógico, pero online es cuantificable: solo se necesitan unas líneas de código para decir “repasá cada guión cinematográfico, buscá la palabra” él “o” ella “, y cuando lo encuentres, capturá la palabra inmediatamente después de” (un algoritmo).

A partir de ahí, se trata de filtrar (eliminando los no verbos), contar/agregar y clasificar (qué palabras aparecen con más frecuencia en cada género).

 

3- BuzzFeed – La raqueta de tenis

La investigación de BuzzFeed sobre el posible arreglo de partidos de tenis fue una empresa importante, e involucró algunas habilidades de codificación particularmente avanzadas, pero averiguar cómo investigar tal tema era tan importante como la ejecución técnica.

La historia era un buen ejemplo de descomposición: dividir un problema en una serie de otros más pequeños. Estos incluyen:

  • ¿Cómo se cuantifica el arreglo de partidos?
  • ¿Dónde quedaría registrado?
  • ¿Cómo podemos obtener esa información?
  • ¿Cómo establecemos algún nivel de prueba?

Se trata de buscar señales de algo en el mundo físico, en el mundo digital. Aquí hay algo de la abstracción que tuvo lugar a continuación:

  • ¿Por qué tiene lugar el arreglo de partidos? Para que los que los arreglan puedan ganar dinero a través de las apuestas.
  • ¿Cómo ganan dinero? Al colocar apuestas grandes y/o a mayores probabilidades
  • Las probabilidades más importantes significan que los resultados deben ser inesperados
  • ¿Qué sucede cuando se hacen esas apuestas? Las probabilidades cambian notablemente para que los corredores de apuestas puedan reducir sus riesgos

Por cierto, esto requiere cierto conocimiento y/o exploración de los sistemas de arreglo de partidos y corredores de apuestas.

Ahora el plan inicial podría ser conseguir los registros de las apuestas hechas en los partidos, pero es improbable que los corredores de apuestas cooperen con tal enfoque. Entonces, suponiendo que se haya hecho un abordaje (y que se haya rechazado) pasamos a una señal secundaria: oscilaciones significativas en las probabilidades antes de un partido.

Al vincular a aquello con resultados inesperados, los periodistas pueden identificar áreas para una mayor investigación: ¿los jugadores particulares siguen recurriendo a esos resultados?

Una metodología más detallada está disponible en GitHub, que incluye datos y cuadernos.

 

4- El Android de Trump versus el iPhone de sus asistentes

El trabajo de David Robinson sobre los tweets de Donald Trump, que le encargaron que escribiera para el Washington Post, es otra historia de reconocimiento de patrones: en este caso, diferentes tonos de voz provenientes de los tweets de Donald Trump, y los metadatos asociados a ellos (ya sea que las actualizaciones surgieron de Twitter para iPhone o de Twitter para Android).

También hay un nivel de abstracción aquí, en la identificación de palabras centrales que representan un tono de voz particular.

Vía

Dejar un comentario