lunes 19 de noviembre
Interesante

Un bot crea 40.000 perfiles de científicos para Wikipedia

El aprendizaje automático se utiliza actualmente para escanear estudios científicos y noticias para identificar a científicos prominentes que no aparecen en Wikipedia. Muchos de estos científicos son mujeres, y su omisión es particularmente significativa en la enciclopedia más popular del mundo, donde el 82 por ciento de las biografías están escritas sobre hombres.


La investigación fue llevada a cabo por una startup de AI llamada Primer, como demostración de la experiencia de la compañía en el procesamiento del lenguaje natural (NLP). Un subcampo desafiante, pero animado de AI que trata de comprender y generar texto digital. Wikipedia a menudo se utiliza como fuente para entrenar este tipo de programas, pero Primer quiere retribuir al sitio.

El director de ciencia de Primer, John Bohannon, explica en su blog cómo la compañía desarrolló una herramienta llamada Quicksilver (llamada así por la tecnología de los libros del autor de ciencia ficción Neal Stephenson “porque somos nerds”) para leer unos 500 millones de documentos originales, seleccionar las personalidades más citadas, y luego escribir un borrador básico sobre ellas y su trabajo.

Por ejemplo, aquí un artículo escrito por AI sobre Teresa Woodruff, una científica que no tiene una entrada en Wikipedia, pero fue nombrada una de las “personas más influyentes” por la revista Time en 2013. Su trabajo incluye el diseño de ovarios impresos en 3D para ratones:

Teresa K Woodruff es una científica reproductiva de la Universidad Northwestern. [1] Se especializa en ginecología y obstetricia. [2] Es miembro del Women’s Health Research Institute. [1] Woodruff es científica reproductiva y directora del Instituto de Investigación de la Salud de la Mujer de la Facultad de Medicina Feinberg de la Universidad Northwestern en Chicago. [3] Acuñó el término “oncofertilidad” en 2006, y ha estado en el centro del movimiento desde entonces. [4] Cinco años más tarde, triunfó: el 28 de marzo el equipo anunció el nacimiento de Evatar, un aparato reproductivo femenino a escala miniatura hecho de tejidos humanos y de ratón. [5] Ampliamente reconocida por su trabajo, posee 10 patentes en los Estados Unidos, y fue nombrada en 2013 por la revista Time en la lista de “Personas más influyentes”. [6]

Es un artículo básico, pero es convincente y claro, que es el punto de partida perfecto para que un editor de Wikipedia cree un artículo sobre Woodruff, asegura Primer.

Hasta la fecha, la startup ha identificado a 40.000 científicos “extraviados”, cuya cobertura es similar a las personas que tienen artículos de Wikipedia, y ha publicado 100 resúmenes generados por AI. También participaron de tres editathons de Wikipedia destinados a mejorar la representación online de las mujeres en la ciencia (los editathons son eventos en los que los especialistas se reúnen para crear y editar artículos de Wikipedia, generalmente para reforzar la cobertura de su área de conocimiento). Y como señala Bohannon, al menos una persona descubierta por la tecnología de Primer, ya recibió un artículo de Wikipedia: la robotista canadiense Joëlle Pineau.

Jessica Wade, una física del Imperial College London que escribió la nueva entrada de Pineau, habló sobre los beneficios del sistema. “Wikipedia es increíblemente parcial y la poca representación de las mujeres en la ciencia es particularmente mala”, dijo Wade. “Con Quicksilver, no hace falta rastrear los nombres faltantes, y se obtiene una gran cantidad de información de buenas fuentes en forma rápida”.

Primer dice que su tecnología se basa en trabajos anteriores de Google y otros investigadores, incluido un estudio publicado en enero de este año que también utilizó el aprendizaje automático para generar artículos básicos de Wikipedia. Sin embargo, la compañía dice que sus objetivos son más prácticos. En lugar de usar Wikipedia como banco de pruebas para experimentos, quiere crear herramientas con claros beneficios para el ecosistema de información online.

Con ese fin, Quicksilver no solo detecta personas olvidadas y genera borradores de artículos. También puede usarse para mantener las entradas de Wikipedia, e identificar si no se han actualizado durante un tiempo. La compañía dice que la entrada de Wikipedia para el científico de datos Aleksandr Kogan es un buen ejemplo. Kogan desarrolló la aplicación en el corazón del escándalo de Cambridge Analytica, y creó una página de Wikipedia sobre él en marzo de este año. Primer nota que la edición en la entrada de Kogan se detuvo a mediados de abril (lo que significa que las actualizaciones sobre Kogan, como el hecho de que también accedió a los datos de Twitter, aún no se han agregado).

Por supuesto, incluso herramientas como esta pueden ser susceptibles de sesgo. Si los puntos de Primer pasan por alto a los científicos sobre la base de su inclusión en las noticias, entonces podría terminar reflejando los intereses de la prensa científica. Pero Bohannon es inflexible en cuanto a que las herramientas de la compañía pueden ser útiles como asistentes a un proceso liderado por humanos.

“Los editores humanos de las fuentes más importantes de información pública pueden ser respaldados por el aprendizaje automático”, dijo Bohannon. “Los algoritmos ya se usan para detectar vandalismo e identificar artículos poco poblados. Pero las máquinas pueden hacer mucho más “.

Vía

 

Dejar un comentario