martes 24 de mayo de 2022
Cursos de periodismo

La nueva Inteligencia Artificial que ayuda a restaurar textos antiguos dañados

DeepMind es una empresa de Inteligencia Artificial inglesa que en 2014 fue adquirida por Google. Cuentan con muchos proyectos diferentes y en uno de ellos colaboran con académicos de la literatura clásica para ayudar a descifrar el texto de inscripciones dañadas de la antigua Grecia. El nuevo sistema, denominado Ithaca, se basa en un sistema anterior de restauración de textos llamado Pythia.

Ithaca no sólo ayuda a los historiadores a restaurar el texto, sino que también puede identificar el lugar de origen de un texto y la fecha de creación, según un nuevo artículo que el equipo de investigación ha publicado en la revista Nature. De hecho, Ithaca ya se ha utilizado para ayudar a resolver un debate en curso entre los historiadores sobre las fechas correctas de un grupo de antiguos decretos atenienses. Una versión interactiva de Ithaca está disponible gratuitamente, y el equipo está haciendo que su código sea de código abierto.

Muchas fuentes antiguas -ya sea que estén escritas en pergaminos, papiros, piedra, metal o cerámica- están tan dañadas que grandes trozos de texto suelen ser ilegibles. Determinar el origen de los textos también puede ser un reto, ya que es probable que hayan sido trasladados varias veces. En cuanto a la determinación exacta de la fecha de producción, la datación por radiocarbono y otros métodos similares no pueden utilizarse porque pueden dañar los valiosos artefactos. Por ello, la tarea de interpretar estos textos incompletos, que requiere mucho tiempo, queda en manos de los llamados epigrafistas, especializados en esta materia.

Como escribió la gente de DeepMind en 2019: «Uno de los problemas para discernir el significado de fragmentos de texto incompletos es que a menudo hay múltiples soluciones posibles. En muchos juegos de palabras y rompecabezas, los jugadores adivinan las letras para completar una palabra o frase: cuantas más letras se especifican, más limitadas son las posibles soluciones. Pero a diferencia de estos juegos, en los que los jugadores tienen que adivinar una frase de forma aislada, los historiadores que restauran un texto pueden estimar la probabilidad de diferentes soluciones posibles basándose en otras pistas del contexto de la inscripción, como las consideraciones gramaticales y lingüísticas, la disposición y la forma, los paralelos textuales y el contexto histórico.»

Para acelerar el proceso, Yannis Assael, Thea Sommerschield y Jonathan Prag, de DeepMind, colaboraron con investigadores de la Universidad de Oxford en el desarrollo de Pythia, un sistema de restauración de textos antiguos que lleva el nombre de la gran sacerdotisa que ejercía de oráculo de Delfos y emitía los pronunciamientos del dios Apolo.

El primer paso de los investigadores fue convertir la base de datos del Instituto de Humanidades Packard (PHI) -la mayor colección digital de inscripciones griegas antiguas- en un texto manipulable por la máquina al que llamaron PHI-ML. Se trata de unas 35.000 inscripciones y más de 3 millones de palabras del siglo VII A.C. al V D.C. A continuación, los investigadores entrenaron a Pythia (con las palabras y los caracteres individuales como entradas) para predecir las letras que faltaban en esas inscripciones. Pythia fue entrenada para utilizar las capacidades de reconocimiento de patrones de las redes neuronales profundas.

Ante una inscripción incompleta, Pythia produjo hasta 20 letras o palabras diferentes que podrían rellenar los huecos, así como el nivel de confianza de cada posibilidad. Los historiadores (los «expertos en la materia») eran los encargados de evaluar esas posibilidades y tomar una decisión final basada en su experiencia en la materia.

El equipo puso a prueba el sistema comparando los resultados de Pythia al completar 2.949 inscripciones con las de los estudiantes de epigrafía de Oxford. Los resultados de Pythia tuvieron una tasa de error del 30,1%, frente al 57,3% de los estudiantes. Pythia también fue capaz de completar la tarea mucho más rápidamente, necesitando sólo unos segundos para descifrar 50 inscripciones, en comparación con las dos horas de los estudiantes.

Y ahora Assael y sus compañeros han vuelto con Ithaca. Además de la capacidad de restauración del texto, Ithaca hace predicciones sobre la atribución geográfica de las inscripciones incompletas. La distribución de la probabilidad de todas las predicciones posibles se visualiza en un mapa, «para arrojar luz sobre las posibles conexiones geográficas subyacentes en el mundo antiguo», escribió el equipo en una entrada de blog. Para la atribución cronológica, Ithaca produce una distribución de sus fechas predichas entre el 800 A.C. y el 800 D.C.

Las pruebas revelaron que Ithaca, por sí sola, es capaz de lograr un 62% de precisión en la restauración de textos dañados, frente al 25% de precisión de los historiadores humanos. Pero la combinación de hombre y máquina aumenta la precisión global hasta el 72%, lo que, según Assael, demuestra «el potencial de la cooperación hombre-máquina» en este campo. En cuanto a la atribución de las inscripciones a su ubicación original, Ithaca puede hacerlo con una precisión del 71% y datar las inscripciones con una precisión de 30 años.

Ithaca ya ha tenido la oportunidad de demostrar su utilidad para los historiadores en un caso de prueba relacionado con un conjunto de decretos atenienses que han estado en el centro de una controversia sobre su datación. Los historiadores habían fijado la fecha de los decretos en el año 446 A.C. como máximo. Esta valoración se basaba en ciertas formas de letras (conocidas como sigma ática de tres barras) que la burocracia ateniense utilizaba durante este periodo. Después del 446 A.C., los atenienses cambiaron a una sigma jónica de cuatro barras para sus decretos.

Esta fue la metodología de datación estándar para las inscripciones atenienses hasta que otros historiadores empezaron a cuestionar sus supuestos, sobre todo porque varios decretos fechados de esta manera parecían entrar en conflicto con los relatos históricos de Tucídides. Estos historiadores descubrieron pruebas de que la forma de letra ática se seguía utilizando en los documentos oficiales mucho después del año 446 A.C. Llegaron a la conclusión de que las fechas de muchos de estos decretos debían ser anteriores, en torno al 420 A.C. Ithaca predijo una fecha del 421 A.C., muy acorde con esa conclusión.

«Aunque pueda parecer una pequeña diferencia, este cambio de fecha tiene importantes implicaciones para nuestra comprensión de la historia política de la Atenas clásica», dijo Sommerschield en un comunicado. El siguiente paso es desarrollar versiones adicionales de Ithaca que puedan restaurar el texto en otras lenguas antiguas, como el acadio, el demótico, el hebreo y el maya.

«Este trabajo representa un avance muy importante en el uso colaborativo de la IA para mejorar la restauración, datación y atribución de inscripciones escritas en griego del mundo antiguo a lo largo de varios siglos», dijo Alison Cooley, presidenta de la Asociación Internacional de Epigrafía Digital de la Universidad de Warwick, que no está afiliada al proyecto. «El diseño innovador de Ithaca promete transformar la contribución potencial de las pruebas inscritas a nuestra comprensión de los momentos clave de la historia del mundo».

Roger Bagnall, profesor emérito de la Universidad de Nueva York (tampoco afiliado al proyecto), se muestra entusiasmado con lo que califica de extraordinario avance en la interpretación desde Pythia, sobre todo porque Ithaca puede extenderse a otras lenguas. «Estoy deseando verlo aplicado a los papiros documentales, en los que tenemos una datación mucho más precisa pero un número mucho mayor de textos no probados, debido a las operaciones del mercado de antigüedades», dijo en un comunicado. «Debería ser posible, con la ayuda de Ithaca, reconstruir el funcionamiento de ese mercado y el contexto histórico original de muchos más de los miles de documentos de papiro».

Vía

Contenido Premium

- Publicidad -

Lo último