Изследователи от DeepMind и Оксфордския университет представиха PYTHIA - епиграфски алгоритъм, който реконструира всички възможни вариации на изгубени надписи върху паметници на древногръцки език. Алгоритъмът, базиран на енкодер и декодер с дългосрочна памет, анализира останалите фрагменти от текста и допълва надписите, като взема предвид контекста, използвайки познатия му речник. Представената система за прогнозиране на загубени фрагменти средно прави по-малко грешки от специалистите в областта на древногръцката епиграфия. Описание на алгоритъма е публикуван на arXiv.org, за него се съобщава накратко и в блога DeepMind.
Отделна научна дисциплина, епиграфията е посветена на дешифрирането на надписи върху твърди (например каменни или мраморни) езикови паметници. Поради факта, че повечето паметници не са напълно запазени, специалистите в тази област трябва да възстановят изгубените фрагменти от текста. Всъщност ако се загубят само няколко отделни фрагменти, знаейки оригиналния език и историческия контекст (най-често паметниците са добре датирани и много древни езици се изучават достатъчно подробно), не е много трудно да дешифрираме текста. Сложността на задачата се увеличава, когато има много пропуски - тук, за да се реши неяснотата, трябва да се използва и контекстът на фрагментите на паметника.
Новият алгоритъм е разработен от изследователи, ръководени от Янис Асаел от DeepMind. За да обучат машината, учените са използвали текстове, датирани от VII в. пр.н.е. до пети век от н.е.
Алгоритъмът PYTHIA е кръстен на древногръцката жрица Пития, която според легендата е имала дара на предсказанието.