Рим не умер: искусственный интеллект читает послания мёртвых спустя 2000 лет

Aeneas расшифровал послание, которое историки боялись читать.

Исследователи из DeepMind, Университета Ноттингема и других научных центров разработали искусственный интеллект, способный восстанавливать фрагментированные латинские надписи времён Римской империи. Новый ИИ получил название Aeneas — в честь героя древнеримского эпоса.

Каждый год археологи находят около 1500 латинских надписей, вырезанных на камне, металле и керамике. Эти надписи — один из немногих источников, которые дают прямое представление о языке, религии, повседневной жизни и устройстве общества Древнего Рима. Однако большинство находок сильно повреждены. Многие надписи неполные: текст частично утрачен, повреждён или расколот. Расшифровка и интерпретация таких артефактов требует кропотливой работы и высокой квалификации.

Нейросеть Aeneas обучена восстанавливать утраченные фрагменты, улавливая связи между словами, грамматикой, контекстом и историческими особенностями языка. Её обучение включало 176 861 латинскую надпись — это около 16 миллионов символов. Примерно 5% из них сопровождались изображениями. Модель была обучена на данных о времени, месте и значении надписей, найденных на территории 62 римских провинций.

Теа Зоммершильд, специалист по эпиграфике из Университета Ноттингема и соавтор проекта, сравнивает работу модели с решением гигантской головоломки. По её словам, один фрагмент ничего не даёт — важны форма, цвет и связь с другими частями, как в мозаике.

С помощью Aeneas учёные протестировали нейросеть на знаменитом тексте Res Gestae Divi Augusti, в котором император Август перечисляет свои достижения. Несмотря на стилистические преувеличения, запутанную хронологию и географические ошибки в надписи, модель сумела уловить редкие языковые формы и архаичные написания, что позволило ей сузить возможный период её создания. Как отмечается в публикации в Nature , результаты Aeneas совпадают с двумя временными интервалами, о которых до сих пор спорят историки.

Яннис Ассаэл из DeepMind, один из авторов исследования, подчёркивает, что латинские надписи — это редкие следы мышления древних римлян. В отличие от литературных источников, они не переписывались, не редактировались и не проходили цензуру — в них можно увидеть, как говорили, думали и жили реальные люди того времени.

Нейросеть умеет предсказывать не только утраченные фрагменты текста, но и предполагаемое происхождение надписи — по провинции, и даже по десятилетию. В рамках испытаний более 20 историков протестировали модель, и в 90% случаев сочли её полезной. Однако наилучшие результаты, по словам авторов проекта, достигаются при совместной работе: когда ИИ даёт подсказку, а историк — интерпретацию.

Исследование демонстрирует, как искусственный интеллект может помочь восстановить голоса прошлого и стать новым инструментом в арсенале историков, лингвистов и археологов. Проект Aeneas соединяет гуманитарное знание с машинным обучением — и возвращает к жизни то, что казалось безвозвратно утерянным.