17 Mar 2022
Cпециалисты из DeepMind разработали нейросетевую модель под названием «Итака» (Ithaca), способную восстанавливать частично утраченные древнегреческие надписи.
Для начала команда DeepMind в сотрудничестве с коллегами из университетов Венеции, Оксфорда и Афин, взяв необработанный датасет, состоящий из 178551 расшифрованной надписи, разработала алгоритм перевода его в подходящее для машинного обучения состояние. С помощью этого алгоритма удалось уменьшить шум, нормализовать используемые символы, эффективно нивелировать различные «неровности» изображений и сопроводить все надписи метаданными, относящимися ко времени и месту создания. Всего было учтено 84 древних региона, а также возможность использования в надписи нескольких языков, различные способы определения хронологической информации и многое другое. Не все исходные надписи удалось таким образом достаточно качественно обработать, тем не менее в результирующем многозадачном датасете набралось 78 608 описанных и размеченных надписей, созданных в период с 800 г. до н.э. по 800 г. н.э. На этом корпусе разработчики и обучили «Итаку».
Затем они скрыли часть изображения в тех же надписях, чтобы проверить, правильно ли Ithaca заполнит эти пробелы. После специалисты дали нейросети новое задание — восстановить около 8 тыс. частично утраченных надписей. Выяснилось, что ИИ восстанавливает тексты с точностью 62%; создатели модели утверждают, что это лучше, чем получается у профессиональных эпиграфистов (специалистов в области изучения древних надписей, сделанных на твёрдых материалах: камне, керамике, металле). А вот когда ИИ «объединяется» со специалистами-людьми, добавляют авторы проекта, точность восстановления текстов достигает 72%.
Кроме того, приложение обучили «привязывать» исследуемый текст ко времени и месту, сравнивая его с текстами, происхождение которых установлено. Датировку текстов ИИ-модель производит в диапазоне достоверности до 30 лет.
Последнее время эпиграфисты полагаются в своей работе на обширные цифровые корпуса уже известной информации, однако поиск «параллельных мест» в значительной степени зависит от формулировки поискового запроса, из-за которой могут быть упущены релевантные результаты. Применённые специалистами DeepMind методы машинного обучения в сочетании с внушительными вычислительными мощностями используемого оборудования позволили преодолеть это ограничение.
Источник: XX2 век
25 Apr 2024
23 Apr 2024
19 декабря 2023 года Международный институт развития научного сотрудничества «МИ ...
14 и 15 ноября в отеле «Националь» в Москве проходит III Международный форум «СМ ...
30 октября 2023 Центр научно-аналитической информации Института востоковедения Р ...
С 18 по 20 октября в Казани пройдет шестой международный «Медиафорум-2023: свобо ...
10-11 октября в Белграде прошла IX Международная встреча интеллектуалов на тему ...
Президент Международного Института Развития Научного Сотрудничества
Российский политолог, историк, публицист.
Доктор политических наук, профессор МГИМО
Генеральный директор Международного Института Развития Научного Сотрудничества
Научный руководитель Международного Института Развития Научного Сотрудничества
Доктор исторических наук.
Профессор
Председатель Попечительского совета Международного Института Развития Научного Сотрудничества
Доктор исторических наук, профессор, член-корреспондент РАН. Директор Института востоковедения РАН. Член научного совета Российского совета по международным делам.
Заместитель Председателя Попечительского совета Международного Института Развития Научного Сотрудничества
Доктор исторических наук.
Профессор кафедры стран постсоветского зарубежья РГГУ, профессор факультета глобальных процессов МГУ им. М.В. Ломоносова.