Один из самых сложных комплексов письменных источников для прочтения – автографы Петра Великого – теперь доступен для распознавания искусственным интеллектом. Онлайн-проект «Digital Петр» был представлен на книжном фестивале «Красная площадь» 17 июня в Москве. О проблеме чтения рукописей Петра I и об участии сотрудников Санкт-Петербургского института истории РАН в этом проекте рассказал участникам фестиваля директор СПбИИ РАН член-корреспондент РАН, д.и.н. Алексей Владимирович Сиренов. Проект реализуется Сбербанком совместно с Российским историческим обществом и Санкт-Петербургским институтом истории РАН.
Петр I обладал очень неразборчивым почерком, и редко кто из исследователей может читать его рукописи. Поскольку такие специалисты есть в СПбИИ РАН, то институт был привлечен к участию в этом проекте. В результате сотрудничества специалистов СПбИИ РАН и Сбербанка была сформулирована задача: разработать программу для машинного чтения рукописей Петра I. Эту задачу решили программисты – участники ежегодного конкурса-хакатона, который организует Сбербанк. На фестивале презентовался сайт, демонстрирующий первые результаты проекта.
Это не первый случай создания такой программы. В мире есть несколько аналогов, но в отношении русских текстов они дают большую погрешность. Данная же программа была сразу ориентирована на русские рукописные тексты, да еще и на самую сложную их разновидность. Как правило, самообучающиеся программы в своем развитии идут от простого к сложному, здесь же была сразу поставлена высшая планка сложности.
Точность распознавания оценивается специалистами в девяносто семь процентов, но это, конечно, не значит, что в программу будет просто загружен скан рукописного текста, получен результат, который и пойдет в публикацию. Разумеется, все проверяется и перепроверяется специалистами. «Хотелось бы, чтобы работа над программой продолжалась, и чтобы с ее помощью можно было читать не только рукописи Петра I, но и другие документы», – выразил надежду А. В. Сиренов и отметил, что такой подход делает доступнее наши богатства рукописные, источниковые, потому что уже сейчас все больше сканов документов выставляются на сайтах, этот процесс с каждым годом нарастает как снежный ком, и, конечно же, важно, чтобы все это было доступно как профессиональным историкам, так и всем, интересующимся историей России.