Можно ли научить нейросеть распознавать старославянский? А ценны ли для общества семейные архивы? Узнаем на бесплатной лекции в «Новой Голландии» 14 сентября. Будет трансляция. 18+
Архивы Ватикана занимают «коридор» длиной в 85 км. Там есть, конечно, и Тайные, и Ватикан их периодически раскрывает. Но воспользоваться этим не так-то просто: чтобы выложить в общий доступ документ, надо его оцифровать. Казалось бы, искусственный интеллект чего только не умеет, но когда несколько лет назад понадобилось перевести в цифру секретные архивы (а там много прелюбопытного — например, письма Марии Стюарт Папе Римскому перед казнью), это была сложнейшая задача: написанные от руки буквы вводили алгоритм в ступор. Разбирать ли по одной букве? Или по деталям букв — горизонтальным или вертикальным? Когда обученная нейросеть попыталась распознать пробный рукописный текст, она ошиблась в трети слов. Старославянский не менее затейлив, чем латынь, а почерк наших современников, возможно, посложнее старославянского.
Глава Архивного комитета города Петр Тищенко расскажет, с чем нейросети уже могут разобраться (не случайно организатором лекции выступает Университет ИТМО — «программистский вуз»), когда будут оцифрованы полмиллиона документов доцифровой эпохи и могут ли обычные граждане помочь в этом процессе.
Встречаемся 14 сентября в лектории «Новой Голландии». Подробности на сайте, Также можно будет посмотреть лекцию «Искусственный интеллект на службе архива» на ютьюб-канале лектория.
Александра Шеромова