Раздел 10. Использование технологий искусственного интеллекта в электронных документальных публикациях

РАЗДЕЛ 10. Использование технологий искусственного

интеллекта в электронных документальных публикациях

Применение технологий искусственного интеллекта в процессе подготовки документальных публикаций в сети Интернет вполне возможно. Она может быть направлена на решение ряда задач.

Первая группа задач решает проблему упрощения подготовки текстов к публикации и может включать:

- автоматическое распознавание рукописных и печатных текстов в исторических документах;

- транскрибирование текстов с учетом устаревшей орфографии и шрифтов;

- автоматический перевод текстов на другие языки;

- нормализацию устаревших форм написания слов и орфографии под стандарт современного русского языка;

- сегментацию и структурирование текста (разделение на абзацы, колонки, таблицы).

Для этой цели применяется совокупность таких технологий как:

- Optical Character Recognition (OCR) с использованием моделей ИИ;

- машинное обучение (ML) для адаптации OCR под специфические шрифты (обучение пользовательских моделей ИИ на специфических корпусах документов, применение seq2seq моделей <378>), а также создание на основе машинного обучения словарей замены;

--------------------------------

<378> Нейронные сети, которые предназначены для преобразования одной последовательности данных в другую.

- Natural Language Processing (NLP) для исправления ошибок распознавания, в том числе интеграция с ИИ-моделями, корректирующими ошибки распознавания;

- применение парсеров, основанных на NLP, для выделения заголовков, абзацев, списков, таблиц.

Вторая группа задач связана с семантической обработкой текстов. Она может включать в себя:

- автоматическое извлечение сущностей (NER - Named Entity Recognition), таких как персоналии, географические топонимы, даты, организации и т.д. в тексте, для составления различного рода указателей и настройки поиска по фильтрам;

- классификацию документов по тематике, хронологии, авторству (так называемому тематическому моделированию), что также можно использовать для расширенного поиска;

- автоматическую генерацию метаданных.

Для этой цели может применятся совокупность таких технологий как:

- NLP-модели для распознавания сущностей;

- классификаторы, созданные на основе ML;

- применение предобученных моделей с дообучением на корпусах конкретных исторических источников;

- разработка специализированных моделей для конкретных хронологических периодов или языков;

- entity linking или связывание сущностей, то есть процесс идентификации и устранения неоднозначности упоминаний сущностей в тексте и связывания их с соответствующими записями в валидных базах данных, в том числе и с помощью NER;

- использование онтологий для организации знаний.

Третья группа задач связана с визуализацией и интерактивными элементами, которые дают возможность совершенно по-иному представить контекст документальной публикации, облегчить ее восприятие, создать наглядную связь упоминаемых в ней персонажей или объектов. Сюда относится:

- генерация интерактивных временных шкал, картограмм, генеалогических деревьев, интерактивных карт ссылок между персонами, событиями, топонимами;

- возможность реконструкции поврежденных фрагментов текста или изображений, возможность показа версионности текста и т.д.

Для этой цели применяется совокупность таких технологий как:

- компьютерное зрение (Computer Vision) и генеративно-состязательные сети (GAN) для задачи восстановления документов;

- геоинформационные системы (GIS) в связке с ИИ для привязки исторических карт к современным.

Четвертая группа задач связана с работой с изображениями (включая оцифрованные копии текстовых документов, карты и фотографии). Это:

- генерация описаний, меток и тегов к визуальным объектам;

- синхронизация текстовой и графической информации.

Для этой цели может применяться совокупность таких технологий как:

- использование мультимодельных моделей <379> для связи текста с изображением;

--------------------------------

<379> Системы искусственного интеллекта, которые способны обрабатывать и понимать информацию из нескольких модальностей, таких как текст, изображения, звук и видео.

- создание интерактивных интерфейсов с синхронным переходом между текстом и изображением и т.д.

Пятая группа задач связана с улучшением поисковых функций и создание рекомендательных систем (в том числе и виртуальных ассистентов), способных обеспечить более эффективную работу с электронной документальной публикацией, чем просто обычное ее прочтение. Это:

- организация семантического поиска (поиска по документам с учетом смыслового контекста, а не просто формального совпадения символов в запросе и в документе);

- адаптация документальной публикации под запросы людей с ограниченными возможностями, в том числе упрощение восприятия текста и изображений;

- автоматическая генерация ответов на вопросы пользователей в интерактивном режиме свободного диалога, в том числе и с использованием голосового ввода;

- создание функционала персонализированных рекомендаций для исследователей.

Все это может быть достигнуто за счет:

- применения систем семантического поиска типа Elasticsearch с интеграцией NLP;

- разработки фасетного поиска <380> с учетом временных, географических и тематических категорий;

--------------------------------

<380> Метод доступа к информации с использованием одновременно нескольких фильтров - фасетов.

- генерации аудиоверсий текста (TTS - Text-to-Speech);

- автоматического создания описания изображений для пользователей с нарушением зрения;

- реализации возможности автоматической адаптации цвета и контраста с помощью компьютерного зрения;

- применения больших языковых моделей для разработки ориентированных на конкретный массив документов чат-ботов;

- использования технологии Speech-to-Text для голосовых запросов;

- использования алгоритмов коллаборативной фильтрации <381> и метода фильтрации на основе содержимого (content-based filtering);

--------------------------------

<381> Метод построения рекомендательных систем, который предсказывает предпочтения пользователя на основе аналогичных предпочтений других пользователей.

- встраивания рекомендаций в систему поиска и навигации.

Перечисленные задачи и способы их решения, как правило, пока лишь внедряются в качестве экспериментов в сопредельных областях, а не в археографии.

В публикациях российских архивов начинается активное использование таких возможностей, предоставляемых искусственным интеллектом, как колоризация черно-белых фильмов и фотографий, создание "оживших изображений".

Например:

выставочный проект Национального музея Республики Бурятия и центра "Хэб-Хаб" "Ожившие фотографии", в котором этнографические фотографии конца XIX - начала XX вв. из музейных архивов, демонстрирующие культуру, костюмы и жизнь народов Бурятии, превращаются в короткие видеоролики <382>;

--------------------------------

<382> URL: https://xebxab.space/sainuuger/livephoto (дата обращения: 26.11.2025).

виртуальный проект Центра управления регионом (ЦУР) Челябинской области и Объединенного государственного архива Челябинской области "#ЦУР_74_оживляет_историю", в котором с помощью искусственного интеллекта создаются короткие видео по предоставленным архивистами фотографиям <383>;

--------------------------------

<383> URL: https://up74.ru/articles/obshchestvo/161414/ (дата обращения: 26.11.2025).

проект редакции "Донецк Медиа" "Ожившая фотография", приуроченный к 80-летию Победы, позволяет с помощью цифровых технологий "оживить" архивные снимки периода Великой Отечественной войны <384>.

--------------------------------

<384> URL: https://donetskmedia.ru/tag/ozhivshajafotografija (дата обращения: 26.11.2025).

Такие приемы относятся к области реконструкции и должны быть специально оговорены, чтобы у пользователя не было искаженного представления о подлиннике использованного при реконструкции архивного документа. Рекомендуется использовать реконструкцию только в популяризаторских целях, для привлечения внимания пользователей, однако не подменяя этим публикацию архивных документов.

Современные технологии позволяют также публиковать 3D-реконструкции исторических объектов, созданные на основе архивных документов. Для этого можно использовать специализированные платформы, которые поддерживают интерактивный просмотр моделей. При этом важно сопровождать публикуемые модели максимально подробным набором сведений об их создании: приводить ссылки на источники информации (архивные шифры использованных документов), описание методики реконструкции и историческую справку.

Например:

В проекте "Виртуальная реконструкция московского монастыря "Всех скорбящих радости", созданном на кафедра исторической информатики МГУ при финансовой поддержке гранта РФФИ, N 11-06-00453a (2011 - 2012 гг.), были использованы архивные материалы, содержащиеся в архивах: ЦИАМ (фонд 54, 203, 1178), РГАДА (фонд 1204), ГА РФ (фонд 1215), ЦГАМО (фонды 66, 2157). Материалы по проекту доступны на сайте исторического факультета МГУ <385>.

--------------------------------

<385> URL: https://hist.msu.ru/3D/monastery-auth-1.htm (дата обращения: 26.11.2025).

Создаваемые 3D-модели могут передаваться в архив на постоянное хранение <386> и становиться самостоятельными единицами хранения, соответственно, возможна подготовка на их основе собственно электронных документальных публикаций.

--------------------------------

<386> URL: https://archives.gov.ru/press/13-11-2013.shtml (дата обращения: 26.11.2025).

В целом, применение технологий ИИ в сфере создания электронных документальных публикаций потенциально открывает широкие возможности, начиная от автоматизации рутинных операций (распознавание, разметка) до глубокой семантической обработки и персонализированного взаимодействия с пользователями.

Все это со временем позволит не только повысить эффективность работы по подготовке электронных документальных публикаций, но и обеспечит большее удобство для пользователей при использовании архивных документов в сети Интернет, а также повысит качество восприятия и освоения архивной документной информации пользователями.