Одной из задач развития архивного дела является усовершенствование процессов использования архивных документов путем внедрения современных технологий оцифровки и распознавания, использования в работе архивов компьютерной техники и программного обеспечения. Продукты, такие как модульный комплекс «Единая Архивная Информационная Система» (ЕАИС), от компании «Архивные Информационные Технологии» во многом способствуют решению стоящих перед архивами задач.

Оцифровка и распознавание электронных копий документов в наше время является одной из важных задач информатизации
архивного дела, наряду с автоматизацией комплектования, учета, поиска, хранения архивных документов. Процессы перевода документов в цифровую форму впервые начались еще в 90-х гг. в государственных архивах Российской Федерации с целью создания фонда пользования в электронном виде.

На данное время архивами накоплены достаточно большие объёмы отсканированных электронных копий дел и важной задачей становится использование их для поиска по содержанию документов. Для этого необходимо организовать процессы распознавания и описания документов.

Модуль «Распознавание» из ЕАИС разработан для автоматизации процесса распознавания и включает в себя широкий ряд функции. О них мы и расскажем в этой статье.

Создание структуры хранения каталога фондов

Модуль «Менеджер файлов» позволяет создать файловую структуру папок каталога фондов в соответствии: фонд, опись, том описи (если в описи присутствуют тома), дела для хранения образов дел.

В папке «Сканированные» структура папок каталога фондов дублируется для размещения в них образов документов, которые планируется распознать.

Файлы добавляются простым перетаскиванием мышью из проводника Windows в нужную папку дела.

Структура файлов из папки «Сканированные» идентично отображается на странице модуля «Распознавание», где при выборе дела или группы дел запускается процесс распознавания.

Распознавание по делам

Отправить дело на распознавание можно выбрав пункт «Распознать» в меню действий над делом, кнопка которого находится слева от номера дела.

Пакетные действия: распознавание и обработка

Отправить на распознавание сразу все дела описи можно аналогичным образом, но на уровне описей в файловой структуре.

Выбрав в меню «Пакетная обработка» есть возможность обрезать, изменить размер в пикселях, инвертировать в цвете, отобразить зеркально, повернуть пакет из любого количества образов одновременно.

Создание индивидуальных заданий на распознавание

Выбрав в меню пункт «В задание» создаётся массив образов на распознавание, которые будут распознаны одной группой. Если задания уже были созданы, то здесь необходимо выбрать, в какое именно отправляется данный образ, иначе создаётся новое задание.

Просмотр и редактирование результатов распознавания

После завершения процесса распознавания есть возможность отредактировать результат распознанного текста, а функцией поиска найти необходимы слова или фразы.

Автоматический перенос распознанных дел (текстов) в каталог фондов

После распознавания и редактирования, нажимая, «Перенести в архивный фонд» — распознанный текст с образом перемещается в соответствующие по заданным реквизитам в структуру модуля «Архивный фонд».

Поиск по распознанным текстам через сквозной поиск

В модуле «Сквозной поиск» при вводе в строку поиска искомой фразы осуществляется поиск всем информационным базам данных ЕАИС, а установка галочки «Поиск по изображениям» позволяет добавить поиск по распознанным текстам дел.

Распознанный текст после перемещения из раздела «Распознавание» располагается в модуле «Архивный фонд» в соответствующем деле во вкладке «Образы», где его можно отредактировать и совершить поиск по его содержимому.

А на вкладке «Документы» можно выделить документы, указав их заголовок и номера листов в деле.

Экспорт распознанного и отредактированного текста осуществляется в распространённые форматы документов: Hocr, XML, TXT, PDF.

Подводя итоги изложенного, отметим, что использование модуля «Распознавание» из ЕАИС в условиях оснащения архивов цифровой техникой и наличия отсканированных образов дел, обеспечивает возможность поиска непосредственно по текстам документов. Это позволяет значительно экономить время поиска нужной информации, сокращает время исполнения запросов или подготовки публикаций.

Так же благодаря модулю для распознавания образов с поиском по тексту возможна наиболее эффективная организация удаленного поиска гражданами по архивным документам.

VN:F [1.9.22_1171]
Rating: 0.0/5 (0 votes cast)
VN:F [1.9.22_1171]
Rating: 0 (from 0 votes)