С января 2012 года наша компания начала предоставлять услуги по сканированию описей и переводу их в БД программы «Архивный фонд». Первым клиентом стал «Пермский государственный архив новейшей истории».
Задача была следующей: необходимо было перевести в электронный вид описи из 3х фондов, и занести заголовки дел, которые не были уничтожены, в программу «Архивный фонд» 4-й версии.

Работа была разбита на несколько этапов.

Этап 1-й — сортировка описей в каждом фонде.
Описи делились на те, которые можно было отсканировать и получить минимальные проблемы при распознавании, и на те, которые перевести в электронный вид можно было, только набирая вручную в Word.
Те описи, которые можно было отсканировать, делились ещё на 2 группы:

  • описи, которые удобно было расшить и отсканировать с использованием поточного сканера;
  • описи, которые удобнее было отсканировать с использованием планшетного сканера. Это описи небольшого объема (2-4 листа), описи со склеенными в переплете страницами и описи, которые было проблематично расшить.

Этап 2-й:

  • Сканирование

Для сканирования использовалась программа ABBYY FineReader 11 со следующими настройками: Оттенки серого, разрешение 400 dpi.
Для последующей обработки каждая отсканированная опись сохранялась как документ FineReader. Затем, в документе размечались области, и проводилось распознавание. Большинство ошибок было исправлено в самом документе FineReader. После, с помощью той же программы, опись сохранялась как документ Word.

  • Перепечатывание описей вручную

Это заняло намного больше времени, чем сканирование. Опасность у такого метода перевода в электронный вид в том, что при проверке сложно выявить ошибки, допущенные человеком. Программа ABBYY FineReader чаще всего, в отличие от человека, выделяет те символы, в правильности распознания которых, она не уверенна.

Этап 3-й — Подготовка электронных копий описей.
Чаще всего, это были распознанные документы FineReader, сохраненные в формате PDF. Опись в электронном варианте по внешнему виду похожа на бумажный оригинал.
Если же опись была перепечатана вручную, то создавался документ Word, подписи и информация об итоговых проверках сканировалась и вставлялась в документ картинками.
В таком виде опись соответствует оригиналу лишь по содержанию, но это не мешает её использованию в качестве 2-ого или 3-ого экземпляра.

Этап 4-й — Подготовка текстовых файлов для переноса в программу «Архивный фонд» версии 4.
Все описи были сохранены в файлах Word *.doc. Затем, частично руководствуясь инструкцией пермского архивиста Сергея Плотникова, каждая опись в Word была подготовлена к переносу заголовков дел в программу «Архивный фонд».
Особые правила оформления описи были нужны для того, чтобы использовать для переноса заголовков дел программу «АвтоАФ», разработанную Сергеем Плотниковым, поскольку занесение заголовков дел вручную — это огромные временные затраты.

В ходе работы была составлена собственная инструкция по работе с текстовыми файлами.
1. Включить отображение всех знаков (Непечатаемых символов).
2. Выделить весь текст (сочетание клавиш Ctrl+A).
3. Отчистить формат.
4. Применить стиль Word 2003.
5. Выбрать шрифт TNR 12, межстрочный интервал оставить одинарный.
6. Настроить поля: поле слева 2,5 см, с других сторон по 1 см.
С такими параметрами комфортнее работать с документом, лучше воспринимается информация.
7. Выровнять заголовок описи по центру, оставить Enter между заголовком и таблицей.
8. Таблица описи, после обработки в FineReader, в Word разделена на несколько таблиц либо Enter, либо разрывами разделов. Чтобы склеить таблицы нужно:
8.1 Выделить первую таблицу полностью — Включить отображение всех границ — С помощью Автоподбора выровнять по ширине окна.
8.2 Выделить вторую таблицу полностью — Включить отображение всех границ — С помощью Автоподбора выровнять по ширине окна.
И т.д.
8.3 Удалить Enter и/или разрывы между таблицами, тем самым склеив их в одну.
8.4 Выровнять столбцы, если необходимо.
9. Выделить склеенную таблицу полностью и кликнуть по ней правой кнопкой мыши, выбрать «Свойства таблицы» и во вкладке «Строка» убрать галочки из пунктов «Высота» и «Разрешить перенос строк на следующую страницу».
10. Вновь выделить таблицу полностью, применить выравнивание к ячейкам «В центре ячейки по центру».
11. Выделить столбец, где заголовки дел и применить к нему выравнивание « В центре ячейки справа».
12. Текст в шапке таблицы и Заголовки подразделов выровнять обратно по центру.
13. Работа с содержимым таблицы:
13.1 На каждой из строк с заголовками Рубрикатора описи кликнуть правой кнопкой мыши, установить для заголовка жирный шрифт. В меню «Абзац» во вкладке «Положение на странице» поставить галочку у пункта «Не отрывать от следующего». Тем самым удастся избежать ситуации, когда строка с заголовком подраздела останется на предыдущей странице, а заголовки дел этого подраздела начнутся с новой.
13.2 Даты:
Если даты указаны в двух столбцах, то формат: 00.00.0000

Если в одном столбце, то формат 00.00.0000-00.00.0000 (через дефис без пробелов).

Если стоит день и месяц, то нужно добавлять год в формате 0000, если указаны месяцы, например, январь и декабрь, то интервал записывается в одном столбце 01.01.0000-31.12.0000 (первый день первого месяца и последний день последнего месяца) или в разных столбцах: начальная дата, конечная дата.
13.3 Необходимо удалить лишние пробелы. Это можно сделать с помощью замены 2-х пробелов на 1. Процедуру провести раза 2-3.
14. Если в описи у заголовка дела есть отметка «Уничтожено», «Выбыло», то такой заголовок не переносится в программу «Архивный фонд». Из таблицы необходимо удалить строку с этим заголовком дела.
15. Для переноса в «Архивный фонд» нужны столбцы: номер дела, заголовок дела столбец(цы) с датами и столбец с указанием количества страниц. Остальные столбцы нужно удалить.
Также нужно удалить шапку таблицы.
16. Нужно заменить обычные знаки абзаца в многострочных заголовках на перенос строки в виде . Так как «АвтоАФ» не воспринимает знаки абзаца и разобьет многострочный заголовок на несколько отдельных заголовков и выдаст при проверке ошибку.
17. Выделить таблицу, через контекстное меню применить автопобор «По содержимому».
18. Привести информацию заголовка над таблицей к следующему виду:
Фонд *указать номер фонда*
Опись *указать номер описи*
*Указать тип дел* (л/с, упр. и т.п.)

Пример:

Фонд 582
Опись 1
упр.

1 1918-1919 годы
1. Протоколы общих собраний комитета Красно-Верещагинского РК ВКП(б), выписки из протоколов и переписка по организационной работе комитета, списки коммунистов, участвующих на субботниках. 29.11.1918 27.12.1919 164
2. Протокол №1 частного совещания членов РКП(б) Красно-Верещагинской организации с представителями комитетов РКП воинских частей. Протоколы заседаний комитета районной организации. 28.12.1918 27.10.1919 26

19. Таблицу необходимо преобразовать в текст. Схема следующая:
Выделить всю таблицу, в меню «Таблица» (в Word 2010 вкладка «Макет») выбрать «Преобразовать таблицу» — «Таблицу в текст». Разделителем выбрать «Знак табуляции».
20. Сохранить файл как — выбрать для сохранения формат TXT.

VN:F [1.9.22_1171]
Rating: 0.0/5 (0 votes cast)
VN:F [1.9.22_1171]
Rating: 0 (from 0 votes)