Представляю выводы по вопросам, которые были обозначены в предыдущей записи.
1. Определение структуры базы данных и связей.
Описывать структуру нет смысла, сейчас ее в базе данных пока нет.
В нее войдут Дело, Метрическая книга (описание, образ (PDF, JPG) сканированные страницы(JPG)), Ревизская сказка (описание и образ (JPG), справочник населенных пунктов (на основе Указателя по МК).
2. Сканирование.
Метрические книги сейчас сканирует ГАПК в плановом порядке.
Массовое сканирование возможно при дополнительном финансировании.
Что имеем: МК всего 9268 ед.хр. /сканировано 2625 ед.хр./ в БД занесено 2151/ проиндексировано – неизвестно пока.
РС всего 1663 ед.хр. /сканировано 643 ед.хр./ в БД не занесены.
Отсканировано от всего объема 29%.
По БД получаются немного иные цифры, точно только, что количество записей по персонам — 1843762
3. Первичное атрибутирование по каждому виду документов (минимальный набор для поиска информации).
Будет проведен аудит уже сканированных и введенных/проиндексированных в базу данных метрических книг и составлен список на дальнейшее индексирование.
Одновременно будут проходить проверку заголовки Дел и Метрических книг.
Дело (номер и литера фонда; номер и литера описи; номер и литера дела; заголовок описи; заголовок дела)
МК (наименование храма (прихода); местоположение храма (прихода); год создания метрической книги), привязка к Справочнику населенных пунктов.
РС (заголовок книги; год предыдущей ревизии; год заполнения книги; населенный пункт, которому велась ревизия; номер предыдущей ревизии; номер нынешней ревизии)
4. Представление информации.
Первично будет сформирован массив с описаниями всех источников генеалогической информации, находящихся на хранении в Пермском крае (источники – указатели, «Архивный фонд»). Затем присоединены все отсканированные источники и потом будет продолжена индексация по персоналиям.
5. Организация поиска (определение атрибутов или условий) по каждому виду документа (метрическая книга, ревизская сказка) и объекту (населенный пункт, приход, персона).
Быстрый поиск, расширенный поиск, фильтры.
Будут добавлены фильтры и возможность выбора значений при задании условий поиска, а так же увеличено количество полей при отображении результатов поиска.
6. Организация сбора и исправление ошибок индексирования.
База данных требует анализа и проверки на целостность и корректность введенной информации. Будут выявлены и затем исправлены ошибки типа 1000 и 9999 годов рождения, информация, занесенная не в те поля и т.д.
7. Наполнение: очередность, привлечение операторов, проверка, исправление, участие профессионалов.
Будет организовано исправление информации (ошибки ввода, присланные ошибки, привязки к населенным пунктам) специалистами, такие люди откликнулись.
8. Обсуждение вопросов по развитию проекта:
- Предстоит написать программное обеспечение для наполнения и корректировки БД.
- Пока не будут работать функции – Личный кабинет, картографический материал, форум.
- Обратная связь – форма для приема ошибок или встроенный бесплатный сервис для сбора пожеланий, ошибок, отзывов.
Горячо приветствую возобновление работ по проекту АПК «Поколения Пермского края»! Все три года успешно работала оператором. Хотелось бы еще потрудиться.
С уважением — Шабурова Л. И.
Здравствуйте! Проработала оператором длительное время, хотелось бы вернуться в вашу компанию! Очень рада узнать, что проект возобновляется!