Представляю выводы по вопросам, которые были обозначены в предыдущей записи.

1. Определение структуры базы данных и связей.

Описывать структуру нет смысла, сейчас ее в  базе данных пока нет.

В нее войдут Дело, Метрическая книга (описание, образ (PDF, JPG) сканированные страницы(JPG)), Ревизская сказка (описание и образ (JPG), справочник населенных пунктов (на основе Указателя по МК).

2. Сканирование.

Метрические книги сейчас сканирует ГАПК в плановом порядке.

Массовое сканирование возможно при дополнительном финансировании.

Что имеем: МК всего 9268 ед.хр. /сканировано 2625 ед.хр./ в БД занесено 2151/ проиндексировано – неизвестно пока.

РС всего 1663 ед.хр. /сканировано 643 ед.хр./ в БД не занесены.

Отсканировано от всего объема 29%.

По БД получаются немного иные цифры, точно только, что количество записей по персонам — 1843762

3. Первичное атрибутирование по каждому виду документов (минимальный набор для поиска информации).

Будет проведен аудит уже сканированных и введенных/проиндексированных в базу данных метрических книг и составлен список на дальнейшее индексирование.

Одновременно будут проходить проверку заголовки Дел и Метрических книг.

Дело (номер и литера фонда; номер и литера описи; номер и литера дела; заголовок описи;  заголовок дела)

МК (наименование храма (прихода);  местоположение храма (прихода);  год создания метрической книги), привязка к Справочнику населенных пунктов.

РС (заголовок книги; год предыдущей ревизии;  год заполнения книги;  населенный пункт,  которому велась ревизия; номер предыдущей ревизии;  номер нынешней ревизии)

4. Представление информации.

Первично будет сформирован массив с описаниями всех источников генеалогической информации, находящихся на хранении в Пермском крае (источники – указатели, «Архивный фонд»). Затем присоединены все отсканированные источники и потом будет продолжена индексация по персоналиям.

5. Организация поиска (определение атрибутов или условий) по каждому виду документа (метрическая книга, ревизская сказка) и объекту (населенный пункт, приход, персона).

Быстрый поиск, расширенный поиск, фильтры.

Будут добавлены фильтры и возможность выбора значений при задании условий поиска, а так же увеличено количество полей при отображении результатов поиска.

6. Организация сбора и исправление ошибок индексирования.

База данных требует анализа и проверки на целостность и корректность введенной информации. Будут выявлены и затем исправлены ошибки типа 1000 и 9999 годов рождения, информация, занесенная не в те поля и т.д.

7. Наполнение: очередность, привлечение операторов, проверка, исправление, участие профессионалов.

Будет организовано исправление информации (ошибки ввода, присланные ошибки, привязки к населенным пунктам) специалистами, такие люди откликнулись.

8. Обсуждение вопросов по развитию проекта:

  • Предстоит написать программное обеспечение для наполнения и корректировки БД.
  • Пока не будут работать функции – Личный кабинет, картографический материал, форум.
  • Обратная связь – форма для приема ошибок или встроенный бесплатный сервис для сбора пожеланий, ошибок, отзывов.
VN:F [1.9.22_1171]
Rating: 0.0/5 (0 votes cast)
VN:F [1.9.22_1171]
Rating: -1 (from 1 vote)