Перед тем как раскрыть тему, хочется порассуждать на один вопрос: с какой целью архивы выкладывают информацию, базы данных в Интернете? Ответ вроде бы очевиден — для предоставления широкого доступа к информации, при этом, тот кто ищет эту информацию не обязан знать о существовании архивов.

Что делает обычный пользователь Интернета, который хочет что-то найти? Заводит искомую фразу в поисковике, типа Яндекс и Гугл и получает список сайтов с этой фразой, при этом он будет использовать только сайты с первой страницы. Таким вот образом, мой одноклассник недавно нашел личное дело (1921 г.) своего деда, о котором вообще ничего не знал, в каталоге фондов пермского архива. А не совсем наоборот, он не искал сначала все возможные архивы и не искал затем в их базах данных.

Так вот, до сих пор в Интернете достаточно много информационно-поисковых систем в которых можно искать ТОЛЬКО на самом сайте архива, сюда же относится и сводный «Центральный фондовый каталог». Как может пользователь, не связанный с архивами узнать о его существовании?

К этим системам относятся все системы, которые используют окно входа или страницу с поисковой строкой, как у «ЦФК». Такие системы в технологическом решении являются «закрытыми» для индексации поисковыми системами, так как индексацией занимаются роботы, которые ходят по ссылкам, нет ссылок, значит нет доступа к страницам, которые динамически создаются базами данных.

Это тема не один раз затрагивалась Е.В. Бобровой, написавшей «Рекомендации по созданию архивного сайта в Интернет».  В очередной раз хочется обсудить этот вопрос, с целью понять, понимают ли сами архивы это или это делается осознанно?

Есть очевидные причины — вести учет пользователей, не показывать сразу всю информацию, проводить идентификацию… Только стоят ли эти причины «зактрытости» баз данных? Те же самые задачи можно решить другими способами, без ущерба индексации, а уж про «ЦФК» причины не понятны вообще. Замечания в адрес Росархива и разработчиков я писала еще сразу после его появления, но деньги «улетают» миллионами, а система остается «закрытой», почему?

Теперь перейдем к наглядной демонстрации.

Всем известно, что основным поставщиком посетителей на сайты являются поисковые системы, такие как Гугл и Яндекс. Следовательно, чем больше страниц данные системы проиндексируют, тем больше посетителей придет на сайт. Базы данных — это тоже страницы, которые формируются динамическим способом, то есть, сколько записей в базе данных, столько и страниц. При определенном запросе в поисковике можно узнать сколько страниц он проиндексировал, например:

Нашлось 2 млн. результатов, при наличии базы данных «Сводного каталога фондов» в 3 млн. записей.

Теперь другие каталоги:

По 20 страниц из огромного возможного количества записей в этих базах данных. У Ярославского госархива ситуация для пользователей упрощается тем, что на Портале архивных учреждений Ярославской области в «Сводном каталоге» (более 2-х млн. записей) есть база данных госархива и она успешно проиндексирована и доступна для поиска, а в систему на сайте госархива они пойдут уже за конкретной услугой. Вот разница, есть ссылки и нет ссылок.

Теперь продемонстрирую, что данные из «закрытых» систем не находятся через поисковики.

 

 

 

 

 

Откроем подобную систему, выделим название дела и вставим в поисковик:

Как видно, в выдаче сайт Воронежского архива отсутствует. Можно долго проверять любые «закрытые» системы, покажем положительный пример:

 

 

 

 

 

и в результате поиска на первом месте:

 

Случайно обнаружили, что не все «открытые» системы успешно индексируются тоже, причиной может стать медленное открытие страниц, когда робот не дожидается и уходит.

 

 

 

 

 

Вологодский фонд не нашелся в «ЦФК» каталоге, но нашелся в «Сводном каталоге фондов«, куда пойдет пользователь?

Проверьте свои системы, уважаемые архивисты!

Все очень просто: либо вы поднимаете посещаемость своего сайта, либо намеренно прячете свои базы данных.

Надеюсь, что информация была полезной, и очень хотелось бы узнать насколько.

Напишите в комментариях, знали ли вы, что базы данных вашего архива не индексируются поисковыми системами? Или вы специально ставили перед разработчиками определенные задачи и условия? Тогда почему?

VN:F [1.9.22_1171]
Rating: 5.0/5 (4 votes cast)
VN:F [1.9.22_1171]
Rating: 0 (from 0 votes)
Почему «закрыты» архивные базы данных в Интернете, 5.0 out of 5 based on 4 ratings