Рейтинг
Порталус

Новые возможности поисковых средств портала ВГБИЛ

Дата публикации: 12 июля 2014
Автор(ы): Колосов К. А.
Публикатор: Научная библиотека Порталус
Рубрика: КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ
Источник: (c) Научные и технические библиотеки, № 1, Январь 2006, C. 92-95
Номер публикации: №1405159415


Колосов К. А., (c)


ВГБИЛ им. М. И. Рудомино

В 2005 г. Всероссийская государственная библиотека иностранной литературы им. М. И. Рудомино приступила к разработке своего нового веб-портала. В настоящее время создан поисковый модуль, который будет предоставлять читателям библиотеки интегрированный поиск по всей совокупности доступных электронных ресурсов:

электронному каталогу (OPAC) ВГБИЛ,

электронной библиотеке ВГБИЛ,

информационным страницам и электронным изданиям веб-сайта ВГБИЛ,

тематическим базам данных, ведущимся во ВГБИЛ,

электронным ресурсам библиотечных корпораций, в работе которых участвует ВГБИЛ,

электронным публикациям и базам данных EBSCO.

При разработке веб-портала применяются общие принципы Интернет/Интранет-технологии, обеспечивающие единообразный механизм доступа к порталу как из внутренней сети библиотеки, так и из Интернета, но с разграничением прав доступа для внешних и внутренних пользователей. Для пользователей Интернета полностью доступны электронный каталог библиотеки, страницы веб-сайта и поиск по каталогам библиотечных корпораций, т. е. электронные ресурсы, не содержащие полных текстов электронных документов по причинам ограничений, связанных с обеспечением авторских прав и лицензионных соглашений. В то же время читатель в залах библиотеки по-

стр. 92

лучит доступ ко всей совокупности электронных ресурсов, включая статьи из баз данных EBSCO, электронной библиотеки ВГБИЛ и других доступных источников.

В основе технической реализации поискового модуля лежит использование решений на основе протокола Z39.50, разработанных во ВГБИЛ совместно с ГПНТБ России для проектов корпоративной сети московских библиотек и системы автоматизации библиотек ИРБИС64, а также программных модулей, созданных во ВГБИЛ в процессе работы в консорциуме РИБК.

Формирование поисковых запросов и представление результатов поиска осуществляется через программный шлюз HTTP-Z39.50. В отличие от предыдущей версии данные из всех источников представляются в кодировке UNICODE (UTF-8). Кроме того, изменена логика обработки пользовательских запросов. Если в предыдущей версии шлюза пользователь должен был всегда указывать каталоги, участвующие в поиске, то теперь в основном режиме поиск производится по всем подключенным каталогам одновременно. Для формирования первичного поискового запроса берется всего одно поле по аналогии с популярными поисковыми системами Интернета и порталом РИБК. При обработке первичного поискового запроса используются только базы данных, расположенные во ВГБИЛ. Пользователь получает список, содержащий количество найденных документов в каждой базе данных. После этого он может перейти к просмотру найденных записей, расширить число подключенных источников за счет серверов Z39.50 корпоративной сети московских библиотек и РИБК, а также базы данных EBSCO. Если необходимо сформировать сложный поисковый запрос, то можно применить интерфейс расширенного поиска.

Веб-портал - основное средство доступа к базам данных электронного каталога ВГБИЛ, работа над новой версией которого ведётся отделом автоматизации. В отличие от системы TINLIB, используемой до настоящего времени в ВГБИЛ, новая версия АБИС создаётся на основе СУБД ORACLE, что обеспечивает широкие возможности для поддержки UNICODE и средств представления данных в коммуникативных форматах, включая RUSMARC.

Другим крупным источником информационных ресурсов ВГБИЛ является электронная библиотека, работа над которой ведётся отделами информационных технологий и электронных публикаций. В основе электронной библиотеки лежит использование СУБД MySQL для хранения библиографических описаний электронных ресурсов.

Для обеспечения универсального доступа ко всем информационным источникам отдел информационных технологий ВГБИЛ разрабатывает провайдер данных, обеспечивающий взаимодействие сервера Z39.50 и СУБД

стр. 93

ORACLE и MySQL на основе использования языка SQL-запросов и модулей сервера Z64.

Сервер Z64 разработан отделом информационных технологий ВГБИЛ совместно с ГПНТБ России и в своей базовой версии содержит провайдер данных для ИРБИС64. На основе такой конфигурации во ВГБИЛ обеспечивается поддержка баз данных Z39.50 ВГБИЛ и некоторых баз данных в режиме хостинга: Парламентской библиотеки (3 базы данных) и ГПНТБ России (сводный каталог по научно-технической тематике).

Функциональные особенности сервера Z64:

встроенный провайдер данных ИРБИС64;

неограниченное число подключаемых баз данных;

встроенный контроль прав доступа пользователей на основе анализа IP-адресов клиентов;

поддержка форматов представления данных ISO-2709 (RUSMARC, UNIMARC, MARC-21), SUTRS, XML;

возможность настройки форматов представления данных путем редактирования внешних форматных файлов, написанных на языке форматирования ISIS;

поддержка кодировки UTF-8;

поддержка набора поисковых атрибутов bib-1 (с возможностью их редактирования), а также соответствие требованиям профайла Bath (требования по совместимости возможностей поиска).

Одной из задач веб-портала является поддержка полнотекстового поиска по информационным страницам и электронным изданиям веб-сайта ВГБИЛ. Существуют несколько подходов к решению этой задачи: использование индексации с помощью локальной версии системы Яндекс, индексация содержимого сайта, скопированного в базу данных (например полнотекстовый поиск в ИРБИС), и др. С целью обеспечения совместимости технических решений веб-портала выбран вариант использования для полнотекстового поиска отдельного сервера Z39.50 на основе пакета ISITE. Несмотря на то, что этот пакет разработан очень давно, он позволяет производить индексацию больших массивов полнотекстовых документов без их перекачки в базу данных и обеспечивать поиск средствами запросов протокола Z39.50. Проведенная доработка пакета ISITE устранила ряд проблем, связанных с кодировками, отличными от Latin-1, а средства веб-портала позволяют при выводе найденных документов выделять цветом искомые слова аналогично интерфейсам поисковых порталов Интернета.

Таким образом, новый поисковый портал ВГБИЛ будет предоставлять пользователям современный и удобный доступ к множеству электронных

стр. 94

источников, включая полнотекстовые электронные документы. По мере изменения потребностей пользователей список информационных источников портала легко редактировать, так как портал взаимодействует со всеми источниками информации по протоколу Z39.50. В то же время пользователи не догадываются об использовании этого протокола, так как их общение с системой происходит с помощью стандартного веб-браузера.

Организация поиска по различным информационным источникам, включая полнотекстовые базы данных, серверы Z39.50, открытые архивы OAI, вызывает интерес у многих разработчиков. Помимо дальнейшего развития программных протоколов всё большее значение приобретает оптимизация состава информационных источников, участвующих в обработке поисковых запросов, за счет динамического формирования так называемых целевых поисковых групп по региональным и тематическим признакам. В разрабатываемом веб-портале ВГБИЛ используется начальный уровень подобной оптимизации, при котором последовательно расширяется область охвата информационных источников: от локального к региональному и к полнотекстовым источникам в Интернете (EBSCO). По мере расширения числа доступных полнотекстовых источников информации будет совершенствоваться и алгоритм оптимизации поиска на портале ВГБИЛ.

Портал ориентирован на читателей библиотеки, для которых интерес представляет не просто библиографическая информация, а сами источники, т. е. книги, доступные во ВГБИЛ и библиотеках ближайшего региона, а также электронные документы и издания, доступные для прочтения на экране монитора.

Опубликовано на Порталусе 12 июля 2014 года

Новинки на Порталусе:

Сегодня в трендах top-5


Ваше мнение?



Искали что-то другое? Поиск по Порталусу:


О Порталусе Рейтинг Каталог Авторам Реклама