Раздел 6.
ЭЛЕКТРОННЫЕ БИБЛИОТЕКИ. СОВРЕМЕННЫЕ ТЕНДЕНЦИИ.
БИБЛИОТЕКА МЭИ - ИСТОРИЯ, ОПЫТ И ОСНОВНЫЕ НАПРАВЛЕНИЯ РАБОТЫ.
КОРПОРАТИВНЫЕ БИБЛИОТЕЧНЫЕ СИСТЕМЫ.
6.9. Основной протокол корпорации вузовских библиотек - Z39.50.
Архитектура "Клиент-сервер".
Модель сетевого взаимодействия с базами данных "клиент-сервер" такова: данные и их обработка производится на сервере, визуализация производится на компьютере клиента. При этом отпадает необходимость держать на компьютере клиента громоздкое и дорогое программное обеспечение СУБД, оно исполняется на сервере и называется сервером баз данных. На компьютере клиента остается только клиентское программное обеспечение, предназначенное для организации связи с сервером БД, формирования запросов и визуализации данных.
Сервер баз данных, несомненно, сложное и дорогое программное обеспечение. Но таких программ много не надо: хороший сервер БД способен обслуживать тысячи пользователей одновременно в зависимости от ресурсов компьютера, на котором он исполняется.
В качестве примеров серверов БД можно привезти следующие известные продукты известных производителей: Oracle, Microsoft SQL Server, Informix, DB2 IBM и др.
Однако только архитектура не может решить всех проблем сетевого доступа к базам данных. Несомненно, при помощи каждого из вышеперечисленных продуктов можно построить высокоэффективные распределенные информационные системы, если использовать однотипные серверы. В гетерогенной информационной системе, где используются серверы различных производителей, плохо или никак не взаимодействующих друг с другом, возникают проблемы построения единого информационного пространства. Все перечисленные серверы работают на фирменных протоколах обмена данными, эти протоколы между собой несовместимы. Поэтому на клиентском компьютере нужно держать клиентское программное обеспечение для каждого из этих серверов.
Проблемы несовместимости протоколов обмена данными становятся неразрешимыми, когда в качестве единого информационного пространства рассматривается вся Интернет или ее большая часть. Мы заведомо не знаем, какие серверы могут предоставить нам данные и какое клиентское программное обеспечение потребуется для доступа к ним.
Решение проблемы может быть лишь в унификации доступа к серверам любых производителей и базам данных. Именно для этой цели мировое сообщество придумало набор правил под общим названием Z39.50.
В последнее время в библиотечном деле все чаще стало употребляться слово Z39.50. Современные автоматизированные библиотечные системы основаны на использовании вычислительной техники и предоставляют читателям и профессиональным библиотекарям широкий набор услуг по обработке информации. Одним из элементов технологий, обеспечивающих функционирование таких систем, является протокол Z39.50, определенный соответствующим стандартом (ANSI Z39.50-1995, ISO/FDIS 23950). Протокол - это правила обмена информацией между компьютерами, непосредственно не касающиеся конечного пользователя, но обеспечивающие его каким-либо сервисом. Стандарт Z39.50 определяет такие правила взаимодействия компьютеров, которые позволяют пользователю при помощи одной- единственной программы, выполняющейся на компьютере-клиенте производить поиск информации в базах данных, поддерживаемых компьютерами-серверами. Для библиотекаря это означает то, что он со своего рабочего места, оборудованного недорогим персональным компьютером, сможет искать, получать и обрабатывать в электронном виде библиографические описания, хранящиеся в больших базах данных на мощных ЭВМ. Причем для этого ему будет необходимо освоить всего лишь одну программу.
Единый интерфейс доступа к различным базам данных

Z39.50 позволяет получать полезную информацию локально, например, в пределах одной библиотеки, а также удаленно - из других библиотек или центров обработки библиографической информации. Естественно, пользователь может получать требуемую информацию прямо из дома, при помощи домашнего компьютера.
Варианты доступа к библиографической информации.

Z39.50 разрабатывался в Библиотеке Конгресса США с начала 80-х годов и предназначался для обработки библиографической информации. Необходимость разработки данного протокола обусловливалась рядом причин:
- наличием множества различных поисковых языков;
- наличием множества различных интерфейсов пользователя;
- неудобством представления информации.
С ростом интереса к Z39.50 в 1990 году была создана группа разработчиков, в состав которой входят различные производители, поставщики информации, консультанты, учебные заведения, желающие получать или предоставлять доступ к различным видам информации, включая библиографическую, техническую, финансовую, тексты, изображения, аудио- и видеоматериалы. Образованное в 1989 году при Библиотеке Конгресса США Агентство поддержки Z39.50 организует работу членов этой группы разработчиков и учитывая их предложения создает новые версии стандарта, последняя из которых была принята ANSI в 1995 году и ISO в 1997 году. В настоящее время уже существует множество Z39.50 приложений и их число неуклонно растет.
Конечно, существуют и другие протоколы, обеспечивающие поиск и извлечение информации в глобальных информационных системах (HTTP, Gopher и т.д.). Но Z39.50 выгодно отличается от них тем, что форма представления результатов поиска (библиографических описаний), так же как и способ ввода поисковых запросов не зависит от источника информации. Это определяется тем, что Z39.50 использует качественно иную модель взаимодействия компьютеров. Эта модель позволяет абстрагироваться от способа организации конкретной базы данных, сделать доступ к ее содержанию независимым от формы хранения последнего. Различные вычислительные системы используют различные средства и методы описания, хранения и доступа к библиографическим данным - Z39.50 избавляет пользователя от необходимости адаптации к каждому из источников информации. Поэтому внедрение Z39.50 в библиотеках позволяет сократить время обучения библиографов работе с различными базами данных, а также повышает производительность их труда.
Здесь следует отметить, что стандарт Z39.50 определяет лишь взаимодействие компьютеров, но не описывает взаимодействие между конечным пользователем и программой-клиентом. Таким образом, пользователь может выбрать из доступных клиентских приложений наиболее удобное для себя и использовать его как универсальное средство доступа к библиографическим базам данных имея при этом единую форму представления данных.
В какой-то степени протокол Z39.50 может оказывать влияние на работу программы-клиента. Стандарт предусматривает возможность выбора пользователем формы представления извлекаемых библиографических описаний - простой текстовый формат, 15 диалектов формата MARC и т.д. Конечно, разнообразие форм представления информации определяется не только возможностями конкретного Z39.50 клиента, но и возможностями Z39.50 сервера. Например, сервер Библиотеки Конгресса США предоставляет записи только в формате USMARC, а сервер BIBSYS поддерживает 3 формата - NORMARC, USMARC и SUTRS - (простой текстовый). При этом пользователь получает потенциальную возможность копирования записей из удаленных баз данных в локальные, исключая достаточно трудоемкий процесс создания собственных библиографических описаний. Следует заметить, что этот аспект работы с библиографической информацией в ряде стран регулируется законами об авторском праве и интеллектуальной собственности. С целью исключения возможности незаконного копирования такой информации некоторые Z-сервера предоставляют доступ к библиографическим описаниям только в простом текстовом формате, наименее удобном для последующей обработки. Основными возможностями Z39.50 являются поиск и извлечение информации. Два этих понятия тесно связаны между собой. Извлечение информации возможно только лишь, после того как она найдена, а результат поиска сам по себе (в Z39.50 им является набор идентификаторов найденных записей) не имеет практической ценности без последующего извлечения данных.
В настоящее время в мире функционирует несколько сотен серверов, которые в основном обеспечивают доступ к библиографическим базам данных. В терминологии Z39.50 базой данных является набор записей, которые в свою очередь состоят из элементов. В нашем случае запись - это библиографическое описание, элементами которого являются имена авторов, заглавие и т.д. По некоторым (не обязательно по всем) элементам можно производить поиск. Пользователь может составлять довольно сложные поисковые запросы с использованием логических операторов (И, ИЛИ, И-НЕ), операций отношения (>, <, = и т.п.). Например, найти все издания, автором которых является Иванов, выпущенные издательством "Финансы и статистика" после 1990 года, причем в заглавии должно быть слово "судостроение" или "машиностроение". Имеется возможность искать записи по начальным и конечным буквам слов. Стандартом предусмотрены и более изощренные способы поиска информации. Разумеется, полнота этих возможностей определяется конкретными реализациями сервера и клиента, которые, в зависимости от решаемых задач, могут обеспечивать как простые, так и довольно сложные поисковые запросы.
Z39.50 предоставляет возможность одновременного поиска в нескольких базах данных, поддерживаемых одним сервером. Пусть, например, в библиотеке имеется Z-сервер, обеспечивающий доступ к базам данных различных отделов (учебной, научной, художественной литературы и т.д.). В этом случае удобство одновременного поиска читателем необходимых ему изданий является очевидным. Также возможно проведение поиска одновременно в базах данных нескольких серверов. Такая возможность реализована в некоторых клиентских приложениях - пользователь может искать необходимую литературу сразу в нескольких библиотеках.
Z39.50 предоставляет разнообразные средства извлечения найденной информации. Пользователь может не только указывать желаемую форму представления библиографических описаний, о чем уже было сказано выше, но и управлять содержанием извлекаемой информации, указывая спецификацию элементов. Например, при извлечении большого количества записей имеет смысл извлекать краткие записи, содержащие информацию только об авторах, заглавии и дате издания. После чего, на основании полученных данных, можно получать более подробные сведения.
Существует возможность управления не только формой представления всего библиографического описания, но и видом его элементов. Это позволяет получать библиографические описания, оформленные в соответствии с различными правилами каталогизации. Например, пользователь может указать, использовать или нет дефисы в ISBN.
|