О доступе к информационным ресурсам по культурному наследию по протоколу Z39.50.

Жижимов О.Л., Мазов Н.А.
Объединенный Институт Геологии, Геофизики и Минералогии
Сибирского Отделения Российской Академии Наук
Адрес: 630090, Новосибирск-90, пр.Коптюга 3
Факс: (383-2) 33-27-92
Internet:
http://geolibr.uiggm.nsc.ru

Предоставление доступа из Internet к электронным ресурсам может быть организовано различными способами с применением различных технологий и протоколов. На сегодняшний день самым распространенным способом является WEB как наиболее простой и эффективный способ организации сетевого доступа к информационным ресурсам различного характера. Однако технология WEB не позволяет построить распределенные информационные системы со сквозным поиском и едиными для всех систем интерфейсами. В WEB отсутствует важная компонента – глобальная стандартизация на уровне организации данных и форматов их представления. На сегодняшний день единственной технологией, содержащей подобную компоненту, является технология, основанная на международном стандарте ISO-23950 (Z39.50) [1].

Протокол Z39.50 был создан для унификации сетевого доступа к любым базам данных в 1988 году. Действующая сегодня версия 3 протокола появилась в 1995 году. И если в первые годы своего существования протокол использовался преимущественно для организации доступа к библиографическим ресурсам, то на сегодняшний день область его применения существенно расширена, он используется для доступа к научно-технической информации, к геоинформационным ресурсам, к глобальным базам метаданных и др. Существует также возможность предоставления доступа по Z39.50 к музейной информации и цифровым коллекциям. Именно этому аспекту в Z39.50 и посвящен настоящий доклад.

Правила, которые регламентируют работу с музейной информацией в Z39.50, сформулированы в документах CIMI (Consortium for the Computer Interchange of Museum Information) и составляют профиль CIMI [2]. Элементы этого профиля имеют глобальные идентификаторы и являются частью международного стандарта ISO-23950.

Профиль CIMI оперирует со следующими объектами Z39.50:

Поисковые атрибуты: Bib-1 1.2.840.10003.3.1
CIMI-1 1.2.840.10003.3.8
Диагностика: Bib-1 1.2.840.10003.4.1
Форматы: GRS-1 1.2.840.10003.5.105
SUTRS 1.2.840.10003.5.101
Usmarc 1.2.840.10003.5.10
Схемы: Digital Collections Schema 1.2.840.10003.13.3
CIMI Schema 1.2.840.10003.13.5
Наборы меток: TagSet-M 1.2.840.10003.14.1
TagSet-G 1.2.840.10003.14.2
Collections TagSet 1.2.840.10003.14.5
CIMI TagSet 1.2.840.10003.14.6

Табл.1: Объекты Z39.50 для CIMI.

На основе этих объектов определена модель поиска и извлечения данных с музейной информацией.

Полное описание профиля CIMI достаточно объемно и здесь приводиться не будет. Ниже будут отмечены только некоторые аспекты, которые на наш взгляд характерны для этого профиля.

Во-первых, все серверы CIMI обязаны поддерживать запросы типа 1 (RPN) с набором поисковых атрибутов CIMI-1, который содержит как атрибуты общего плана (Title, Author, Abstract и т.п.), так и специфические атрибуты для музейных коллекций (repositoryPlace, dateOfOrigin, placeOfOrigin, dateCollected и т.п.). Кроме этого набор атрибутов CIMI содержит в себе поисковые атрибуты Dublin Core.

Во-вторых, схема данных и абстрактная структура записи CIMI основана на иерархической модели с использованием схем Digital Collections и Dublin Core. Элементы последней явно присутствуют в CIMI на первом уровне вложения. Собственно структура записи CIMI вложена в элемент actualDO записи Digital Collection (см. Табл.1). Эта схема данных позволяет представить в стандартном виде описательную информацию о музейных ресурсах, т.е. является схемой метаданных. Связь с изображениями и полными текстами осуществляется через URL в элементе mrObject/rendition/resource.

localControlNumber, schemaIdentifier,
title, creator, contributor, date, description, identifier, type, language, subject, publisher, format, source, relation, coverage, rights,
typeOfDescriptiveRecord, objectInfo
  typeOfObject, categoryOfObject, digitalObject
    actualDO
      schemaIdentifier, objectName, objectTitle, bibliographicTitle, creatorGeneral, creatorInfo
      name, dateOfBirth, dateOfDeath,
nationalityCultureRace, role
      fieldCollector, repositoryName, repositoryPlace, owner,
creditLine, subject, publisher, objectID, materialMedium, processTechnique, dimensions, placeOfOrigin, dateOfOrigin, dateCollected, agePeriod, typeSpecimen, stylePeriod, periodName, provenance, quantity, award, collection,
inscriptionMark, objectLanguage, condition, physicalDescription, protectionStatus, protectionDate, spatialReferencingSystem,
x-coordinateInSpatialReferencingSystem,
y-coordinateInSpatialReferencingSystem, address,
relatedObjects, relatedTextualReferences, associationGeneral,
association
        name, place, event, activity, description
      contentGeneral, content
        name, place, event, activity, description
      contextHistorical, contextArchaelogical, copyrightRestriction, wallTextLabel, displayObject, mrObject
        title, creator, contributor, date, description, type, language, subject, publisher, format, source, relation, coverage, rights, rendition
          resource, title, creator, contributor, date, description, type, language, subject, publisher, format, source, relation, coverage, rights
      administrativeEventGeneral, administrator, administrativeEvent
        administrativeEventType, date, creator, role

Табл.2: Вложение схем Dublin Core и CIMI в схему Digital Collections

Наконец, основным форматом представления данных в CIMI является GRS-1.

Возникает вопрос, какое программное обеспечение серверов можно использовать для организации распределенных информационных систем профиля CIMI. В России на сегодняшний день существует только один программный продукт с поддержкой CIMI – сервер ZooPARK, разработанный в ОИГГиМ СО РАН авторами доклада. Сервер ZooPARK предназначен для эксплуатации в качестве базового сервера Z39.50 (ISO-23950) распределенной информационной системы общего назначения на различных программно-аппаратных платформах [3].

Установленные в узлах информационной системы однотипные сервера ZooPARK могут образовывать кластеры с перераспределением поисковых запросов. Серверы Z39.50 других производителей также могут быть включены в подобные кластеры, но с ограниченными возможностями.

Zhizhimov-R1.gif (12828 bytes)

Рис.1 Схема распределенной информационной системы

Сервер ZooPARK имеет модульную архитектуру. Все процедуры доступа к конкретным СУБД выделены из ядра сервера в отдельные динамические библиотеки – провайдеры данных. Интерфейс “ядро – провайдер данных” документирован. Это позволяет самостоятельно создавать провайдеры данных для различных СУБД. На сегодняшний день существуют провайдеры данных для CDS/ISIS, провайдер удаленного сервера Z39.50, провайдер для данных Zebra (IndexData). Авторам также известны случаи создания других провайдеров данных для ZooPARK сторонними разработчиками. Более подробная информация о сервере ZooPARK доступна по адресу: http://geolibr.uiggm.nsc.ru/pubs/products.asp.

Наличие сервера Z39.50 не решает всех проблем доступа к информационным ресурсам. Необходимо наличие клиентского программного обеспечения. В качестве такого программного обеспечения удобно использовать шлюз Z39.50-WWW. В ОИГГиМ СО РАН разработан подобный шлюз для Windows NT, представляющий собой CGI-приложение с функциями клиента Z39.50. Шлюз содержит возможность настройки внешнего интерфейса пользователя и наборы шаблонов для представления информации. Опыт эксплуатации шлюза показал, что он эффективен при построении информационных систем, основанных на метаданных, т.к. позволяет с одной стороны проводить поиск и просматривать записи из баз метаданных, а с другой – выходить по гипертекстовым ссылкам на сами данные – полные тексты и графику, использую технологии WEB. Шлюз доступен по адресу: http://geolibr.uiggm.nsc.ru/zgwn.

В заключение, авторы выражают надежду, что музейное сообщество России подключится к программе предоставления доступа к своим информационным ресурсам по протоколу Z39.50.

Литература:

  1. ANSI/NISO Z39.50-1995. Information Retrieval (Z39.50): Application Service Definition and Protocol Specification. Z39.50 Maintenance Agency Offical Text for Z39.50-1995, July 1995.
  2. The CIMI Profile Release 1.0H A Z39.50 Profile for Cultural Heritage Information http://www.cimi.org/documents/HarmonizedProfile/HarmonProfile1.htm
  3. Жижимов О.Л., Мазов Н.А. Модель распределенной информационной системы Сибирского Отделения РАН на базе протокола Z39.50. Электронные библиотеки, 1999, т.2, вып.2, ISSN 1234-5678. 

Жижимов Олег Львович, к.ф.-м.н., заведующий сектором Информационных Технологий, ОИГГиМ СО РАН
Тел. служ. (383-2) 33-20-05
E-Mail: zhizhim@uiggm.nsc.ru

Профессиональная деятельность:

Разработка программного обеспечения Z39.50:

Объединенный Институт Геологии, Геофизикик и Минералогии Сибирского Отделения АН.

Программное обеспечение для Internet и библиотек (C, CGI, Java, ASP).
Объединенный Институт Геологии, Геофизикик и Минералогии Сибирского Отделения АН.

Разработка информационных систем на основе технологии клиент-сервер.
(MsSQL6.5, FoxPro5.0)
Windows NT server, 30 workstations.
Объединенный Институт Геологии, Геофизикик и Минералогии Сибирского Отделения АН.

Построение и управление ЛВС (4 subnet, class C, 500 hosts)
Объединенный Институт Геологии, Геофизикик и Минералогии Сибирского Отделения АН.

Теоретическое и численное моделирование геофизических процессов.
Объединенный Институт Геологии, Геофизикик и Минералогии Сибирского Отделения АН.

Теоретические исследования в области атомной физики.
Объединенный Институт Геологии, Геофизикик и Минералогии Сибирского Отделения АН.

Образование:

P-нечетное дальнодействие атомов и ионов

Мазов Николай Алексеевич, заведующий Информационно-библиотечным Центром,ОИГГиМ СО РАН
Тел. служ. (383-2) 33-22-16
E-M
ail: mazov@uiggm.nsc.ru

Профессиональная деятельность:

Объединенный Институт Геологии, Геофизикик и Минералогии Сибирского Отделения АН.

Объединенный Институт Геологии, Геофизикик и Минералогии Сибирского Отделения АН.

Разработка информационных систем на машинах ЕС на основе ППП STAIRS для работы с БД ВИНИТИ, ВИМИ.
Государственная публичная научно-техническая библиотека Сибирского Отделения АН.

Разработка и построение АСНТИ ВНИИМБ.
Всесоюзный научно-исследовательский институт молекулярной биологии.

Образование:

Новосибирский Государственный Университет (1980), механико-математический факультет, вычислительная математика.