Жижимов О.Л., Мазов Н.А.
Объединенный Институт Геологии, Геофизики и
Минералогии
Сибирского Отделения Российской Академии Наук
Адрес: 630090, Новосибирск-90, пр.Коптюга 3
Факс: (383-2) 33-27-92
Internet:
Предоставление доступа из Internet к электронным ресурсам может быть организовано различными способами с применением различных технологий и протоколов. На сегодняшний день самым распространенным способом является WEB как наиболее простой и эффективный способ организации сетевого доступа к информационным ресурсам различного характера. Однако технология WEB не позволяет построить распределенные информационные системы со сквозным поиском и едиными для всех систем интерфейсами. В WEB отсутствует важная компонента – глобальная
стандартизация на уровне организации данных и форматов их представления. На сегодняшний день единственной технологией, содержащей подобную компоненту, является технология, основанная на международном стандарте ISO-23950 (Z39.50) [1].Протокол Z39.50 был создан для унификации сетевого доступа к любым базам данных в 1988 году. Действующая сегодня версия 3 протокола появилась в 1995 году. И если в первые годы своего существования протокол использовался преимущественно для организации доступа к библиографическим ресурсам, то на сегодняшний день область его применения существенно расширена, он используется для доступа к научно-технической информации, к геоинформационным ресурсам, к глобальным базам метаданных и др. Существует также возможность предоставления доступа по Z39.50 к музейной информации и цифровым коллекциям. Именно этому аспекту в Z39.50 и посвящен настоящий доклад.
Правила, которые регламентируют работу с музейной информацией в Z39.50, сформулированы в документах CIMI (Consortium for the
Computer Interchange of Museum Information) и составляют профиль CIMI [2]. Элементы этого профиля имеют глобальные идентификаторы и являются частью международного стандарта ISO-23950.Профиль CIMI оперирует со следующими объектами Z39.50:
Поисковые атрибуты: | Bib-1 | 1.2.840.10003.3.1 |
CIMI-1 | 1.2.840.10003.3.8 | |
Диагностика: | Bib-1 | 1.2.840.10003.4.1 |
Форматы: | GRS-1 | 1.2.840.10003.5.105 |
SUTRS | 1.2.840.10003.5.101 | |
Usmarc | 1.2.840.10003.5.10 | |
Схемы: | Digital Collections Schema | 1.2.840.10003.13.3 |
CIMI Schema | 1.2.840.10003.13.5 | |
Наборы меток: | TagSet-M | 1.2.840.10003.14.1 |
TagSet-G | 1.2.840.10003.14.2 | |
Collections TagSet | 1.2.840.10003.14.5 | |
CIMI TagSet | 1.2.840.10003.14.6 |
Табл.1: Объекты Z39.50 для CIMI.
На основе этих объектов определена модель поиска и извлечения данных с музейной информацией.
Полное описание профиля CIMI достаточно объемно и здесь приводиться не будет. Ниже будут отмечены только некоторые аспекты, которые на наш взгляд характерны для этого профиля.
Во-первых, все серверы CIMI обязаны поддерживать запросы типа 1 (RPN) с набором поисковых атрибутов CIMI-1, который содержит как атрибуты общего плана (Title, Author, Abstract и т.п.), так и специфические атрибуты для музейных коллекций (repositoryPlace, dateOfOrigin, placeOfOrigin, dateCollected и
т.п.). Кроме этого набор атрибутов CIMI содержит в себе поисковые атрибуты Dublin Core.Во-вторых, схема данных и абстрактная структура записи CIMI основана на иерархической модели с использованием схем Digital Collections и Dublin Core. Элементы последней явно присутствуют в CIMI на первом уровне вложения. Собственно структура записи CIMI вложена в элемент actualDO записи Digital Collection (см. Табл.1). Эта схема данных позволяет представить в стандартном виде описательную информацию о музейных ресурсах,
т.е. является схемой метаданных. Связь с изображениями и полными текстами осуществляется через URL в элементе mrObject/rendition/resource.localControlNumber, schemaIdentifier, | |||||
title, creator, contributor, date, description, identifier, type, language, subject, publisher, format, source, relation, coverage, rights, | |||||
typeOfDescriptiveRecord, objectInfo | |||||
typeOfObject, categoryOfObject, digitalObject | |||||
actualDO | |||||
schemaIdentifier, objectName, objectTitle, bibliographicTitle, creatorGeneral, creatorInfo | |||||
name, dateOfBirth, dateOfDeath, nationalityCultureRace, role |
|||||
fieldCollector, repositoryName,
repositoryPlace, owner, creditLine, subject, publisher, objectID, materialMedium, processTechnique, dimensions, placeOfOrigin, dateOfOrigin, dateCollected, agePeriod, typeSpecimen, stylePeriod, periodName, provenance, quantity, award, collection, inscriptionMark, objectLanguage, condition, physicalDescription, protectionStatus, protectionDate, spatialReferencingSystem, x-coordinateInSpatialReferencingSystem, y-coordinateInSpatialReferencingSystem, address, relatedObjects, relatedTextualReferences, associationGeneral, association |
|||||
name, place, event, activity, description | |||||
contentGeneral, content | |||||
name, place, event, activity, description | |||||
contextHistorical, contextArchaelogical, copyrightRestriction, wallTextLabel, displayObject, mrObject | |||||
title, creator, contributor, date, description, type, language, subject, publisher, format, source, relation, coverage, rights, rendition | |||||
resource, title, creator, contributor, date, description, type, language, subject, publisher, format, source, relation, coverage, rights | |||||
administrativeEventGeneral, administrator, administrativeEvent | |||||
administrativeEventType, date, creator, role |
Табл.2: Вложение схем Dublin Core и CIMI в схему Digital Collections
Наконец, основным форматом представления данных в CIMI является GRS-1.
Возникает вопрос, какое программное обеспечение серверов можно использовать для организации распределенных информационных систем профиля CIMI. В России на сегодняшний день существует только один программный продукт с поддержкой CIMI – сервер ZooPARK, разработанный в ОИГГиМ СО РАН авторами доклада. Сервер ZooPARK предназначен для эксплуатации в качестве базового сервера Z39.50 (ISO-239
50) распределенной информационной системы общего назначения на различных программно-аппаратных платформах [3].Установленные в узлах информационной системы однотипные сервера ZooPARK могут образовывать кластеры с перераспределением поисковых запросов. Серверы Z39.50 других производителей также могут быть включены в подобные кластеры, но с ограниченными возможностями.
Рис.1 Схема распределенной информационной системы
Сервер ZooPARK имеет модульную архитектуру. Все процедуры доступа к конкретным СУБД выделены из ядра сервера в отдельные динамические библиотеки – провайдеры данных. Интерфейс “ядро – провайдер данных” документирован. Это позволяет самостоятельно создавать провайдеры данных для различных СУБД. На сегодняшний день существуют провайдеры данных для CDS/ISIS, провайдер удаленного сервера Z39.50, провайдер для данных Zebra (IndexData). Авторам также известны случаи создания других провайдеров данных для ZooPARK сторонними разработчиками. Более подробная информация о сервере ZooPARK доступна по адресу:
http://geolibr.uiggm.nsc.ru/pubs/products.asp.Наличие сервера Z39.50 не решает всех проблем доступа к информационным ресурсам. Необходимо наличие клиентского программного обеспечения. В качестве такого программного обеспечения удобно использовать шлюз Z39.50-WWW. В ОИГГиМ СО РАН разработан подобный шлюз для Windows NT, представляющий собой CGI-приложение с функциями клиента Z39.50. Шлюз содержит возможность настройки внешнего интерфейса пользователя и наборы шаблонов для представления информации. Опыт эксплуатации шлюза показал, что он эффективен при построении информационных систем, основанных на метаданных, т.к. позволяет с одной стороны проводить поиск и просматривать записи из баз метаданных, а с другой – выходить по гипертекстовым ссылкам на сами данные – полные тексты и графику, использую технологии WEB. Шлюз доступен по адресу:
http://geolibr.uiggm.nsc.ru/zgwn.В заключение, авторы выражают надежду, что музейное сообщество России подключится к программе предоставления доступа к своим информационным ресурсам по протоколу Z39.50.
Литература:
Жижимов Олег Львович
, к.ф.-м.н., заведующий сектором Информационных Технологий, ОИГГиМ СО РАНПрофессиональная деятельность:
Разработка программного обеспечения Z39.50:
Объединенный Институт Геологии, Геофизикик и Минералогии Сибирского Отделения АН.
Программное обеспечение для Internet и библиотек (C,
CGI, Java, ASP).
Объединенный Институт Геологии, Геофизикик и
Минералогии Сибирского Отделения АН.
Разработка информационных систем на основе
технологии клиент-сервер.
(MsSQL6.5, FoxPro5.0)
Windows NT server, 30 workstations.
Объединенный Институт Геологии, Геофизикик и
Минералогии Сибирского Отделения АН.
Построение и управление ЛВС (4 subnet, class C, 500 hosts)
Объединенный Институт Геологии, Геофизикик и
Минералогии Сибирского Отделения АН.
Теоретическое и численное моделирование
геофизических процессов.
Объединенный Институт Геологии, Геофизикик и
Минералогии Сибирского Отделения АН.
Теоретические исследования в области атомной
физики.
Объединенный Институт Геологии, Геофизикик и
Минералогии Сибирского Отделения АН.
Образование:
P-нечетное дальнодействие атомов и ионов
Мазов Николай Алексеевич
, заведующий Информационно-библиотечным Центром,ОИГГиМ СО РАНПрофессиональная деятельность:
Объединенный Институт Геологии, Геофизикик и Минералогии Сибирского Отделения АН.
Объединенный Институт Геологии, Геофизикик и Минералогии Сибирского Отделения АН.
Разработка информационных систем на машинах ЕС
на основе ППП STAIRS для работы с БД ВИНИТИ, ВИМИ.
Государственная публичная научно-техническая
библиотека Сибирского Отделения АН.
Разработка и построение АСНТИ ВНИИМБ.
Всесоюзный научно-исследовательский
институт молекулярной биологии.
Образование:
Новосибирский Государственный Университет (1980), механико-математический факультет, вычислительная математика.