К вопросу об унификации иконографического описания в ИПС, основанных на БД компьютерных изображений музейных предметов
Е.С. Кузьмина
Государственный исторический музей, г. Москва
Тел.: 924-55-42
Е-mail: lask@shm.ru
Мееров К.А., г. Москва
Государственный исторический музей, Москва
Тел.: 924-55-42
Е-mail: shm@shm.ru
1.1. В настоящее время наличие базы данных (БД) компьютерных изображений музейных предметов – пока что явление достаточно редкое. Судя по сайтам в ИНТЕРНЕТе, ее разрабатывают Государственный Эрмитаж и ГИМ.
На данном этапе перед ГИМом стоят задачи:
Для этих целей в ГИМе создается информационный мультимедиа-центр по русской истории и культуре. Этот центр мыслится как публичный компьютерный зал, в котором посетитель сможет получить интересующую его разнообразную информацию на основе системы универсального мультимедийного доступа. Для создания реально работающего мультимедиа-центра должна быть принята концепция нового подхода к работе с коллекциями музея, а также должны быть заложены правильные (технологические и информационно-лингвистические) основы его дальнейшего развития. Посетитель создаваемого центра (профессионал-исследователь, любитель-исследоватедь или случайный посетитель) будет иметь: а) возможность быстрого доступа к предметам коллекций с помощью компьютерного изображения, б) новый поисковый инструмент для работы с массивом компьютерных изображений. Создать удобный инструмент поиска, позволяющий быстро познакомиться с предметом (или еще раз рассмотреть его), а также получить минимальную информацию об этом предмете – вот та задача, которая, в первую очередь, должна быть решена в рамках музейного мультимедиа-центра и Интернет-сайта ГИМа (www. shm. ru). Имея такой инструмент, пользователь любого типа в минимально короткий срок может получить изображение интересующего его предмета и ответить для себя на определенные вопросы до обращения непосредственно к самому предмету.
1.2. Решая проблемы, связанные c мультимедиа-центром, ГИМ оказывается вовлеченным в международный процесс компьютерной реорганизации всего международного информационного пространства. При этом ГИМ будет иметь возможность как отбора информации из Интернета для своего мультимедиа-зала, так и предоставления в Интернет информационных ресурсов своего музея. Компьютерная реорганизация музеев – проблема, становящаяся все более актуальной. В связи с ней1 нельзя не упомянуть блистательную работу Кима Вельтмана [1], в которой дается представление о новых путях использования накопленных человечеством знаний, о технологических процессах компьютеризации международного информационного пространства, о новом подходе к гипертексту и использованию гипертекстовых перекрестных ссылок в этом пространстве. “Основным результатом использования новых технологий является то, что рост знаний значительно увеличивается с появлением возможности обращения к коллективной памяти человечества”, т.е. тем информационным ресурсам, которые сосредоточены в больших мультимедийных центрах мира. “Использование компьютерных справочных ресурсов – это гораздо больше, чем простой перевод знаний с бумажно-печатных носителей в электронные.” В будущем любой пользователь сможет отыскать через компьютерную сеть например, портрет Е.И. Орловой из собрания ГИМа, написанный Д. Г. Левицким. Затем по гиперссылкам2, получить информацию о музее, об авторе (биография, список картин, всевозможные библиографические данные как о самом художнике, так и его работах), об изображенной женщине, узнать список статей, посвященных исследованию портрета, провести сопоставление разных точек зрения относительно того, кто изображен на портрете (т.е. установить критерий истинности для разных временных отрезков)3 и т. д. Получение столь разнообразной информации по перекрестным гиперссылкам подразумевает одновременное использование систем описания музейного предмета, архитектурных памятников и ландшафтов, системы иконографического анализа, а также библиотечных поисковых систем. Конечно, пока все это только в перспективе. Сейчас мы находимся в самом начале пути – на этапе получения доступа к компьютерному изображению интересующего нас предмета и работы с ним, т.е. на этапе создания информационно-поисковой системы на основе компьютерных изображений.
1.3. Сотрудники сектора охранного видеографического банка данных (ОВГБД) отдела информатики ГИМа приступили к созданию модели подобной информационно-поисковой системы. База данных проиндексированных компьютерных изображений строится на основе уникальной по объему информации, касающейся, как правило, наиболее интересных предметов музея. Источником информации (изобразительной и текстовой) служит выставка “Календарь Российской истории”, которая функционирует одновременно на демонстрационных мониторах Парадных сеней ГИМа и в Интернете с января 2000 года.
1.4. При создании модели ИПС на основе компьютерных изображений большой удельный вес приобретают информационное поле “Ключевые слова иконографического анализа” и применяемый для этого поля стандартизированный язык описания. Очевидно, что чем единообразнее будет описание иконографии музейных предметов, представленных компьютерным изображением, тем полнее и точнее будут результаты поиска. В качестве словарного обеспечения данного поля была взята рабочая русская версия системы описания - “Иконографический тезаурус” Ф. Гарнье4 [2].
2. Концепция и основные принципы тезауруса Ф. Гарнье
52.1. Информационная система
Тезаурус предназначен для информационного поиска. Его роль – позволить лицу, анализирующему иконографию предмета, кодировать основную информацию, касающуюся изобразительного ряда, а пользователю БД (каков бы ни был характер стоящих перед ним задач) – как можно быстрее получить необходимую и правильную информацию по интересующему его вопросу. Данная система дает возможность управлять очень большим числом изображений. Создатели тезауруса обращают внимание на то, что “не следует путать информационно-поисковую систему с системой обработки данных. Последняя задумана специалистами, применяющими научную терминологию и специфические отношения для изучения определенной предметной области. Что касается информационного поиска, то он имеет свои особенности и отвечает требованиям, зависящим от области применения, пользователя-адресата и информационного языка”
6.2.2. Значения изображений
Иконографическое описание может определяться двумя разными задачами:
Первая задача относится к области искусствоведения; вторая является отличительной чертой иконографической ИПС.
Объяснить иконографическое содержание изображения (а не изучить художественные особенности произведения) – вот предмет иконографического анализа, осуществляемого с помощью тезауруса. Однако, несмотря на приоритет, отдаваемый содержанию изображения, в рамках ИПС возможно получение информации, полезной для научных исследований и в области искусствоведения.
Цель иконографической ИПС – облегчить доступ к компьютерному изображению музейного предмета. Насколько важно значение иконографического анализа становится особенно очевидным, когда мы имеем дело с “молчащими” музейными предметами, которые не атрибутированы по таким основным информационным категориям, как “автор”, “время создания” и др. В подобных случаях ключевые слова иконографического анализа помогают отыскать компьютерное изображение предмета. Однако отметим, что использование иконографической ИПС не означает отказа от работы непосредственно с предметом, поскольку подобный анализ не исчерпывают всего иконографического содержания. По-настоящему заниматься изучением музейного предмета возможно только при непосредственном обращении к нему.
3. Структура и содержание тезауруса Ф. Гарнье
Авторы тезауруса стремились создать систему описания достаточно простую в обращении: число дескрипторов в закрытых списках (1ый – 14ый классы) достигает 3 2007). Термины представлены в хорошо организованную иерархическую структуру. В полных системах описания музейного предмета (таких, как NARCISSE) разработанный синтаксис нормативного языка дает возможность делать развернутое, точное и релевантное описание. В системах краткого описания (подобных создаваемой в секторе ОВБД ГИМа) используются лишь необходимые для поставленных задач элементы предложенного синтаксиса.
3.1. Рубрики
Тезаурус состоит из 4 частей, называемых рубриками:
Разбиение на рубрики оправдано спецификой вопросов, на которые они отвечают, заложенным в них содержанием и формой редактирования. Рубрики не являются равнозначными ни по роли, ни по значению. Главную роль играет первая рубрика, дескрипторы которой используются для передачи основного содержания изображения. С помощью трех других рубрик (к которым прибегают в ограниченном числе случаев) уточняются некоторые сюжеты, указывается письменный источник изображенного, а также приводятся даты, относящиеся к изображенным событиям или представленным персонажам.
Основная рубрика “Описание изображения” (см. Приложение) содержит две группы дескрипторов – темы (1ый – 15ый классы) и сюжеты (16ый – 23ий классы). Дескрипторы тем относятся к человеческой жизни вообще. Их списки (кроме двух) являются закрытыми. Дескрипторы сюжетов используются при описании изображений, имеющих исторические, географические и другие конкретные привязки. Классы сюжетов имеют свою организацию и иерархию. Открытые в большинстве случаев, их списки пополняются по мере обработки новых документов.
3.2. Классы
Открытые списки классов могут пополняться и иметь неограниченное число дескрипторов. Однако упорядочивание дескрипторов в открытых списках должно проводиться централизованно по определенным правилам. Это касается особенно имен собственных.
Составление закрытых списков было остановлено, спустя 6 лет после начала работы. Авторы системы подчеркивают, что было бы крайне неосмотрительно вводить новые термины в закрытые списки под предлогом облегчения описания частных случаев, поскольку неоднозначность и путаница, возникающие из-за формы дескрипторов (омографы) или из-за смысла (синонимия, омонимия), ведут к неопределенности запросов.
Как правило, дескрипторы списка следуют в алфавитном порядке на каждом уровне иерархии. Однако когда термины дополняют друг друга или противопоставляются, их ставят рядом, пренебрегая алфавитным порядком.
3.3. Дескрипторы
3.3.1. В одном и том же иерархическом списке можно встретить термины, относящиеся к абстрактным понятиям, и термины, обозначающие конкретные вещи.
Каждый дескриптор имеет только одно значение.
Сильная иерархия списков отвечает требованиям информационного языка. Родовое понятие используется в трех следующих случаях:
Для пользователя очень важно очертить круг необходимых изображений, до которых невозможно “добраться” при помощи более точных дескрипторов.
3.3.2. Некоторые классы сюжетов содержат дескрипторы, являющиеся конкретными названиями сцен или предметов. Для тезауруса они представляют собой исключение. Их применение оправдано частотностью сюжетов, к которым они относятся, и их широким использованием на практике. Например, “Рождество”, “Благовещение” – названия, часто встречающиеся - традиционные и универсальные –введенные в список “Библейские сюжеты”. Однако количество названий-дескрипторов – ограничено. Они касаются только “Нового Завета”, некоторых типичных изображений, относящихся к “Ветхому Завету”, а также классов, чье содержание соответствует названию (“конкретное общество”, “конкретный орден и его знак отличия”). Все остальные частные изображения описываются именами мест и лиц, связанными тематическими дескрипторами.
3.3.3. Как уже говорилось выше, каждый дескриптор информационного языка должен иметь один смысл. В тезаурусе значение дескриптора определяется родовым понятием, под которым дескриптор находится, а в случае неоднозначности – дополнительной аннотацией, на наличие которой указывает знак звездочки “*”. Используя иерархическую организацию дескрипторов, а также словарь-глоссарий, авторы попытались максимально избежать “слов-ловушек”. Однако, отмечают авторы, опыт показал, что неясности остаются возможными, даже если полисемический термин был ясно определен.
3.3.4. Морфологическая форма большинства дескрипторов – это существительное в именительном падеже, обычно стоящее в ед. числе. Имеются также дескрипторы в форме прилагательного и инфинитива. Чтобы передать понятие множественного числа, прибегают к дескриптору “группа”, в некоторых случаях используется грамматическое мн. число: слезы, волосы, времена года, апостолы и др.
4. Как пользоваться тезаурусом
Иконографическое описание, предназначенное для создания базы данных, ставит перед нами три основные задачи:
4.1. Чтение изображения
4.1.1.Часто оказывается гораздо труднее прочесть изображение, чем перевести результаты этого прочтения на информационный язык. Чтение изображения не есть простая фиксация информации. Оно предполагает постоянную творческую работу “читателя”, который различает, идентифицирует, анализирует и интерпретирует то, что он видит. В иконографическое описание входят различные виды информации, соответствующие разным уровням прочтения:
4.1.2. Смысл некоторых сцен может объясняться контекстом, в котором они находятся. Например, настенная живопись развертывает перед нами повествовательный цикл. Это позволяет определить сильно поврежденный сюжет одной из его сцен и тем самым расшифровать смысл.
4.1.3. Авторы тезауруса подчеркивают, что читатель - аналист не может являться специалистом одновременно по всем видам искусства, всем эпохам, по всем областям знаний. Он только подготавливает работу специалиста-исследователя, а не подменяет ее; кроме того, аналист не должен описывать частности, поскольку информационная база данных не может зависеть от слишком частной информации. Авторы добавляют также, что было бы хорошо в специальной рубрике указывать источники описания.
4.2. Уровень точности прочтения
Иконографическое описание может сводиться как к трем словам, так и развертываться в описание с большим количеством дескрипторов. Все зависит от того, что изображено. Однако в любом случае желательно, чтобы анализ не сводился к личной оценке читателя изображения. Ниже перечислим основные факторы, связанные с точностью уровня описания:
4.3. Процесс описания
4.3.1. Описывая изображение, аналист придерживается следующего плана:
а) Каково основное значение изображения?
б) Как оно выражено? Есть ли персонажи? Каковы их характеристики? Известны ли их имена? Какие элементы соперничают в выражении главного значения? Место? Можно ли ему дать точное географическое название? Надо ли его описывать?
в) Для понимания изображения нужно ли обращаться к историческому контексту? Возникают ли проблемы датировки изображенного?
а) Есть ли еще какие-либо детали помимо тех, которые касаются главного значения? Какие? Надо ли их отмечать?
4.3.2. Чтобы выбрать необходимый для описания дескриптор идут логическим путем. Сначала выбирают класс, затем список, а затем сам дескриптор. Если нет термина, который точно подходил бы для описания, выбирают наиболее близкий к нему дескриптор или обобщающее родовое понятие. Использование алфавитного списка всех дескрипторов тезауруса облегчает поиск нужного дескриптора, но не дает автоматического ответа.
4.3.3. При выборе дескриптора надо обязательно контролировать его смысл, избегая полисемии и омографов. Часто смысл дескриптора уточняется с помощью названия класса, к которому он относится, и обобщающего понятия, под шапкой которого он стоит. Например, дескриптор “кортеж”, относящийся к классу “Политическая и административная жизнь”, входит в список “Официальная манифестация”. Естественно, этот дескриптор не следует использовать для описания изображений с Людовиком XIV, прогуливающимся в окружении знати. Однако в любом случае надо стремиться найти точный, уникальный дескриптор.
4.3.4. Для передачи определенных понятий возможно использование двух дескрипторов, создающих в своем роде новый сложный дескриптор. Например, для того, чтобы передать понятие “золотой кубок”, используются следующие один за другим дескрипторы - “кубок, изделие из золота”; для
“электрический аппарат” – “аппарат, электричество”8.4.4. Редактирование дескрипторов
4.4.1. Способ редактирования, представленный в [2], разработан программой MISTRAL (Compagnie BULL). Он дает возможность комбинирования дескрипторов (с помощью специальных разделителей), построения фраз из групп дескрипторов и параграфов из фраз.
4.4.2. В нашей системе (как и в других системах краткого описания, например, стандарта ISO 10119, SCALA) нет необходимости использования предложенного нормативного синтаксиса в полном объеме. Соблюдается требование логического следования дескрипторов, соответствующего расположению сцен, хронологии и убыванию значимости значений изображенного.
5. Глубина описания
Говоря об анализе иконографии в целом, нельзя не затронуть вопроса глубины описания. Как отмечает Герхард Яритц [3], “описать изображение определенного предмета в рамках специализированного проекта, где есть возможность и потребность заняться каждой деталью, - это не то же самое, что иметь дело с огромной коллекцией визуальных источников многоцелевого назначения с тем, чтобы обеспечить основную информацию для многоаспектного иконографического исследования”. Это правило, безусловно, относится к любому типу фактографических ИПС – основанных как на полном, так и на кратком описании музейного предмета - где представлена информационная категория иконографии. Оно же работает и для ИПС на базе компьютерных изображений, создаваемой для несколько миллионной коллекции такого музея, как ГИМ.
Библиография
Приложение
План рубрики “Описание изображения”
Иконографического тезауруса Ф. Гарнье
I – ТЕМЫ 1.Общие характеристики изображения 1.1.Жанр изображения 1.2.Детерминант изображения 1.3.Локализация изображения 2.Природа 2.1.Универсум 2.2.Неодушевленная материя 2.3.Время 2.4.Растительный мир 2.5.Животный мир 3.Человеческое тело и материальная жизнь 3.1.Человеческое существо 3.2.Физическое здоровье 3.3.Гигиена тела 3.4.Питание 3.5.Табакокурение 3.6.Облачение 3.7.Архитектура жилища 3.8.Обогрев жилья 3.9.Искусственное освещение 3.10.Движимость 3.11.Предметы убранства дома 3.12.Домашнее белье 3.13.Домашняя работа 3.14.Домоводство 3.15.Предмет разноцелевого использования 3.16.Произведенный продукт 3.17.Архитектура 3.18.Физическое состояние 3.19.Различные физические действия 4. Психологическая и моральная жизнь 4.1.Психологическая жизнь 4.1.1.Человеческий дух 4.1.2.Психологическое поведение 4.2.Моральная жизнь 4.2.1.Моральная ценность 4.2.2.Положительное моральное качество 4.2.3.Отрицательное моральное качество 4.2.4.Моральное поведение 4.2.5.Судьба 5.Общество и социальная жизнь 5.1.Городская архитектура 5.2.Мемориальная архитектура погребения 5.3.Общество 5.4.Социальные взаимоотношения 5.5.Обучение 5.6.Развлечения и спорт 6.Политическая и административная жизнь 6.1.Архитектурные сооружения политической и административной жизни 6.2.Политическое деление 6.3.Политическая деятельность 6.4.Политический режим 6.5.Тип государства 6.6.Конституция 6.7.Политический персонаж 6.8.Административная и юридическая профессия 6.9.Власть 6.10.Государственная служба 6.11.Деньги, находящиеся в обращении 6.12.Международные отношения 6.13.Колонизация 6.14.Официальная манифестация 7.Вооружение – Военная жизнь 7.1.Вооружение 7.2.Военная жизнь 7.2.1.Военное сооружение 7.2.2.Военный лагерь 7.2.3.Армия 7.2.4.Военный различительный знак 7.2.5.Война 7.2.6.Мирное время 7.2.7.Показ войск 8.Земледелие – Охота – Рыбная ловля 8.1.Земледелие 8.1.1.Сельскохозяйственные сооружения 8.1.2.Используемое пространство 8.1.3.Сельскохозяйственная профессия 8.1.4.Сельскохозяйственный инвентарь 8.1.5.Разведение сельскохозяйственных культур 8.1.6.Разведение скота 8.2.Охота 8.3.Рыбная ловля 9.Энергия – Промышленность и ремесла - Торговля и обслуживание 9.1.Энергия 9.1.1.Тип энергии 9.1.2.Преобразование энергии 9.2.Промышленность = Ремесла 9.2.1.Место индустриальной деятельности 9.2.2.Промышленная профессия 9.2.3.Промышленное оборудование 9.2.4.Промышленная операция 9.3.Торговля и обслуживание 9.3.1.Коммерческие сооружения 9.3.2.Коммерческая профессия 9.3.3.Оборудование для коммерческих целей 9.3.4.Коммерция 9.3.5.Деятельность в сфере обслуживания 10.Транспорт – Передача сообщений 10.1.Транспорт 10.1.1.Транспортная профессия 10.1.2.Наземный транспорт 10.1.3.Водный транспорт 10.1.4.Воздушный транспорт 10.1.5.Транспортная операция 10.1.6.Специальный транспорт 10.1.7.Перемещение 10.1.8.Транспортное происшествие 10.2.Передача сообщений 10.2.1.Профессия, связанная с передачей сообщений 10.2.2.Средство передачи сообщений 11. Интеллектуальная и научная жизнь 11.1.Помещение для интеллектуальной деятельности 11.2.Интеллектуальная профессия 11.3.Предмет интеллектуальной деятельности 11.4.Науки 11.5.Интеллектуальная деятельность 11.6.Интеллектуальное значение 11.7.Философское направление мысли 12. Виды искусства и театральных представлений 12.1 Помещения для артистической деятельности 12.2 Профессии, связанные с различными видами искусства 12.3.Виды искусства 12.4.Эстетическая оценка 12.5.Вдохновение 13.Религиозная жизнь 13.1.Религия 13.2.Нерелигия 13.3.Сверхъестественное существо 13.4.Мистическое или сверхъестественное явление 13.5.Святость 13.6.Религиозная традиция 13.7.Культовая архитектура 13.8.Духовенство и миряне 13.9.Движимость и предметы культа 13.10.Церковное облачение 13.11.Религиозная практика 13.12.Жизнь Церкви 14. Вымышленная сущность 14.1.Порождение ума 14.2.Фантастическое создание 15.Орнамент |
II – СЮЖЕТЫ 16. Географический сюжет 16.1.Морфологическая география 16.2.Географическое местонахождение 17.Библейский сюжет 17.1.Библейский Бог 17.2.Конкретный ангел 17.3.Библейский демон 17.4.Библейское название 17.5.Персонаж “Ветхого Завета” 17.6.Персонаж “Нового Завета” 17.7.Эсхатологический сюжет 18.Мифологический сюжет 19.Исторический персонаж 19.1.Конкретный святой 19.2.Конкретная святая 19.3.Конкретный папа 19.4.Антипапа 19.5.Конкретный глава государства 19.6.Quidam 20.Групповое название 20.1.Национальность 20.2.Этническая группа 20.3.Конкретные общества 20.4.Конкретный орден и его знак отличия 20.5.Религиозный орден 21.Философское течение 22.Периодизация 22.1.Историческое название времени 22.2.Название эпохи и стиля 22.3.Гражданский и церковный календарь 23.Вымышленный персонаж 23.1.Вымышленный мужской персонаж 23.2.Вымышленный женский персонаж 23.3.Вымышленное животное |
Кузьмина Елена Сергеевна, лингвист сектора охранного видеографического банка данных Государственного исторического музея.
Мееров Кирилл Александрович
, зав. сектором охранного видеографического банка данных Государственного исторического музея.