Электронные библиотеки.

А.И. Вислый, к.ф.м.н.
Зам. директора Российской государственной библиотеки

Куда идем мы с Пяточком?

Насчет “большого секрета” - это конечно преувеличение. Но вот насчет понимания… Попробую изложить свою точку зрения.

Во-первых, сразу ограничим область обсуждения. Оцифрованные звукозаписи, фильмы и прочее пусть пока останутся в стороне. Попробуем разобраться с полными текстами книг. И только. Будем, в рамках данной статьи, понимать под “электронной библиотекой” собрание оцифрованных полных текстов уже существующих и выпущенных в свет книг.

Во-вторых, выделим в отдельную область само производство полных текстов. Будем называть необходимый для этого комплекс работ - “электронным издательством”. Соответственно, компанию, торгующую полными текстами, будем называть “электронным книжным магазином”.

В третьих, под “традиционной библиотекой” будем понимать собственно библиотеку.

Теперь о текущей ситуации. Что мы видим “попав” в Интернет? Библиотеку Машкова, например, по адресу http://www.lib.ru. Около тридцати тысяч полных текстов книг. Ни одна “традиционная библиотека” России, ничем подобным похвастаться не может. Разве что “зеркало” себе сделает. Да и в зарубежном мире не очень-то… Откуда оно все у Машкова взялось? Это достаточно просто. Планшетный сканер стоит копейки. “Софт” для распознавания – в России даром. Дальше – энтузиазм и полное незнание законов об авторском праве и вот они Стругацкие. Полностью. Разные люди по всей стране сканируют, распознают и присылают в библиотеку Машкова электронные тексты книг. Он их собирает и “выставляет” в Интернет. Бесплатно! И что? То ли памятник ему за это ставить, то ли в тюрьму сажать? Впрочем, альтернатива для России вполне обычная.

Попробуем разобраться с рядом вопросов.

  1. В какой мере “традиционные библиотеки” должны сами заниматься сканированием книг и других документов из собственных фондов? Т.е. выполнять функции “электронного издательства”.

  2. Что и в каком порядке сканировать?

  3. Что “традиционные библиотеки” должны (или не должны) делать с уже существующими полными текстами книг в электронном виде?

  4. Какие, из уже существующих, полных текстов “традиционные библиотеки” должны брать к себе в коллекцию?

  5. И что, в конце, концов, делать с авторским правом? Когда это касается Интернет?

Начнем с последнего вопроса. По моему мнению, действующий закон “ОБ АВТОРСКОМ ПРАВЕ И СМЕЖНЫХ ПРАВАХ” дает все необходимые ответы на спорные вопросы об оцифровке и “выставлении” в Интернет разного рода произведений. Я, конечно, не юрист, но формулировки статей закона вполне однозначны и редко допускают различное толкование. Другое дело, что закон отстаивает права автора произведения и не слишком заботится о пользователях Интернет. Так кто сказал, что о них надо заботиться особо?

Начнем с понятия оцифровки (сканирования, распознавания и т.п.). С точки зрения закона этот процесс называется воспроизведением.

“Воспроизведение произведения - изготовление одного или более экземпляров произведения или его части в любой материальной форме, в том числе в форме звуко- и видеозаписи, изготовление в трех измерениях одного или более экземпляров двухмерного произведения и в двух измерениях - одного или более экземпляров трехмерного произведения; запись произведения в память ЭВМ также является воспроизведением.”

Хорошо. Все предельно ясно. Теперь, о том, что можно и что нельзя делать. Прежде всего:

“Исключительные права автора на использование произведения означают право осуществлять или разрешать следующие действия: воспроизводить произведение (право на воспроизведение);…”

То есть нельзя заниматься воспроизведением произведения без разрешения автора! Никому. Включая библиотеки! Это по закону. Есть правда и исключения, предусмотренные в том же законе. Но, при внимательном рассмотрении, ни одно из них не касается проблем, обсуждаемых в нашей статье. Например. Распространенное заблуждение, что библиотека в целях сохранности, что-то там все же может, основано на следующей формулировке:

“Допускается без согласия автора и без выплаты авторского вознаграждения, но с обязательным указанием имени автора, произведение которого используется, и источника заимствования репродуцирование в единичном экземпляре без извлечения прибыли:
1) правомерно опубликованного произведения библиотеками и архивами для восстановления, замены утраченных или испорченных экземпляров, предоставления экземпляров произведения другим библиотекам, утратившим по каким-либо причинам произведения из своих фондов;…"

Но репродуцирование это:

“Репродуцирование (репрографическое воспроизведение) - факсимильное воспроизведение в любых размере и форме одного или более экземпляров оригиналов или копий письменных и других графических произведений путем фотокопирования или с помощью других технических средств, иных, чем издание; репрографическое воспроизведение не включает в себя хранение или воспроизведение указанных копий в электронной (включая цифровую), оптической или иной машиночитаемой форме.”

И так, что мы имеем? Нельзя, произведения защищенные авторским правом, сканировать, распознавать и “выставлять” в Интернет! И просто сканировать нельзя. Разве что, и только, для личных нужд (см. ст.18 закона). Следовательно, нарушаем. Впрочем, ничего нового в этом нет.

В принципе, каждого “сканировщика” произведения, размещенного в какой-либо из “электронных библиотек” можно привлечь к уголовной (именно так) ответственности. А так же и самих держателей “электронных библиотек”. Первых за незаконное воспроизведение, вторых за незаконное опубликование. Но пока ситуация развивается по анекдоту: “Вон скачет неуловимый Джо!”, “А что он и вправду такой неуловимый?”, ”Да, нет! Поймать его можно, вот только кому он нужен?”.

Тем самым “электронные библиотеки” растут. Авторы молчат, а пользователи Интернет потихоньку радуются и на дармовой бумаге (за счет предприятий) печатают себе интересующие книги. Идиллия. Ответ на вопрос: - “А почему молчат авторы?” в общем-то, ясен. Пока, на их гонорарах опубликование произведений в Интернет никак не сказывается. Разве что лишняя реклама. Долго ли такая ситуация продлиться? Думаю, что еще лет пять. По крайней мере до момента становления серьезных “электронных издательств” и “электронных книжных магазинов”. При появлении компаний, осуществляющих продажу полных текстов книг “через” Интернет, идиллия испарится. Кого-то посадят, кого-то купят, кого-то припугнут и за каждый полный текст придется платить. Думаю, что на уровне стоимости книги на полке магазина, но платить обязательно.

Есть ли вариант “чистого” сканирования (воспроизведения)? Вроде бы есть. Произведения, на которые срок авторского права исчерпался. То есть 50 лет после смерти автора. Не так уж и мало. Но не очень интересно. Да и тут есть вопросы. А в чьей собственности находится текст “Евгения Онегина”? Вот я его отсканировал и продал. Не должен ли я чего нашему государству? Точнее Мингосимуществу? Ответа на этот вопрос нет. Существует и чисто юридическая казуистика. Вот, например, если книга иностранного автора хранится в фонде российской библиотеки, и срок действия авторского права по российским законам истек, а по законам страны этого автора – нет? Можно сканировать или нельзя? Ответа я, так же, не знаю.

В любом случае, санировать можно те произведения, на которые срок действия авторского права закончился и, конечно же, те произведения, на сканирование которых есть прямое разрешение автора. Что называется, открыл Америку! Но в данном случае важно то, что это касается и библиотек.

Теперь о “традиционных библиотеках”. Ни одна из библиотек “в упор не замечает” ту же “электронную библиотеку” Машкова. Прежде всего, в силу консервативности. Для крупной библиотеки - пять лет не срок. И что там возникло, по меркам вечности, мало ли… Ах там уже тридцать тысяч полных текстов? Все равно не то, что нужно для библиотеки скажем, национального уровня. И книги не те, и мало их. У нас же десятки миллионов!

Кто бы спорил. Но вот проблема. Скажем, полный текст “Мастера и Маргариты” в Интернете есть. В библиотеке (в электронном виде) его нет. А вот должен быть, или нет? Как насчет миссии библиотеки – собирать, хранить, предоставлять доступ? Значит должен быть! И сразу цепочка вопросов:

  1. Имеет ли право библиотека переписать из Интернет полный текст книги, если он уже там есть в свободном доступе?

  2. Как предусмотреть в расходах библиотеки закупку необходимого оборудования и оплату персонала для вечного (ни много, ни мало) хранения этого полного текста?

  3. Что брать, и что не брать из Интернета (или CD-ROM) в фонд библиотеки для того же вечного хранения?

  4. Как обеспечить вечное хранение этого текста в условиях быстро меняющегося компьютерного оборудования и форматов записи информации?

  5. На каких основаниях, и каким образом осуществлять обслуживание читателей?

Эта цепочка вопросов, на которые рано или поздно придется отвечать, и есть вторая причина по которой “традиционные библиотеки” не замечают “библиотеки электронные”. Сложно все это. Один раз, сказав, что: “Да, это дело библиотеки” придется нести постоянные и все возрастающие расходы. А в “традиционных библиотеках” денег традиционно нет.

Поэтому большинство библиотек идут по более простому пути. Сначала определяется некая стратегия, что в первую очередь сканировать, что во вторую и т.д.. Затем, запускается сам процесс сканирования. Вполне неспешный. Несколько сот книг в год. При таком объеме вопросы 1-5 не стоят так остро. На первые несколько лет хватает нескольких компьютеров, а что дальше – там будет видно.

Сразу оговорюсь – ничего плохого в таком подходе нет (если, конечно, при этом не нарушен закон). Не было полного текста книги в электронной форме и вот он есть. Прекрасно! Но нужно четкое и ясное понимание того, что при таком подходе библиотека выполняет функции “электронного издательства”, а не свои непосредственные задачи. И отговорки насчет сохранности не принимаются. Из-за низких объемов сканирования. Никаких задач обеспечения физической сохранности фонда сканирование не решает. Если нужно обеспечить сохранность, хотя бы сотни тысяч книг, а в год сканируется сто, то и говорить об этом не стоит.

Вернемся теперь к первому вопросу: “В какой мере “традиционные библиотеки” должны сами заниматься сканированием книг и других документов из собственных фондов?”.

Мне кажется, что ответ на этот вопрос относится к разряду чисто прагматичных. Удалось найти заказчика, инвестиции, гранты на оцифровку какой-либо коллекции документов – “вперед и с песней”. Есть обоснованная уверенность, что получившаяся коллекция будет пользоваться спросом и по крайней мере покроет затраты на ее создание – то же не плохо. Все остальные мотивы роли не играют. Что же касается вопросов сканирования для обеспечения сохранности фондов или для создания “национального информационного ресурса”, то когда наступит понимание у государственных органов того, что это есть элемент национальной политики, значит, будет бюджетное финансирование. По сути дела появится заказчик – государство. Пока такого понимания нет. Безусловно, необходимо заниматься формированием этого понимания. На всех уровнях: от “проталкивания” отдельных проектов, до разработки национальной программы.

Следующий вопрос: “Что и в каком порядке сканировать?” Уж если библиотека этим решила заняться. Мне кажется, что ответ на этот вопрос вытекает из ответа на предыдущий вопрос. Раз уж заказчик, инвестор, грантодатель платит деньги, то вопрос: “Что сканировать?” решается только в процессе переговоров. По своему опыту знаю: приемлемые решения всегда можно найти. Они могут быть далеко непростыми. Например, вариант: “Мы отдаем для сканирования некоторую коллекцию партитур, а вы делаете нам электронный каталог всех нотных изданий”. В этом варианте библиотека, конечно же, не решает вопроса оцифровки редких книг, но получает нужную ей часть электронного каталога. Или у библиотеки есть потрясающая коллекция фотографий по истории железнодорожного транспорта. И есть уверенность, что в оцифрованном виде она будет приобретена рядом зарубежных музеев за хорошие деньги. Почему бы и не отсканировать?

Предвижу вопросы. А как же фонд редких книг и рукописей? Нет ни инвесторов, ни потенциальных покупателей. А очень хочется. И читателям физический экземпляр давать нельзя, разваливается. Они же, бедные, страдают. Пусть страдают дальше, а заодно участвуют в формировании государственной политики в области оцифровки наиболее ценных коллекций. Жалобами и предложениями в министерство культуры, например.

Самый интересный вопрос: “Что “традиционные библиотеки” должны (или не должны) делать с уже существующими полными текстами книг в электронном виде?” Они (тексты) есть. Их много. Практически все в свободном доступе.

Общий объем полных текстов книг оценивается в сорок тысяч наименований. Среди них есть, конечно, произведения, дублирующие друг друга. Это не значит, что тексты сканировались дважды. Просто держатели библиотек их копировали. Но в любом случае, общий объем близок к объему книг издаваемых в России в течение года.

Я считаю, что библиотеки национального уровня ответственны за решение задачи по отбору полных текстов книг в Интернет, переписыванию их на свои сервера, организацию вечного хранения и обеспечению доступа читателей. Должны ли библиотеки национального уровня разделить поток полных текстов между собой, или этим должна заниматься какая-то одна библиотека? Это вопрос второй. Важно, что нельзя допустить ситуацию, когда этим будет заниматься организация не из библиотечного мира. Информресурс, например. Попробую обосновать свою точку зрения.

Во-первых, и, прежде всего, библиотека она и есть библиотека. Вне зависимости от того, на каком носителе опубликовано произведение. Технология хранения и “чтения” (в широком смысле) конечно, зависит от физической формы произведения. Микрофиши и хранить, и читать нужно не так как обычные книги. Но это не играет никакой существенной роли. Главное, что библиотеки владеют налаженной технологией хранения и обеспечения доступа к гигантским объемам информации. В любой другой организации эту технологию придется создавать заново. И в результате все равно получится библиотека. Что бы хорошо это понять, достаточно почитать переписку нынешних держателей “электронных библиотек”. Сегодня они стоят перед решением типично библиотечного вопроса: “Как наладить каталогизацию своих электронных фондов?”. Цитирую со странички http://www.lib.ru/COMPULIB/libtezisy.txt:

“Архив должен быть полнотекстовым. Несколько альтернативных тезаурусов (например - авторы по алфавиту, книги по тематикам, книги по годам. Внутри должно быть единое хранение с простой монтабельной системой управления, при каждой книге хранить несколько ключевых атрибутов: автор/ название/ год издания/ тематика/ подтематика/ переводчик/ УДК/ место в хранилище. Тезаурусы строить автоматом по текущему содержимому. Поиск по атрибутам (автор/ название/ год издания/ тематика/...) - обязательно. Кстати, тезаурусы можно строить на том же движке, что и поиск. Ибо что такое алфавитный каталог? Это поиск по шаблону "все". Тематический каталог? Это сортировка не по автору, а по теме и только потом - по автору. И т.д.”

Все предельно ясно. Абсолютно те же вопросы, что и при создании что карточного, что электронного каталога “традиционной библиотеки”.

Во-вторых. “Надежды” на то, что Интернет в целом, заменит систему “традиционных библиотек” иллюзорны. Наиболее вероятный сценарий развития событий такой: библиотеки со своими информационными ресурсами “встроются” в общую инфраструктуру и займут там свое традиционное место, как хранители больших объемов информации. Основная задача “традиционной библиотеки” в сфере ее области ответственности, какой была, такой и останется: каталогизация. Как традиционных изданий, так и электронных ресурсов.

Несколько слов о каталогизации. Не для библиотекарей. Для тех, кто только начал этим заниматься. Под каталогизацией понимается процесс описания издания. Он состоит из четырех этапов.

  1. Составление библиографического описания. Авторы и многое другое, что принято называть авторами, заглавие, место и дата издания, издатель и прочее, прочее, прочее. Всего, в зависимости от типа издания, атрибутов так с тысячу.

  2. Систематизация. Это присвоение изданию одного или нескольких систематических индексов. Наиболее распространенные в России системы индексации: УДК, ББК, ГРНТИ, Дьюи.

  3. Предметизация. Осмысленное присвоение изданию предметных рубрик и/или ключевых слов. Например, рубрики “Аттракторы” для изданий посвященных вопросам устойчивости решений некоторых уравнений механики сплошной среды.

  4. Шифрование. По сути дела присвоение кода, по которому издание можно найти на полке, или в сети Интернет (URL, если угодно).

Именно каталогизацию “традиционные библиотеки” могут делать профессионально. (Иногда настолько профессионально, что в карточных каталогах ничего найдешь). А главное, в “традиционных библиотеках” есть для этого люди, и какие ни какие, деньги.

Теперь для библиотекарей. По поводу составления библиографического описания. В последнее время наметилась дискуссия: “А не использовать ли Dublin Core для каталогизации электронных документов?”. Вопрос принципиальный. Суть его в следующем. Вот, например, опять-таки “Мастер и Маргарита”, есть и книга на полке, и полный текст на сервере. И нужна запись в электронном каталоге. На саму книгу, в электронном каталоге есть запись в формате MARC (РУС МАРК или MARC21 не очень важно). И что же на электронную версию – Dublin Core? Не понял! Для непрофессионалов: в Dublin Core атрибутов записи всего пятнадцать, в формате MARC больше тысячи. С моей точки зрения, каталогизацию электронных изданий в библиотеке надо производить по тем же правилам, что и изданий в бумажной форме. В формате MARC, так значит, в формате MARC. Лишняя нагрузка? Это да. Но, все равно, ни как иначе.

Последний вопрос статьи: “Какие из уже существующих полных текстов в электронной форме “традиционные библиотеки” должны брать к себе в коллекцию?”. По моему мнению, это вопрос для нескольких отдельных статей. Но на первом этапе - этапе накопления электронных ресурсов, хочется предложить очень простой принцип: “Собирать все полные тексты тех произведений, которые уже есть в фонде”, как обычные книги.

И, наконец, а нужно ли их (полные тексты) вообще собирать? Есть ведь где-то в Интернете, дал ссылку из своего электронного каталога и достаточно. В общем-то, да! Для кого угодно другого, но не для библиотеки. Нельзя нарушать основное правило. Если есть запись в каталоге, то должно быть и само произведение. А ссылка (линк) в Интернете – это вещь временная. Сегодня есть, а завтра нет. По разным причинам. Это опять-таки к вопросу о технологии библиотечной работы. В частности по технологии обеспечения сохранности. Вопрос отдельный и чисто библиотечный.

Резюме. Настало время для активного обсуждения вопроса создания “электронных библиотек” как внутри “традиционных библиотек”, так и диалога между библиотекарями и держателями “электронных библиотек” в Интернет.

лы Всея"