|
От InterCat к CORC: Кооперация в отборе и каталогизации веб-ресурсов
|
Хант Стюарт
Ключевые слова:
CORC, каталогизация ресурсов Интернет, кооперация библиотек, InterCat
Каталогизация ресурсов Интернет в ходе проектов InterCat и CORC затронула множество важных для библиотек проблем. Она заставляет задуматься о ломке устоявшейся структуры функционально ориентированной библиотеки, о размытии границ традиционной библиотеки и о распределении ответственности за формирование метаданных между библиотеками и другими создателями метаданных. Все это в конечном итоге ведет к рождению новых форм сотрудничества внутри библиотеки, между библиотеками и между библиотеками и другими сообществами.

Версия для печати

Dublin Core
Цель этой статьи состоит в том, чтобы осветить достижения двух проектов OCLC. Первый — это исследовательский проект InterCat, своими результатами содействовавший значительному расширению уже существующих служб OCLC. Другой — Кооперативный каталог онлайновых ресурсов (Cooperative Online Resource Catalog) или CORC, — привел к созданию полностью новой службы OCLC.
Через обсуждение этих двух проектов я покажу уроки, извлеченные как для кооперационной модели библиографической деятельности, так и для отдельных библиотек. Особое внимание будет уделено принципам сотрудничества, свойственным каждому из этих проектов. Я постараюсь рассказать о двух проблемах, применительно к ресурсам Интернет — это библиографический учет и практика формирования фондов. Начну я с некоторых мыслей о сотрудничестве.
Сотрудничество — это основной принцип библиографической деятельности. Модель совместной распределенной каталогизации была и продолжает быть широко распространенной в библиотечном сообществе. Изменения в экономическом состоянии библиотек в соединении с выгодами сотрудничества — это темы, которые никогда не потеряют своей актуальности для библиотек. Нашим текущим воплощением этой идеи является подъем и возрастание силы консорциумов. Как работники в области метаинформации мы признаем, что понятие сотрудничества охватывает большую часть нашей деятельности. Что такое «интероперабельность», выраженная другими словами? Чем это сегодня отличается от значения нашего термина «кооперация»? Совсем недавно библиотеки рассматривали кооперацию только по отношению к другим библиотекам, но теперь следует принимать во внимание, что она значительно расширена. В определенной степени мы можем сказать, сколь многого нам удалось достичь, что наши библиотеки уже работают, невзирая на национальные или культурные границы, принося всеобщую пользу.
В нашем глобальном сетевом пространстве мы признаем, что кооперация простирается и в другие сектора и области вне библиотек. Множество дискуссий прошло и продолжается на межструктурном уровне, ведя к новым стимулирующим моделям сотрудничества. Мы заседаем в комитетах, рабочих группах, посещаем конференции и встречи, где говорится, что мы больше не являемся исключительно библиотечными работниками. Схемы метаданных, которые работают и взаимодействуют между собой — это иллюстрация нового сотрудничества, которое между нами породил Интернет.
Путь, который привел нас в это место — один из множества шагов, и в каждой предметной сфере могут быть указаны ключевые события, которые принесли изменение парадигмы нашего мышления, и, что еще более важно, нашей практики. Для OCLC и участвующих в этом консорциуме библиотек первые реальные шаги были сделаны в начале 1990-х.
InterCat
В 1990-х годах Исследовательский отдел (Office of Research) OCLC начал исследования в области каталогизации интернет-ресурсов. Эта деятельность была поддержана двумя грантами, предоставленными Департаментом образования США. Проект с названием «Internet Resources Project» («Проект ресурсов Интернет») (1991–1993) стал основным для концептуального осмысления необходимости записи удаленного расположения интернет-ресурсов. Фундаментальным результатом этого исследования был шаг к введению специального поля в формате USMARC для записи электронного адреса и метода доступа для ресурсов Интернет. Как мы все мы знаем, это привело к созданию 856 поля в USMARC (как он еще тогда назывался).
Продолжением «Internet Resources Project» стал другой проект, названный «Building a Catalog of Internet Resources» («Создание каталога ресурсов Интернет») (1993–1996), более известный как InterCat. Специфической целью InterCat было создание библиографических данных в MARC-формате для интернет-ресурсов. Основываясь на принципах «Internet Resources Project», участники InterCat сотрудничали в создании сводной базы данных библиографических записей для ресурсов Интернет.
Параллельно с работой InterCat в 1994 году произошло одобрение комитетом MARBI (Machine-Readable Bibliographic Information) использования 856 поля в USMARC. InterCat таким образом получил существенный стимул, обусловленный подтверждением его практики внутри MARC-сообщества. Таким образом, библиотеки впервые официально получили возможность в стандартизированной форме вносить в MARC-запись информацию об удаленном расположении электронных ресурсов.
Важнейшей целью проекта InterCat была оценка формата USMARC для предоставления описания, информации о расположении и доступе для удаленных электронных ресурсов. Для этого должно было использоваться 856 поле.
У проекта были следующие цели:
- создание путем скоординированной совместной деятельности библиографической базы в USMARC-формате на электронные файлы удаленного доступа;
- обеспечение широкого доступа к этому каталогу через WorldCat (объединенный каталог OCLC), службу FirstSearch, и особую базу данных, свободно доступную для всех пользователей Интернет;
- связь через 856 поле информации о местоположении и доступе с самим объектом [1].
У InterCat были специфические критерии оценки в отношении создания распределенной базы ресурсов и справочной инфраструктуры для каталогизаторов в области, которую в то время можно было считать «передним краем». Также проект был направлен на достижение ощутимых результатов, которые могут быть выражены следующими словами:
- содействие интеграции, описанию и доступу к ресурсам Интернет в библиотечных каталогах;
- проверка пригодности библиографических данных в MARC-формате в обеспечении эффективного доступа через поисковый интерфейс каталогов;
- тестирование технической возможности прямого доступа от описания непосредственно к электронному ресурсу, основываясь на кодированной информации о способе доступа и расположении ресурса, представленной в 856 поле;
- оценка стабильности информации о расположении ресурса и способе доступа, посредством повторяющегося автоматизированного тестирования, основанного на информации из 856 поля [2].
Как руководящая организация OCLC обеспечивала поддержку библиографической базы, предоставляющей описание, информацию о доступе и расположении для интернет-ресурсов. Существенным результатом проекта стала документация, позволившая упростить каталогизацию электронных ресурсов: было создано руководство «Cataloguing internet resources: a manual and practical guide» («Каталогизация ресурсов Интернет: справочник и практическое руководство») под редакцией Нэнси Олсон (Nancy Olson) [3].
Проект InterCat может быть оценен множеством способов. Ясно, что в InterCat были применены решения, имеющие фундаментальный смысл для библиотечной практики. В некотором роде мы можем видеть, что InterCat был решительным в задачах, которые он ставил перед библиотеками, но, вероятно, менее радикальным, чем задачи, которые ставил сам Интернет. Если взять потребность установления библиографического учета над интернет-ресурсами, то вопрос, как именно библиотеки достигнут этого, является основным. На политику библиотеки влияет, по всей вероятности, количество персонала и установленный технологической процесс. Необходимо принимать решения о том, кем и как эта работа должна быть выполнена. Это же относится и к основным технологическим проблемам: как именно библиотека сможет эффективно интегрировать внешние ресурсы в собственные фонды.
Во времена InterCat для библиотек, использующих автоматизированные библиотечные системы, использование MARC-формата было существенным преимуществом. Библиографические данные в MARC-формате могли быть встроены в систему формальной проверки с помощью библиографических описаний и авторитетного контроля. Автоматизированные библиотечные системы были хорошо приспособлены для работы с большим количеством данных только в этом формате при создании поисковых индексов и предоставлении эффективного доступа. Еще одним результатом можно считать то, что всеми коллекциями можно было управлять с помощью одной системы.
Положительным итогом проекта InterCat можно считать успешное создание существенного числа библиографических записей на ресурсы Интернет. Записи были созданы более чем двумястами библиотеками на протяжении всего проекта. Они нашли свой путь в различные сервисы OCLC и были применены для поиска ресурсов с использованием всех имеющихся в них возможностей. Каждая запись содержала 856 поле, была интегрирована в WorldCat и становилась таким образом доступной и всем библиотекам, проводящим каталогизацию с помощью OCLC, и конечным пользователям библиотек через службу FirstSearch. InterCat показал, что подчинение ресурсов Интернет библиографическому учету в MARC-формате и включение этих ресурсов в библиотечные каталоги просто как другого типа материала принесло существенную пользу. Однако, мы не должны забывать, что ситуация вне InterCat изменялась очень быстро.
CORC
Каталогизация в MARC-формате во время проекта InterCat казалась если не лучшим, то одним из лучших способов достижения прогресса в этой области. Однако, мы не должны игнорировать одновременное возникновение других схем метаданных, появляющихся в различных сообществах. Инициатива по созданию Dublin Core (Дублинского Ядра) метаданных и проблемы, которые она пыталась и пытается разрешить, предлагает альтернативный подход к той же самой проблемой: поиску веб-ресурсов.
Подход CORC изменился с самых первых шагов, что было обусловлено параллельным появлением множества схем метаданных и/или сообществ, начинающих выражать собственные взгляды и потребности. InterCat успешно обеспечивал сотрудничество. Это сотрудничество проходило между библиотеками и заключалось в той же самой парадигме, что и распределенная корпоративная каталогизация, существовавшая с начала 1970-х: библиотеки сплачиваются и работают вместе, чтобы уменьшить собственное бремя и обеспечить максимально широкое использование совместных ресурсов.
В начале 1999 г. OCLC учредил CORC (Кооперативный каталог онлайновых ресурсов) как научно-исследовательский проект, снова возглавляемый Исследовательским отделом OCLC. Вновь одной из целей была каталогизация веб-ресурсов, но на этот раз к ней добавилось и создание программных инструментов, которые могли бы упростить этот процесс. Меньше внимания было уделено созданию базы данных со специфическим форматом в виде репозитория MARC-данных. Со дня своего основания CORC также поддерживал Dublin Core, пользователи имели возможность выбрать схему метаданных, соответствующую их потребностям, а не были ограничены только MARC-форматом. Наличие таблиц соответствия между Dublin Core и MARC позволило преобразовывать данные на лету.
Влияние пользователей Dublin Core, которые могли самостоятельно формировать описательные метаданные, обнаруживается в наборе программных средств CORC. Это видно в инструментах, которые позволяют создавать метаданные автоматически. Таким образом, процесс создания метаданных может быть расширен, распространяя круг сотрудничества от создателя ресурса до каталогизатора.
Своевременность CORC была подтверждена числом участников еще в то время, когда CORC был исследовательским проектом. Если в начале имелось 100 участников, то к концу исследовательского этапа их насчитывалось уже около 400. Существенным было также участие организаций не из США, чего не наблюдалось во времена InterCat. Следует отметить присутствие участников, для которых Англо-американские правила каталогизации и MARC21 не были действующим стандартом и для которых применение метаданных в формате Dublin Core стало основой для сотрудничества. В июле 2000 года CORC стал действующей службой OCLC, увеличив тем самым число библиотек, которые могли бы сотрудничать в создании метаданных для описания веб-ресурсов.
Оценка эффективности CORC в сравнении с InterCat является более сложной проблемой. Для доступа к службе CORC используется только браузер. Поэтому техническое развитие проекта в некоторой степени было функционально ограничено возможностями браузеров. Это становится наиболее существенно при использовании других языков, помимо английского. В то время как программная платформа CORC была совместима с Unicode, OCLC установил связь между базами CORC и WorldCat, тем самым ограничив возможности использования Unicode. Эта ситуация изменится с переходом WorldCat на новую платформу Oracle. Такое техническое ограничение повлияло на сотрудничество, поскольку пользователи, особенно европейские, были разочарованы. Дальнейшие осложнения возникли в связи различным поведением веб-браузеров. Смысл в том, что как только сотрудничество в CORC вышло за пределы американского ядра OCLC, возникли чисто технологические ограничения.
Сотрудничество
Теперь я хотел бы дать обзор типам кооперации, свойственных каждому из этих двух проектов.
InterCat может быть охарактеризован как межбиблиотечная кооперация, в нем все сотрудничество проходило между библиотеками. Связующим звеном этого разделения труда была OCLC, организуемая и управляемая из центра. Кооперация достигалась путем распределения библиографических данных, что является основной составляющей для OCLC. В принципе было небольшое различие в типах распределяемых метаданных, в то время как модель сотрудничества была основана на устоявшейся модели библиографической сети. Данные в формате MARC создавались и многократно использовались библиотеками-участниками. Единственным дополнением было то, что в InterCat библиотеки впервые стали распространять метаданные с информацией об электронном местоположении и способе доступа к ресурсу.
CORC продолжает эту модель сотрудничества, и все перечисленные характеристики могли быть найдены и на исследовательской стадии CORC и теперь, когда он является действующей службой OCLC. На этом уровне каталог CORC представляется обычным делом для библиотечного сотрудничества. Однако, кооперация, которой CORC потенциально способствует, этим не ограничивается. Поскольку применяемые в CORC инструменты намного облегчают создание метаданных, их использование не рассчитано только на каталогизаторов. Тогда как InterCat требовал высококвалифицированных каталогизаторов, создающих MARC-записи, CORC не налагает таких ограничений. Более видимой и выдвинутой на передний план деятельностью в CORC является отбор ресурсов. Программное обеспечение позволяет ответственному за отбор ресурсов специалисту выделить материалы, которые следует учесть, и создать черновые записи с помощью автоматической процедуры извлечения метаданных. Впоследствии специалист-каталогизатор может дополнить информацию теми данными, в которых нуждается организация.
Кто отбирает электронные ресурсы, которые должны быть каталогизированы в библиотеке? По всей вероятности, не каталогизаторы. Отбор ресурсов для библиотечных каталогов делается соответствующим предметным специалистом или комплектатором. Эта модель заметно расширяется через виртуальное комплектование библиотечных фондов, поскольку библиотеки принимают во внимание те веб-ресурсы, которые они хотели бы представить своим пользователям.
Мы видим, что CORC используется и каталогизаторами и комплектаторами. Эти группы, исторически разделяемые в библиотеках на функциональном уровне, работают вместе и сотрудничают. Таким образом, CORC порождает новый тип сотрудничества в дополнение к межбиблиотечному сотрудничеству, который мы можем назвать внутрибиблиотечным сотрудничеством. Внутри отдельных организаций были выработаны или вырабатываются реальные изменения в технологическом процессе, чтобы реализовать по-настоящему внутрибиблиотечную кооперацию. Значение этого не должно отвергаться при управлении библиотекой или, в частности, в ее организационной структуре, в этом процессе есть и преимущества и недостатки. Старые модели функциональной организационной структуры делят штат библиотеки в соответствии с его навыками, а задачи перед группами — по их подобию. Это способствует специализации. Однако, как было указано [4], это может встать в противоречие с целями кооперации, поскольку цели группы могут встать выше целей библиотеки, а между группами может возникнуть конкуренция. Некоторые считают, что только интеграция исторически специализированных технических служб в библиотеке с ориентированными на конечного пользователя сервисами может с эффективностью справится с изменениям, которые выдвигает электронная среда [5].
CORC имеет возможность стать отражением гибридной библиотеки. Большое количество электронных ресурсов и то, как библиотека ставит их под свой контроль — это вопросы, которые создают неочевидность или даже размытие традиционных границ в пределах функционально организованной библиотеки. Веб-среда и информационные технологии только ускорят это размытие. CORC может это воплотить, отразить и выдвинуть на первый план.
Кооперация в CORC является межбиблиотечной и внутрибиблиотечной, но не останавливается на этом. Как появление гибридной библиотеки содержит тенденцию к изменению отношений внутри самой библиотеки, точно также разрушаются границы, присущие самой гибридной среде. В ломке этих границ мы должны повторно увидеть быстрый рост схем метаданных и сообществ, которые они представляют.
В InterCat мы видели библиотечное сообщество, выполнявшее дело, которое оно лучше всего делает в форме кооперации. Но мы также видели, что это была межбиблиотечная кооперация. В то время как мир двигался к множеству различных схем метаданных, InterCat в духе своего времени оставался MARC-центричным. Возникнув позже и испытав влияние Dublin Core, CORC поддерживает одновременно и MARC21, и Dublin Core и обладает возможностью поддерживать другие схемы метаданных. Таким способом реализуется потенциал CORC по расширению представления о сотрудничестве. Помимо межбиблиотечного сотрудничества мы теперь можем думать о кооперации между сообществами. Сообщество MARC достигло внутриблиотечного сотрудничества. Сейчас новые схемы метаданных и обмен между ними приводит к тому, что мы очень часто слышим: к интероперабельности.
Границы гибридной библиотеки становятся менее определимы, как и границы научных исследований и публикаций — вещей, о которых должны заботится библиотеки.
Появление научных публикаций в интернете ставит исследователей и библиотечных работников перед сложным переплетением взаимоотношений. В этой децентрализованной среде библиотекам необходимо эффективно учитывать изменение ресурсов и новые взаимоотношения. Метаданные, который помогают в поиске ресурсов и стимулируют его, не обязательного должны возникать в пределах библиотечного сообщества. Кооперация становится по-настоящему межгрупповой.
Кооперация в создании метаданных ставит некоторые фундаментальные вопросы. Библиографические службы, одной из которых является OCLC, всегда действовали по принципу доверия между участниками. Библиотеки доверяли метаданным, созданным другими участниками. Центральный контроль за качеством возлагался на OCLC, обеспечивая уверенность в том, что интеграция распределенных БД не будет скомпрометирована. Хорошо установленный порядок действий и совместные автоматические и ручные процедуры обеспечивали спокойное прохождение процесса контроля качества.
Когда мы идем дальше в веб-среду, эти два вопроса — доверие и качество — становятся более выраженными. Демократизация информации, которую воплощает веб, увеличивает число потенциальных источников метаданных. Доверие — это проблема, которая касается не только самого ресурса, но и ассоциированных с ним метаданных. Должна быть возможной проверка источников метаданных, возможно, через системы аутентификации или управления правами [6].
Виртуальное комплектование фондов
Сейчас я хочу рассмотреть применение того, что стало известным как виртуальное комплектование фондов. В первой половине 1990-х годов имелся большой скептицизм по поводу необходимости библиографического учета электронных ресурсов. Вставали такие вопросы как необходимость для библиотеки «собирать» эти ресурсы, и что обозначает понятие «фонд» в виртуальном окружении, наряду с реальной обеспокоенностью о стабильности и постоянстве местонахождения ресурсов.
Статистика, которая показывает рост веба, четко иллюстрирует масштаб проблемы. Споры и заботы этого периода на современном этапе оказались превзойдены реальностью. Библиотеки направляют своих пользователей к веб-ресурсам. Способы, которыми они это делают, нельзя назвать одинаковыми, но они имеют схожесть. Точно так же и ресурсы, к которым адресуют своих пользователей библиотеки, демонстрируют высокую степень схожести.
Библиотеки формулировали и формулируют политику виртуального комплектования фондов. Управляющие принципы часто вращаются вокруг следующего:
- расширение объема библиотечных фондов за границы физических объектов;
- воспитание у пользователей осведомленности о полезности веб-ресурсов;
- увеличение ценности ресурсов, получаемых другими способами.
Формирование фондов свободно доступными источниками может быть сравнительно безболезненной процедурой для библиотек, поскольку потенциально оно не затрагивает финансовые вопросы. Если ресурс является свободно доступным, есть веские причины взять его под библиографический учет, чтобы максимально увеличить его использование.
Типичная политика виртуального комплектования фондов, помимо соответствия общим принципам развития фондов, также может содержать некоторые специфические требования:
- употребительность ресурса;
- преимущества от включения ресурса в библиотечный фонд;
- простота использования для конечного пользователя;
- вопросы управления правами доступа.
Когда ресурс был отобран, перед библиотекой встают специфические проблемы, связанные с веб-материалами. Стабильность ресурса или его изменчивость, его употребительность, а также необходимость использования ресурса в будущем могут потребовать регулярного повторного обращения к ресурсу. Как садовник ухаживает за растениями, так и виртуальный комплектатор должен ухаживать за электронными ресурсами. Для изменяющихся со временем материалов имеется целый ряд проблем библиографического учета, и эти проблемы сходны с теми, с которыми сталкиваются каталогизаторы периодических изданий. Метаданные могут требовать регулярного обновления, чтобы продолжать оставаться релевантными и сохранять значение для поиска ресурсов.
Деятельность по виртуальному комплектованию фондов может быть достаточно трудным делом. В большом количестве веб-ресурсов есть и преимущества, и недостатки. В этом случае вполне применима метафора «иголка в стоге сена».
InterCat и CORC представляют работающую модель того, как можно облегчить отбор ресурсов. База данных InterCat и каталог CORC содержат метаданные для ресурсов, которые представляются релевантными или важными для других библиотек. Тем самым эти каталоги эффективно выполняют функцию предварительного рецензирования. В то время как каждая из этих баз значительно меньше всего веба, в каждой из них имеется большое число качественных ресурсов. Поэтому начальной точкой для комплектатора в библиотеке может стать не все содержимое веба, а меньшая база отобранных и отрецензированных источников.
Заключение
Мы видели, что и InterCat, и CORC в определенной степени были успешными проектами. Этот успех отличался для каждого из них: если InterCat способствовал расширению существующих сервисов, CORC стал полностью новой службой. Для InterCat кооперация была основана на уже существующей и хорошо действующей библиотечной сети, межбиблиотечной кооперации как обмене ресурсами. CORC продолжил эту линию, но, благодаря ориентации не только на MARC, распространил сотрудничество на межсекторный и межпредметный уровень. В добавок к этому применение CORC внутри библиотеки ведет к функциональному изменению библиотечной структуры и порождает внутрибиблиотечное сотрудничество.
Виртуальное комплектование фондов внутри гибридной библиотеки будет требовать усилий, пока мы стремимся установить библиографический учет над ресурсами. Идеальным взаимодействием, на котором основываются наши отношения, должно быть сотрудничество. Ни InterCat, ни CORC не могут приписать себе это достижение, но они могут отразить библиотечную практику и служить моделью — исторической, как InterCat, или современной, как CORC, — в которой функции гибридной библиотеки внутри и вне ее самой встречаются с требованиями, которые ставит задача доступа к веб-ресурсам.
[1] Проект INTERCAT. — URL: http://www.oclc.org/research/projects/archive/intercat.htm. (Проверено 1 ноября 2004 г.). [2] Ibid. [3] URL: http://www.oclc.org/support/documentation/worldcat/cataloging/internetguide/default.htm. (Проверено 1 ноября 2004 г.). [4] См. ссылку Карен Кэлхаун (Karen Calhoun) на Р. Стюиарта (Stueart ) и Б. Моран (Moran) в работе «Redesign of Library Workflows: Experimental Models for Electronic Resource Description». — URL: http://lcweb.loc.gov/catdir/bibcontrol/calhoun.html. (Проверено 1 ноября 2004 г.). [5] Ibid. [6] Это было отмечено Клиффордом Линчем (Clifford Lynch ) в работе «The New Context for Bibliographic Control In the New Millennium». — URL: http://lcweb.loc.gov/catdir/bibcontrol/lynch.html. (Проверено 1 ноября 2004 г.).

Добавить комментарий
Другие документы раздела Тема номера
|
|