Статья «
Search engine coverage of the OAI PMH corpus» рассматривает проблему охвата поисковыми машинами Интернет (Google, Yahoo, MSN) материалов из электронных библиотек и архивов, доступных по протоколу OAI PMH.

Рост открытых электронных (OAI) архивов. Ситуация на рубеже 20052006 гг.
Сгенерировано с помощью [>>>]
Начал действовать итальянский проект
PLEIADI («Portale per la Letteratura scientifica Elettronica Italiana su Archivi aperti e Depositi Istituzionali») портал доступа к итальским публикациям, размещенных в открытых электронных архивах.
Портал имеет двуязычный интерфейс (итальянский и английский) и создан в сотрудничестве двух ведущих итальянских университетских консорциумов (CASPUR и CILEA). В настоящий момент в единой точке доступа можно провести поиск по метаданным, извлеченным по протоколу OAI PMH из восьми электронных архивов.
PLEIADI демонстрирует один из примеров решения проблемы доступа к электронным публикациям на национальном уровне.
DL-Harvest — новый сервис для поиска по открытым электронным архивам в области библиотечных и информационных дисциплин. DL-Harvest извлекает информацию из 11 источников и в настоящее время содержит данные более чем о 10 тыс. документов. Фунцкионирование DL-Harvest базируется на использовании протокола OAI PMH.
Начал работу поисковый сервис
METALIS, предоставляющий возможность одновременного поиска по тематическим электронным архивам в области
библиотечно-информационных дисциплин. Работа METALIS основана на возможностях протокола OAI PMH.
Cybertesis каталог, содержащий информацию о более чем 27 тысячах полнотекстовых электронных авторефератах и диссертаций из различных университетских репозиториев. Работа каталога организована с использованием протокола OAI PMH. Возможен поиск по базовой информации (автор, заглавие, аннотация, ключевые слова).
Один из крупнейших мировых порталов Yahoo! запустил новую программу под названием
Content Acquisition Program (CAP).
В числе прочего она подразумевает индексацию и предоставление в поисковых результатах Yahoo! материалов, часть которых традиционно относилась к категории invisible web, то есть не индексировалась поисковыми машинами. Среди партнеров Yahoo! в CAP упоминаются Библиотека Конгресса США, Публичная библиотека Нью-Йорка, проект Гутенберг, Библиотека Мичиганского университета, электронная библиотека клинописных текстов (Cuneiform Digital Library Initiative), пополняемая добровольцами со всего мира энциклопедия Wikipedia, Национальная научная электронная библиотека (National Science Digital Library). В Yahoo! также добавлено значительное количество аудиоинформации, включая передачи Национального радио (17 тыс. часов) и записи заседаний Верховного суда (2 тыс. часов).
Новая программа Yahoo! опирается на технологии, которые активно развиваются в последние годы разработчиками электронных библиотек. Участвующий в CAP проект OAIster Мичиганского университета предоставляет доступ к 3 млн. описаний цифровых объектов, большинство которых свободно доступны. Их описания извлечены из 268 каталогов библиотек и научных организаций со всего мира, поддерживающих OAI PMH (Open Archives Initiative Protocol for Metadata Harvesting).
По мнению некоторых наблюдателей, выгода в сотрудничестве между OAIster и Yahoo! не столько количественная, сколько качественная: Yahoo! будет получать структурированный поток с информацией о всех обновлениях базы OAIster, что позволит отказаться от обычного для поисковых систем «обхода» веб-ресурсов с целью индексирования. В результате повысится скорость обновления этой информации в базе Yahoo!, а также появится возможность использовать при поиске и ранжировании результатов информацию о структуре метаданных включенных в OAIster описаний.
CAP является продолжением значительных изменений, которые происходят в последнее время с поиском на Yahoo! В феврале 2004 г. портал отказался от трансляции в результатах поисках информации, предоставляемой Google, и запустил собственный поисковый движок. В настоящее время Yahoo! контролирует около 30% поискового траффика в США.