Перейти на главную страницу
ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ДЛЯ СОЗДАНИЯ ПОЛНОТЕКСТОВЫХ КОЛЛЕКЦИЙ (ЭЛЕКТРОННЫХ БИБЛИОТЕК) ГРИНСТОУН
(GreenStone)
Учебно-справочное
пособие для библиотечных работников
1.2. Гринстоун: назначение и задачи………..15
1.3. Гринстоун: основные характеристики….16
1.4. Установка версии 2.70 под Windows…...21
1.5. Первый запуск……………………………24
1.6. Создаем первую коллекцию…………….25
3. Примеры коллекций……………………………47
3.1. Примеры локальных коллекций……….47
3.2. Примеры сетевых коллекций…………...48
Что же библиотеки могут предпринять, чтобы изменить ситуацию и привлечь читателей? Среди наиболее действенных мер – улучшение собственного электронного фонда, начиная с электронного каталога и веб-сайта, до предоставления доступа к качественным электронным ресурсам, которыми можно пользоваться не только в библиотеке, но и через Интернет. Доступ к хорошо структурированным, полнотекстовым электронным библиотекам, лицензионным базам данных, платным электронным ресурсам и иным проверенным и качественным электронным источникам информации может существенно повысить рейтинг библиотеки и увеличить ее посещаемость.
Электронные библиотеки и соответствующие информационные инфраструктуры создаются и развиваются в новом тысячелетии повсеместно. Но, несмотря на то, что понятие «электронная библиотека» появилось в конце 1980–х годов, единого определения до сих пор нет, и на эту тему продолжаются научные споры.
Вильям Армс, известный американский ученый в области электронной информации и автор первой переводной книги по электронным библиотекам, изданной в России предложил определение электронной библиотеки, ставшее впоследствии классическим: электронная библиотека – управляемая коллекция информации в совокупности с соответствующими сервисами, причем информация хранится в цифровых форматах и доступна по сети.
Директор ГПНТБ России А. И. Земсков предлагает следующее определение: электронная библиотека – это тематически ориентированная (или структурированная иным образом) среда доступа к удаленным или локальным электронным ресурсам, способная обслуживать электронными ресурсами локальных или удаленных пользователей.
Большинство специалистов в последнее время приходят к выводу, что электронная библиотека в идеале представляет собой аналог традиционной библиотеки, фонды которой находятся в электронном виде. Поэтому ее обязательными элементами являются: электронный каталог, полные тексты книг в электронном виде, и развитые средства навигации и поиска.
Каждому, кто решил создать электронную библиотеку, приходится принимать множество решений: необходимо определить цели и задачи будущей библиотеки, разработать структуру, найти исполнителей, подготовить методическое и техническое обеспечение, продумать вопросы хранения и сохранности, администрирования и доступа к созданным электронным ресурсам. Каждый вопрос требует отдельного и подробного рассмотрения.
В рамках данного пособия, мы рассмотрим только один программный продукт для создания электронных библиотек или, скорее, электронных коллекций. Это так называемое свободное программное обеспечение, бесплатно распространяемый программный продукт для создания электронных библиотек Гринстоун (GreenStone), который может быть использован в библиотеках для создания, например, электронных коллекций краеведческих материалов.
Для того, чтобы создать цифровую коллекцию, все публикации соответственно должны быть в цифровом формате. Если доступны только твердые копии книг, документов, изображений, а также музыкальных и видео- произведений, то их необходимо оцифровать и обработать в соответствующих прикладных программах, т.е. перевести в форму, считываемую компьютером. Обычно это делается - для обычных текстов путем сканирования и проведения оптического распознавания символов или простым перепечатыванием. Для изображений – путем сканирования и последующей постобработки в графических редакторах. Для звука и видео – путем цифровой перезаписи также с помощью соответствующих прикладных программ.
В данном пособии мы не будем учиться сканировать, распознавать и обрабатывать – эти вопросы подробно, если необходимо, можно рассмотреть отдельно. На данном этапе будем считать, что у вас уже есть некий тематический набор различных электронных документов (текстовых, графических и т.д.), которые необходимо объединить в единый интерфейс с возможностью поиска по всему массиву документов или внутри отдельных коллекций и дальнейшего просмотра по заданным параметрам.
Российский рынок программного обеспечения для электронных библиотек предлагает разнообразные программные продукты. Они отличаются как по стоимости, так и по функциональности. В целом можно говорить о следующих тенденциях:
В данном пособии мы будем рассматривать программный продукт, который определяется как свободное программное обеспечение (ПО) и распространяется на основе Генеральной общественной лицензии (или Открытого лицензионного соглашения) GNU. Подробнее см.: https://ru.wikipedia.org/wiki/GNU
Свободное ПО в большинстве своем бесплатно. Это большое преимущество для тех, кто ограничен в средствах (а у библиотек их всегда не хватает), однако существуют некоторые особенности свободного ПО, которые могут стать препятствием на пути создания электронной библиотеки для российского пользователя. Прежде всего, большая часть свободного ПО для полнотекстовых коллекций создано не в России и не всегда можно найти полный пакет документации по работе с данным ПО на русском языке. Кроме того, в силу географического положения страны-разработчика, техническая поддержка для российского пользователя весьма ограничена. Однако открытость исходных кодов дает пользователю неограниченную возможность видоизменять или настраивать ПО, в соответствии с собственными потребностями.
Наиболее известные свободно распространяемые зарубежные программные продукты для полнотекстовых коллекций:
Начало работы над проектом по разработке данного ПО можно отнести к 1990 году. В это время проводились отдельные исследования в различных областях по созданию электронных ресурсов, но еще не существовало ни одной целостной, универсальной среды для электронных библиотек. Подобные исследования по компрессии текстов проводились в течение нескольких лет Иеном Виттенем, Дэвидом Бейнбриджем (Ian Witten, David Bainbridge)1 на факультете компьютерных наук Университета Вайкато, Новая Зеландия. Впоследствии они легли в основу разработки в 1995 году в рамках проекта Новозеландская Электронная Библиотека (www.nzdl.org) небольшой программы, позволяющей не только размещать документы в Веб, но и осуществлять полнотекстовый поиск.
В 1997 разработчики Гринстоун приняли участие в проекте, по созданию CD-ROM коллекций гуманитарной информации с возможностью полнотекстового поиска. Проект был инициирован Human Info NGO, Бельгия. Усовершенствованное ПО использовали для создания 40 полнотекстовых коллекций на нескольких языках, которые впоследствии были записаны на диски и распространены в развивающихся странах.
Именно после завершения данного проекта разработчиками было принято решение рассматривать данное ПО как открытый ресурс и использовать Генеральную общественную лицензию (или Открытое лицензионное соглашение) GNU2. В этом же году разработанное программное обеспечение получило название Гринстоун.
Название было выбрано не случайно. Разработчики поставили перед собой непростую задачу: придумать емкое, запоминающееся и достаточно легко произносимое название, к тому же несущее в себе ярко выраженный национальный новозеландский подтекст. После долгих дискуссий, выбор остановили на Гринстоун, который, по мнению создателей ПО, как раз соответствовал всем этим параметрам.
![]() Рисунок 1 |
Традиционный для индейцев Маори топор или тесло (toki) (Рисунок 1), был первоначально выбран в качестве эмблемы для ПО Гринстоун. В культуре Маори тесло используется в различных целях. Данный вид предназначен для церемоний и является символом высокого положения или власти его обладателя (как правило, таким теслом обладал вождь племени). Это семейная реликвия одного из разработчиков данного ПО. |
Однако по этическим соображениям разработчики решили оставить в качестве эмблемы только лезвие тесла (Рисунок 2), сделанное из гринстоуна и остро заточенное, которое и стало легко распознаваемым символом ПО Гринстоун.
Создатели считают, что все качества, присущие гринстоуну также относятся и к программному обеспечению, а острый край резной части, символ того, что в основе разрабо- |
Рисунок 2 ![]() |
Один из самых первых самостоятельных проектов, где использовалось ПО Гринстоун – создание коллекции газет на языке Маори (Рисунок 3). Созданная при поддержке Министерства образования Новой Зеландии коллекция (Niupepa) до сих пор является крупнейшим собранием документов на языке Маори.
Коллекция содержит более 17 000 страниц из 34 отдельных периодических изданий с 1842 по 1932 год. Она состоит из 4 основных частей:
Создатели получили множество наград за ее разработку, а в день официальной церемонии открытия коллекции представители Маори подарили разработчикам выше упомянутое церемониальное тесло, в знак благодарности за вклад в сохранение языка маори.
Еще в 2003 году силами специалистов из разных стран-членов ЮНЕСКО был проведен анализ существующего свободного программного обеспечения для создания полнотекстовых коллекций, которые оценивались по различным критериям. По оценкам экспертов ЮНЕСКО Гринстоун был признан наиболее простой в использовании из рассмотренных систем, хотя и уступает некоторым системам в функциональности (например, DSpace и Fedora). Однако это единственная система, позволяющая организовывать электронные коллекции на съемных носителях.
Кроме того, в Университете Вайкато при содействии ЮНЕСКО и Human Info (Бельгия) был разработан специализированный учебный курс «Электронные библиотеки в образовании», в основе которого лежит использование программного обеспечения Гринстоун. В 2005 году группой российских специалистов был сделан перевод, адаптация и локализация курса и проведено 15 учебных сессий на английском и русском языках, в которых в общей сложности приняло участие около 200 специалистов.
Как большинство пользователей, которые используют программные продукты с открытым кодом, пользователи Гринстоун в большинстве своем неизвестны.
Международное сообщество внесло огромный вклад в разработку Гринстоун. Созданное тремя талантливыми специалистами, программное обеспечение постоянно совершенствуется, благодаря участию и помощи библиотекарей и программистов всего мира. В 2005 году была выпущена третья версия Гринстоун, в которой усовершенствованы старые и добавлены новые функции.
Любой желающий может подписаться на рассылку по адресу: https://list.scms.waikato.ac.nz/mailman/listinfo/greenstone-users или принять участие в совершенствовании ПО, сообщив об ошибках в работе Гринстоун: [email protected].
1.2. Гринстоун: назначение и задачи
Основная задача Гринстоун – автоматизированное создание, поддержка и презентация структурированных коллекций электронных документов и мультимедиа ресурсов.
Подзадачи и возможности (этапы создания проекта):
Несмотря на то, что в Гринстоун предусмотрена возможность создания мультигигабитных коллекций, данное ПО в большей степени рассчитано на небольшие, низкобюджетные проекты, не требующие больших финансовых затрат. Предполагается, что, используя Гринстоун, можно создать и поддерживать электронную библиотеку силами отдельных творческих личностей и самоорганизующихся сообществ библиотечных работников, действующих на различных уровнях – от индивидуального до институционального.
Java Runtime Environment необходима для работы Библиотечного интерфейса Гринстоун (Greenstone Librarian Interface) и может быть полезна для расширения встроенных возможностей Гринстоун по генерации веб-страниц интерфейса пользователя. Ghostscript необходим для полноценной работы Гринстоун и многих других программ с форматами PS (Adobe Postscript) и PDF (Portable Document Format). Ghostview устанавливается для обеспечения возможности просмотра файлов в формате PS (Adobe Postscript) и PDF (Portable Document Format).
Гринстоун работает совместно с программным обеспечением, которое является также свободно распространяемым: веб-сервер Apache и язык PERL. Интерфейс пользователя использует веб-браузер, обычно это FireFox (Мозилла) или Internet Explorer.
Гринстоун устанавливается для работы в среде Windows и в среде Unix. Дистрибутив включает готовые к использованию наборы для всех версий Windows, Linux и Mac OS X. Он также включает готовую исходную программу для системы, которая может быть откомпилирована, используя Microsoft C++ или gcc.
В Гринстоун встроены плагины для PDF, PostScript, Word, RTF, HTML, Plain text, Latex, ZIP archives, Excel, PPT, Email. Для мультимедийных документов: изображения (любой формат, включая GIF, JIF, JPEG, TIFF), MP3 audio, Ogg Vorbis audio и др. По различной организации коллекции и работе с плагинами можно создавать либо гомогенные коллекции (документы одной природы, например, MS Word + MS Excel), либо гетерогенные (электронные тексты + отдельные изображения + аудио + видео + …).
Для описания документов предусмотрена возможность выбрать из встроенных в Гринстоун схем метаданных: Dublin Core (квалифицированный и не квалифицированный уровень), RFC 1807, NZGLS (New Zealand Government Locator Service), AGLS (Australian Government Locator Service), Extracted Greenstone Metadata и др. Кроме того, пользователь может создать любой набор метаданных, используя встроенный в Гринстоун Редактор метаданных. Имеются плагины для XML, MARC, CDS/ISIS, ProCite, BibTex, Refer, OAI, DSpace, METS. На выбор пользователя, метаданные присваиваются единицам хранения различными способами: автоматическое извлечение, ручная набивка, импорт, иерархическое наследование.
По способу представления и поиска материалов:
Создаваемые в Гринстоун коллекции можно условно разделить по расположению и назначению (преобразуются друг в друга):
Программное обеспечение для создания полнотекстовых коллекций (электронных библиотек) гринстоун
15 10 2014
3 стр.
Новые термины и понятия: программа, программное обеспечение, базовое программное обеспечение, системное программное обеспечение, служебное программное обеспечение, прикладное прогр
10 10 2014
1 стр.
Системное программное обеспечение. Конспект лекций. – Новосибирск: Изд-во нгту, 2011.– 127 с
12 09 2014
14 стр.
Если аппаратные средства тело компьютера тогда, программное обеспечение своя душа (душа). Программное обеспечение срок, относился к наборам инструкций, названных программами. Письм
14 12 2014
1 стр.
Программа «Оборудование и программное обеспечение радиостудии» носит исключительно прикладной характер и являет своей целью предварительное знакомство студентов с оборудованием Уче
02 10 2014
1 стр.
Рабочая программа разработана в соответствии с государственным общеобязательным стандартом образования (госо-2006г.) на основе рабочего учебного плана специальности 050704 «Вычисли
15 09 2014
1 стр.
ЭТ, комплектующие, барометр, термометр, программное обеспечение, 2- эт, комплектующие, барометр, термометр, гравиметр, 3- эт, комплектующие, барометр, программное обеспечение
13 10 2014
1 стр.
Содержательная линия «Программное обеспечение информационных технологий» дисциплины «Информатика и икт» в большей своей части носит практический характер
25 09 2014
1 стр.