Перегоедова Н.В.   Балуткина Н.А.  

Полнотекстовые базы данных в структуре информационных ресурсов собственной генерации: проблемы формирования, использование (опыт ОНБ ГПНТБ СО РАН)

Докладчик: Перегоедова Н.В.

В последние годы в целях совершенствования информационного обеспечения пользователей все большее внимание уделяется разработчиками электронных ресурсов формированию полнотекстовых БД. На сайте ГПНТБ СО РАН пользователям информацией предлагается ряд полнотекстовых баз данных (БД) собственной генерации: «Аналитические обзоры по экологии», «Издания ГПНТБ СО РАН», «Организационно-технологическая документация», «Учебники по библиотековедению, библиографоведению, информатике и книговедению», «Труды гуманитарных конференций», «Научные мероприятия РАН» и другие.
К 2012 году Отделом научной библиографии (ОНБ), являющимся основным разработчиком библиографических ресурсов в ГПНТБ СО РАН, сформировано более 50 БД. В видовой структуре системы БД 89% от общего числа ресурсов – библиографические (с текущим пополнением либо с ограниченной ретроспективой), 2% - фактографические, 9% - полнотекстовые. Число полнотекстовых БД пока относительно невелико, тематика их весьма разнообразна, а суммарное число документов составляет лишь 1% от общего числа записей в БД ОНБ ГПНТБ СО РАН (см. табл. 1), объем которых достигает 950 000.
Таблица 1. Полнотекстовые БД, генерируемые ОНБ ГПНТБ СО РАН*
N/N Название базы данных Число записей на 2011 г.
1.  *Наноматериаы, наноструктуры нанотехнологии: труды сотрудников СО РАН (с 2000 г.) 901
2.  *Научные мероприятия РАН (с 2008 г.)
796
3.  Управление наукой и инновациями в современных экономических условиях (с 1998 г.) 7591
4.  *Каталоги военных библиотек русской армии (2-я половина XIX в. - начало XX в.) 271
5.  Оцифрованные издания из фондов ГПНТБ СО РАН  230
Итого документов 9789
*Представлены также БД, в разработке которых ОНБ принимает участие на паритетных с другими отделами основаниях
**Учтено количество мероприятий
БД «Управление наукой и инновациями в современных экономических условиях» (с 1998 г.) предназначена для информационной поддержки модернизационных процессов в экономике посредством внедрения современных форм организации и управления научными исследованиями в СО РАН. БД готовится на основе создаваемых для руководящего состава СО РАН по системе дифференцированного обслуживания руководителей (ДОР) информационных сообщений. Ресурс является комплексным информационным продуктом, включающим библиографическую и полнотекстовую компоненты. Полнотекстовая часть представлена авторскими обзорно-реферативными сообщениями для абонентов системы ДОР, библиографическая часть кумулирует аннотированные или реферированные документы по теме, не включенные в обзорно-аналитические сообщения. Тематический рубрикатор БД перманентно актуализируется за счет освещения вопросов, связанных с развитием инновационной экономики.
В последние годы задача создания веб-ориентированных полнотекстовых БД трудов конференций позиционируется как актуальная, поскольку на научных форумах обсуждаются инновационные идеи, прорывные технологии, усовершенствованные методики, последние достижения научных исследований, при этом труды конференций, особенно проводимых на местах, не всегда публикуются либо издаются малыми тиражами. С учетом этого в ГПНТБ СО РАН формируются две полнотекстовые БД: «Труды конференций СО РАН по гуманитарным наукам» и «Научные мероприятия РАН». БД «Труды конференций СО РАН по гуманитарным наукам» формируется путем сканирования печатных изданий материалов конференций по гуманитарным проблемам учреждений СО РАН. БД «Научные мероприятия РАН» представляет материалы конференций РАН преимущественно по естественнонаучной тематике. В этой БД представлены также конференции по общественнонаучной и технической тематике (около 20% от общего числа научных мероприятий). БД содержит библиографическое описание трудов конференций, тексты или презентации докладов научных мероприятий.
По предложению ученых-книговедов в ОНБ было подготовлено к опубликованию пособие «Каталоги военных библиотек русской армии» (2-я половина XIX в. - начало XX в.), что и позволило сформировать одноименную полнотекстовую БД, призванную представить ценные сведения о книжной культуре России периода реформ, военных книжных собраниях. БД включает библиографическую информацию о каталогах военных библиотек, содержание каталогов по разделам с указанием числа изданий в них, дается гиперссылка на копии текстов каталогов.
Актуальность тематики, включение её рядом позиций в перечни приоритетных направлений развития науки, технологий и техники и критических технологий РФ обусловили принятие решения о формировании БД «Наноматериалы, наноструктуры, нанотехнологии: труды сотрудников СО РАН». БД была создана для проведения многофакторного наукометрического анализа научной деятельности ученых СО РАН, предоставляющего разнообразные количественные и фактографические данные. БД позволяет выявить НИУ и отдельных авторов, работающих в области нанотехнологий, перечень их публикаций, определить тенденции развития исследований в будущем и т.д. По системе гиперссылок на контенты Web of Science, Scopus, сайты издательств научных журналов в БД открыт доступ к полным текстам статей.
Объективные обстоятельства (изношенность фонда, ветхое состояние некоторых книг) обусловили начало работ по созданию полнотекстовой БД «Оцифрованные издания из фондов ГПНТБ СО РАН», осуществляемых усилиями нескольких отделов библиотеки с соблюдением норм законодательства в области авторского права. В перечень документов для оцифровки включаются наиболее часто спрашиваемые читателями старые издания (до 1941 г.), а также книги в ветхом состоянии.
Анализируя историю и обстоятельства формирования вышеупомянутых полнотекстовых БД, приходится констатировать, что, невзирая на явно проявленный к этому виду информации интерес со стороны научного сообщества, стройная концепция и стратегия создания этих ресурсов нами пока не сформулирована. Причины и условия формирования полнотекстовых БД были разнообразными (внедрение компьютерных технологий, актуальность определенного вида информации или тематики, обветшание фонда и т.д.). Все полнотекстовые БД в зависимости от целевого назначения имеют свой особый алгоритм формирования, структуру, набор специфических поисковых возможностей. Опыт показывает, что процесс подготовки полнотекстовых ресурсов очень трудоемок, требует современного технического обеспечения. Кроме этого, остается полностью не решенным вопрос о соблюдении авторских прав при предоставлении полных текстов произведений печати и их использовании. Так, например, в настоящее время доступ к большинству полнотекстовых ресурсов возможен только в стенах ГПНТБ СО РАН. Таким образом, для удовлетворения запросов потребителей информации в полнотекстовых ресурсах необходимо, наряду с разрешением организационно-правовых вопросов, сформулировать концептуальные основания формирования системы полнотекстовых ресурсов, определить её перспективы. Расширение репертуара полнотекстовых ресурсов может быть осуществлено посредством постепенного трансформирования библиографических БД в полнотекстовые с организацией системы гиперссылок на полные тексты. Поскольку полнотекстовые БД призваны способствовать взаимообмену научной информацией, востребованы учеными и специалистами, их репертуар должен расширяться. БД размещены по адресу в Интернете: http://www.spsl.nsc.ru
 


К списку докладов