Индексирование документов в муниципальной библиотеке. Тема: Теоретические основы индексирования документов

Одна из важнейших операций аналитико-синтетической переработки информации как средства информационного поиска – индексирование документов и информационных запросов.

Индексирование – процесс выражения содержания документа и (или)запроса наинформационно-поисковом языке (ИПЯ) с помощьютерминов индексирования – классификационных индексов, предметных рубрик (ПР), ключевых слов, дескрипторов, кодов. Иными словами, индексирование – процесс перевода содержания документов и запросов с естественного языка на ИПЯ, в результате чего создается поисковый образ документа (ПОД) и поисковый образ запроса (ПОЗ) . Таким образом, происходит «свертывание» информации, содержащейся в документе, и изложение ее на ИПЯ в виде индекса, предметной рубрики или дескриптора, ключевого слова.

Информационно-поисковый язык (ИПЯ) – это специально созданный искусственный язык, предназначенный для выражения содержания документов и (или) запросов с целью их последующего поиска. ИПЯ – это основной элемент логико-семантического аппарата информационно-поисковой системы (ИПС).

Необходимость создания искусственного языка (для выражения смыслового – семантического содержания документов с целью их поиска) обусловлена тем, что естественный язык обладает рядом свойств, препятствующих его использованию для записи и поиска информации: это неоднозначность и многозначность слов естественного языка. Точное значение многих слов можно определить только из контекста, в котором они употреблены (ударный инструмент, ударная доза и т.д.). Эти факторы не позволяют добиться точного соответствия между содержанием документа и средствами выражения этого содержания.

Трудности использования естественного языка в качестве ИПЯ усиливаются еще и тем, что в ИПС в качестве входных документов могут быть использованы не полные тексты, а рефераты, аннотации, библиографические описания, которые являются результатом свертывания содержания документов.

Основные требования, предъявляемые к ИПЯ:

· Однозначность;

· Достаточная семантическая сила

· Открытость (возможность корректировки языка)

Каждый ИПЯ имеет определенный словарный состав, представляющий совокупность лексических единиц (ЛЕ) – обозначения отдельного понятия, минимального и неделимого в этой функции. В качестве ЛЕ в ИПЯ используется лексика естественных языков – слова, словосочетания предметной рубрики, цифровые или буквенно-цифровые коды и т.д.

Важным моментом при индексировании является создание поискового образа документов (ПОД).Поисковый образ документа – основное смысловое содержание документа (а не вся информация, содержащаяся в нем), выраженное в терминах формализованного ИПЯ. ПОД ставится в однозначное соответствие этому документу, по нему производится отыскание документов в массиве документов.


Индексирование запроса также осуществляется путем перевода его содержания на ИПЯ. Таким образом, совокупность терминов индексирования, выражающих смысловое содержание запроса, называется поисковым образом запроса (ПОЗ ).

Поиск ведется по совокупности терминов индексирования. С целью повышения эффективности поиска информации по запросу ПОЗ может быть дополнен специальными указаниями о последовательности выполнения логических операций в процессе информационного поиска, которые называются поисковым предписанием.

Индексирование реализуется в следующих процессах: предметизации, систематизации и координатном индексировании.

Систематизация – вид индексирования, при котором содержание документа и (или) запроса выражено классификационными индексами, в соответствии с правилами определенного классификационного ИПЯ (КС). Такой принцип индексирования принято считать классификационным. Он обеспечивает возможность организации информационного поиска по иерархическому признаку. Специалисты, осуществляющие процесс систематизации в библиотеках и информационных центрах, называются систематизаторами.

Предметизация – вид индексирования, при котором содержание документа и (или) запроса выражено предметной рубрикой (ПР) в соответствии с правилами определенного предметизационного ИПЯ. Предметизационный принцип индексирования основан на использовании ЛЕ, которые входят в состав предметных рубрик, естественного языка (т.е. предметные рубрики, выражающие ПОД и ПОЗ составляются на основе естественного языка). Предметизационный принцип индексирования обеспечивает возможность организации информационного поиска по алфавитному признаку. Процессы предметизации осуществляются в библиотеках и информационных центрах предметизаторами.

Координатное индексирование – вид индексирования, при котором смысловое содержание документа и (или) запроса многоаспектно выражаются множеством ключевых слов или дескрипторов. ИПЯ, предназначенный для координатного индексирования, называется дескрипторным языком. Специалисты, осуществляющие координатное индексирование, называются индексаторами.

Термины «индексирование» и «индексатор» распространены в англоязычной литературе и широко применяются в международной и отечественной библиотечной практике.

Итак, в зависимости от вида индексирования, выделяются предметизационные, классификационные и дескрипторные ИПЯ. В их состав входит множество ЛЕ и грамматические (парадигматические и синтагматические) отношения между ними. ЛЕ – обозначение отдельного понятия, принятое в ИПЯ и неделимое в этой функции. ЛЕ могут представлять собой принятые в естественном языке слова, устойчивые словосочетания, аббревиатуры, символы, даты, общепринятые сокращения, лексически значимые компоненты сложных слов, а также эквивалентные им кодовые или символические обозначения искусственного языка. Грамматические отношения позволяют организовать ЛЕ в систему.

Требования к ИПЯ :

· Полно и точно передавать содержание документа, отражаемого в данной ИПС;

· Обеспечить однозначное толкования терминов индексирования;

· Допускать многоаспектное индексирование;

· Допускать внесение изменений (дополнений, исправлений);

· Обеспечивать простоту и удобство индексирования, информационного поиска и ведение данной ИПС;

· Отражать современное состояние терминосистемы в данной области знания.

Правила использования ИПЯ фиксируют в справочно-методическом аппарате соответствующей ИПС.

Синтагма (греч. – вместе построенное, соединенное) – смысловое единство, которое, в определенном контексте выражается словом, группой слов или предложением. Отдельно взятые слова (например, « методика», «пособие», «индексирование») вступают в предложении в синтагматические отношения с помощью грамматических средств языка, таких, как склонение, спряжение, предлоги, союзы и пр.

4. ТЕМА: УНИФИКАЦИЯ И СТАНДАРТИЗАЦИЯ ИНДЕКСИРОВАНИЯ ДОКУМЕНТОВ.

Термин «индексирование» был введен в отечественную библиотечную теорию и практику в 1991 г. ГОСТом 7.59 – 90 «Индексирование документов. Общие требования к систематизации и предметизации». Стандарт был введен взамен 3-х предыдущих ГОСТов, разработанных в 80-е гг.:

1. ГОСТ 7.39 – 82 Систематизация и предметизация. Термины и определения.

2. ГОСТ 7.44 – 84 Систематизация документов. Общие требования.

3. ГОСТ 7.45 – 84 Предметизация документов. Общие требования.

Все эти стандарты были разработаны в рамках Системы Стандартов по информации, библиотечному и издательскому делу (СИБИД) для унификации (единообразия) процессов индексирования. Конечная цель стандартизации – повышение качества и эффективности работы – в данном случае – качества индексирования и тех элементов справочно-поискового аппарата, которые связаны с индексированием. Любой стандарт рождается в результате обобщения многолетней практики.

Библиотекари учились по учебникам, использовали практические пособия. Стандартов, регламентирующих технологические процессы, многие десятилетия не было. Появление централизованной каталогизации (например, печатной каталожной карточки), общая для всех или многих библиотек система классификации привели библиотекарей к пониманию целесообразности единых принципов и методов работы. На определенном этапе развития международных связей возникла необходимость максимального согласования отечественной практики каталогизации с зарубежной.

ГОСТ 7.59 – 90 был ориентирован на Международный стандарт МС ИСО 5963 «Документация – методы анализа документов, определения их тематики и выбора терминов индексирования» введенным Международной организацией по стандартизации (ИСО) в 1985 г.

Международный стандарт обладал рядом достоинств, которые учли отечественные разработчики:

· Самостоятельной частью стандарта были определения встречающихся в нем терминов (в отечественных стандартах они были выведены отдельным ГОСТом).

· В МС вводились понятия и определялись требования общего характера, охватывающие как систематизацию, так и предметизацию (в отечественных стандартах эти процессы рассматривались, как самостоятельные несвязанные между собой процессы, в отдельных ГОСТах).

Преимущества МС ИСО были очевидны: проще освоить любой процесс, тем более – совокупность сложных процессов, какими являются систематизация и предметизация, если выделить общее, единичное и особенное. Было решено объединить отечественные стандарты, максимально приблизить их к международному по структуре и содержанию. Кроме того, необходимо было разработать такой стандарт, применения которого не ограничивалось бы ведомственными рамками. Это означало, что предстояло решить ряд терминологических проблем, так как в те годы в стране параллельно функционировали две системы терминов – библиотечная и информационная. Было решено использовать в стандарте современную международную терминологию.

В период разработки ГОСТ 7.59 – 90 было проведено серьезное научное исследование по внедрению предыдущих стандартов. Так, ГОСТом 7.44 – 84 предусматривалось обязательное ведение во всех библиотеках алфавитно-предметного указателя (АПУ) к систематическому каталогу – не в качестве вспомогательного аппарата, а в роли составной части каталога. Поэтому предписывалось составление карточки АПУ в процессе обработки новых поступлений. Это требование основывалось на современных представлениях о том, что СК способен выполнять свои функции, если он обеспечен адекватным АПУ. Вводилось также обязательное редактирование классификационного решения и предметных рубрик АПУ. Соответственно были изменены общегосударственные нормы времени.

Обследование показало, что сотни библиотек выполняли эти процессы, но с введением ГОСТа они становились обязательными для всех библиотек.

С января 2004 г. введен в действие в качестве Государственного стандарта Российской Федерации ГОСТ 7.59 – 2003 «Индексирование документов. Общие требования к систематизации и предметизации».

В соответствии с современными требованиями ГОСТ 7.59 – 2003 «Индексирование документов» состоит из 6 разделов. Структура ГОСТа следующая:

Через несколько лет был разработан и введен в действие другой стандарт, рассматривающий третий процесс индексирования – ГОСТ 7.66 – 92 «Индексирование документов. Общие требования к координатному индексированию», в основе которого также были правила МС ИСО 5963.

Прошло более десяти лет. За эти годы изменилась классификационная практика в стране. Во многих библиотеках появились автоматизированные системы и электронные каталоги. Потребовалось уточнить перечень и наименования классификационных систем. Существенно упорядочена терминология рассматриваемой предметной области. Были утверждены терминологические стандарты:

· ГОСТ 7.73 – 96 СИБИД. Поиск и распространение информации. Термины и определения.

· ГОСТ 7.74 – 96 СИБИД. Информационно-поисковые языки. Термины и определения.

· ГОСТ 7.76 – 96 СИБИД. Комплектование фонда документов. Библиографирование. Каталогизация. Термины и определения.

С января 2004 г. введен в действие в качестве Государственного стандарта Российской Федерации ГОСТ 7.59 – 2003 «СИБИД. Индексирование документов. Общие требования к систематизации и предметизации».

В соответствии с современными требованиями стандарт состоит из 6 разделов. Структура ГОСТа следующая:

1. Область применения

3. Определения

4. Общие положения

4.1 Сущность индексирования

4.2 Объект индексирования

4.3 Условия индексирования

4.4 Принципы индексирования

4.5 Виды ИПЯ и терминов индексирования

5. Требования к ИПЯ

5.1 Общие требования

5.2 Требования к классификационным ИПЯ

5.3 Требования к предметизационным ИПЯ

6. Технологические процессы и общие правила индексирования

6.1 Общие правила индексирования

6.2 Правила систематизации

6.3 правила предметизации.

ГОСТ 7.59 – 2003 устанавливает общие требования к индексированию: систематизации и предметизации документов и информационно-поисковым языкам, применяемым при индексировании. Стандарт предназначен для библиотек, органов научно-технической информации, книжных палат, редакций и издательств.

В журнале «Библиотека», начиная со второго номера за 2004 г. в рубрике «Библиотековедение» проводится «Школа индексирования» Э.Р. Сукиасяном, где публикуется материал, комментирующий содержание ГОСТов по индексированию.

Индексация документов заключается в присвоении им условных цифровых (иногда буквенно-цифровых) обозначений - индексов, которые предоставляются документам во время регистрации и свидетельствуют о место составления, время исполнения и хранения документов. Обязательным элементом индекса является порядковый регистрационный номер в пределах документопотока, что регистрируется, как правило, за год. В соответствии с задачами поиска порядковый номер может дополняться индексом по номенклатуре дел, а также другими классификационными отметками (индексами структурных подразделений, должностных лиц, корреспондентов, вопросов деятельности, видов документов и т.п.). Составные части регистрационного индекса отделяются друг от друга косой чертой, например: 356/01,134/02/03-10.

Чаще всего с регистрационного порядкового номера документов прилагается номенклатурный индекс, поскольку основной схемой классификации документов в делопроизводстве является номенклатура дел.

Базой для индексации номенклатур дел является перечень или список структурных подразделений с закрепленными за ними индексами или условными отметками. В индекса структурного подразделения добавляется номер дела по номенклатуре дел в пределах структурного подразделения, например: 05-15, где 05 - индекс структурного подразделения (обычно он совпадает с порядковым номером структурного подразделения по штатному расписанию), 15 - номер дела по номенклатуре. Целесообразность нумерации дел в пределах одного структурного подразделения объясняется тем, что таким образом достигается наибольшая стабильность номеров. Появление новых дел или уменьшение количества дел в одном структурном подразделении, создание или ликвидация структурных подразделений (а следовательно, и дел) не влияет на индексацию дел других структурных подразделений.

Одной из составляющих системы регистрации является классификаторы, которые разрабатываются с учетом потребности учреждения по поиску документов.

В случае отсутствия номенклатуры дел во время присвоения регистрационного индекса используют классификатор структурных подразделений, за которым, как правило, установлена последовательность структурных подразделений согласно штатному расписанию. Например: служба делопроизводства - 01; планово-финансовый отдел - 02; отдел маркетинга и рекламы - 03; отдел продаж - 04; отдел персонала - 05; юридический отдел - 06; бухгалтерия - 07; административно-хозяйственный отдел - 08.

Нередко в учреждениях разрабатывают цифровые классификаторы должностных лиц, как правило - руководителя и его заместителей, например: генеральный директор - 01; финансовый директор - 02; коммерческий директор - 03; заместитель генерального директора по административно-хозяйственным вопросам - 04.

Благодаря такой структуре индексации за регистрационным индексом можно определить, кто рассматривал документ и в какое структурное подразделение его направлено на исполнение. Например: 346/02/07, где 346 - порядковый номер входящего письма, 02 - индекс финансового директора, 07 - индекс бухгалтерии.

Использование во время регистрации индексов должностных лиц целесообразно в случае формирования дел (прежде всего переписка за подписью руководства) в структурных подразделениях.

Расположение регистрационного номера документа как составной части его индекса может меняться в зависимости от того, какой документ регистрируется - инициативный входной или инициативный выходной. Регистрация инициативных исходящих документов отличается от регистрации инициативных входных лишь двумя моментами: элементы регистрационного индекса записываются в обратной последовательности, а индексом должностного лица является индекс лица, подписавшего документ.

Итак, при регистрации инициативного исходящего документа сначала проставляется регистрационный номер с группой инициативных входящих документов (например, 1034), затем индекс должностного лица - автора резолюции (например, 02), далее - индекс структурного подразделения, куда направлен документ на исполнение (например, 06), а после исполнения документа - вторая часть индекса - индекс дела по номенклатуре (например, 14). Полный регистрационный индекс будет иметь такой вид: 1034/02/06-14.

Во время регистрации инициативного исходящего документа на документе проставляется сначала индекс дела по номенклатуре (например, 05-12), затем индекс должностного лица, подписавшего документ (например, 01), и регистрационный номер за группой инициативных исходящих документов (например, 960). В этом случае полный регистрационный индекс будет иметь такой вид: 05-12/01/960.

Распорядительные документы (постановления, решения, приказы, распоряжения), а также некоторые внутренние документы (протоколы, акты) имеют только порядковый номер в пределах года (с января по декабрь).

Только в учебных заведениях нумерация внутренних документов может вестись по учебным годом.

В некоторых случаях могут применяться буквенные индексы.

При регистрации обращений граждан порядковый номер дополняется первой буквой фамилии заявителя.

Например: Д-23. С-12.

Регистрация документов с ограниченным доступом предусматривает добавление к регистрационному индексу соответствующей отметки, например: 235/01-05ДСК.

С целью различения групп приказов по личному составу каждому виду может присваиваться буквенный индекс. Система индексов разрабатывается кадровыми службами с учетом специфики регистрации и формирования приказов в данном учреждении. Для приказов по личному составу (о приеме, переводе, увольнении, совместительстве работников учреждения, о материальной помощи, о поощрении работников), номера, как правило, добавляется буква "К" (кадры) или "ОС" (личный состав), например: № 145-К, № 68-ОС. Если приказы о поощрении ведутся отдельно, то добавляется буква "С" (поощрения), например: № 47-3. Приказы о предоставлении отпусков могут иметь такой буквенный индекс: № 83-От., приказы о командировке - № 54-В, приказы о взыскании - № 5-С.

На документах, авторами которых являются несколько организаций, индексы авторов проставляются через косую черту в порядке указания авторов (слева направо). Например, регистрационный индекс совместного приказа трех учреждений будет таким: 356/501/231.

Индексирование документов - это задача присвоения им неких метаданных, позволяющих быстро классифицировать, сортировать и искать информацию в архиве без просмотра самого документа. Наиболее простой формой индексирования документов является ввод информации в карточку поиска документов, созданных по определенным критериям.

Пример карточки поиска

  • название документа;
  • дата документа;
  • вид документа, и т.д.

При этом критериев может быть сколько угодно.

Для чего это нужно

Развитие электронной формы хранения документов требовало новых подходов к индексированию данных ещё в конце 90-х годов прошлого века. Развитие поисковых систем и лингвистических методов дало массу возможностей для построения обратных словарей документов и других систем классификации и поиска на основе конкретных текстов, но инструментов внешней (экспертной) классификации разработано не было. В 1996 году были предприняты первые попытки разработки механизма автоматического индексирования документа на основании его содержания, то есть присвоения логических связок.

Решение для поиска документов

Эксперимент, основной целью которого было изучение возможностей индексирования документов, проводился на базе Российской Национальной Библиотеки. Основа алгоритма индексирования документов - выделение ключевых слов, характерных для специфической области, к которой относится документ.

Чем больше количество информации, тем сложнее найти конкретный документ. Для того что бы сократить время поиска того или иного документа, его нужно проиндексировать.С помощью индексирования документов, поиск информации в массиве из 1 миллиона листов занимает около 3 секунд. Без индексирования это могло бы занять целый месяц.

Грамотное индексирование

Если Вам нужно проиндексировать документы, лучше всего сделать это, обратившись к специалистам. Обращайтесь к нам, наши специалисты имеют большой опыт работы по вводу данных. Стоимость этих услуг всегда дешевле чем, заниматься этим без специальных навыков.

Статьи

Сукиасян Э.Р.
Школа индексирования. Занятие 1. Стандартные требования к индексированию

[ Библиотека. – 2004. – № 2. – С. 50-52 ]

С января 2ОО4 г. в нашей стране введен в действие непосредственно в качестве Государственного стандарта Российской Федерации ГОСТ 7.59–2ООЗ «СИБИД. Индексирование документов. Общие требования к систематизации и предметизации». Стандарт принят органами по стандартизации Азербайджана, Армении, Белоруссии, Грузии, Казахстана, Киргизии, Молдавии, Таджикистана, Туркмении, Узбекистана.
Индексирование – новое слово? Возможно, для части библиотекарей, работающих в публичных библиотеках. Все мы всегда занимались индексированием – оно включает в себя: систематизацию (без которой не обходится ни одна библиотека), предметизацию, координатное индексирование. ГОСТ 7.74 дает следующее определение этого термина: «Индексирование – выражение содержания документа и/или смысла информационного запроса на информационно-поисковом языке».
Новое для широкого круга библиотекарей понятие появилось в названии ГОСТ 7.59–90, введенного впервые в 1991 г. Тогда в профессиональной печати были опубликованы методические рекомендации, положения стандарта изучались библиотечными работниками. Введение стандарта было своевременным и необходимым. Его основные требования вошли в учебные пособия, инструкции и положения, общегосударственные нормы времени на основные процессы библиотечной работы.
Прошло более десяти лет. За эти годы изменилась классификационная практика в стране. Потребовалось уточнить перечень и наименования классификационных систем. Существенно упорядочена терминология рассматриваемой предметной области. Были утверждены терминологические стандарты 7.73–96, 7.74–96 и 7.76–96, в которые вошли многие из тех терминов, приведенных в стандарте 7.59–90. Изменилось оформление стандартов вообще – они стали межгосударственными.
Существенно обновился за этот период кадровый состав библиотек. В отделах, занимающихся каталогизацией и обработкой документов, появились сотни новых сотрудников. Если даже они имели библиотечное образование, возникла необходимость овладеть новой системой терминов, обновить технологические знания, изучить рекомендованные стандартами приемы и алгоритмы. Тем, которые специальной подготовки не имели, нужно заниматься более целенаправленно и углубленно. Каталогизация такая область библиотечной практики, где самодеятельность недопустима, есть определенные документы (стандарты, нормы, правила, обязательные инструкции), без знания и строго выполнения которых сегодня работать нельзя.
Еще пока не везде, но уже во многих библиотеках появились автоматизированные системы и электронные каталоги. Вместе с ними в нашу повседневную жизнь пришли новые понятия и правила индексирования.
Задачи школы
В связи с введением в действие ГОСТ 7.59–2003 возникло предложение организовать на страницах «Библиотеки», самого массового профессионального издания в нашей стране, заочной Школы индексирования. Мы планируем публиковать материалы этой рубрики постоянно, из номера в номер. Ознакомим с историей разработки стандарта. Поясним, как должен быть связан стандарт с правилами, инструкциями, учебными и практическими пособиями. Глубоко познакомим с терминами и их стандартными определениями. Последовательно разберем общие требования к индексированию документов. Специальные занятия посвятим информационно-поисковым языкам – классификационным, предметизационным, дескрипторным. Подробно рассмотрим принципы, общие требования и правила систематизации, предметизации, координатного индексирования.
Заочная школа предполагает обратную связь со слушателями. Вести занятия буду я, Эдуард Рубенович Сукиасян. Мне можно написать по электронной почте (E-mail: [email protected]) или на адрес редакции журнала.
Предшественники ГОСТ 7.59–2003
Любой стандарт рождается в результате обобщения многолетней практики. Библиотекари учились по учебникам, использовали практические пособия. Стандартов, регламентирующих технологические процессы, многие десятилетия не было. Появление централизованной каталогизации (например, печатной каталожной карточки), общая для всех или многих библиотек система классификации понемногу привели библиотекарей к пониманию целесообразности единых принципов и методов работы. На определенном этапе развития международных связей возникла необходимость максимального согласования отечественной практики каталогизации с зарубежной.
В декабре 1985 г. Международная организация по стандартизации (ИСО), активным членом которой была наша страна, утвердила Международный стандарт 5963 «Документация – методы анализа документов, определения их тематики и выбора терминов индексирования». МС ИСО 5963 по своему содержанию почти полностью совпадал с введенными с 01.01.1985 г. в СССР двумя стандартами: ГОСТ 7.44–84 «СИБИД. Систематизация документов. Общие требования» и ГОСТ 7.45–84 «СИБИД. Предметизация документов. Общие требования». Интересно: требования международного и отечественных стандартов совпадали в деталях, но наши стандарты оказались более четкими, формализованными, содержали некоторые положения, совершенно отсутствующие в МС ИСО. Сказался опыт: в нашей стране первый учебник вышел в 1947 г., многократно пересматривались разного рода инструкции и положения.
Вместе с тем в МС ИСО 5963 обнаружились несомненные достоинства, пренебрегать которыми не хотелось. Самостоятельной частью стандарта были определения встречающихся в нем терминов. В отечественной практике задачи стандартизации терминологии решались отдельными стандартами. В частности, для рассматриваемой области уже был утвержден ГОСТ 7.39–82 «СИБИД. Систематизация и предметизация. Термины и определения (введен с 01.01.1984 г.). Более интересной оказалась другая особенность МС ИСО. В нем вводились понятия и определялись требования общего характера, охватывающие как систематизацию, так и предметизацию. Отечественные ГОСТ 7.44 и 7.45 разрабатывались одним и тем же авторским коллективом, но не имели общей части и не были согласованы в деталях. Мы и не ставили такой задачи, разрабатывая два самостоятельных стандарта.
Преимущества МС ИСО были очевидны: проще освоить любой процесс, тем более – совокупность сложных процессов, какими являются систематизация и предметизация, выделив общее, единичное и особенное. Поэтому было решено объединить два отечественных стандарта, максимально приблизить их к МС ИСО 5963 по структуре и содержанию. В коллективе разработчиков были представлены и крупнейшие библиотеки, и библиографирующие центры, и органы информации. Надо было разработать такой стандарт, применение которого не ограничивалось бы ведомственными рамками. Это значило, что предстояло решить ряд сложных терминологических проблем: в эти годы в стране параллельно функционировали две системы терминов – библиотечная и информационная. Было решено использовать в стандарте современную международную терминологию. Мы пришли к выводу, что рано или поздно противоречия и несогласованности терминологии внутри страны будут урегулированы, жизнь заставит нас принять международные нормы. Впоследствии наша гипотеза полностью оправдалась.
ГОСТ 7.59–90 оказался не единственным, созданным на основе МС ИСО 5963. Спустя несколько лет был разработан и с 01.01.1993 г. введен в действие его «собрат» – ГОСТ 7.66–92 «СИБИД. Индексирование документов. Общие требования к координатному индексированию».
Что было нового
В период разработки ГОСТ 7.59–90 было проведено серьезное научное исследование. Разработчики хотели выяснить, не считают ли библиотекари некоторые требования стандарта 7.44–84 слишком жесткими, неправомерными. Стандартом предусматри-валось обязательное ведение во всех библиотеках алфавитно-предметного указателя к систематическому каталогу (АПУ) – не в качестве вспомогательного аппарата, а в роли составной части каталога. Поэтому предписывалось составление карточки АПУ в процессе обработки новых поступлений. Это требование основывалось на современных представлениях о том, что систематический каталог способен выполнять свои функции, если он обеспечен адекватным АПУ. Иначе говоря указатель отражает содержание фактически существующих в фонде документов, представленных в каталоге, а поступающих в фонд – в процессе их обработки. Вводилось также обязательное редактирование классификационного решения и предметных рубрик АПУ, ведение систематической контрольной картотеки (СКК) к АПУ. Соответственно были изменены общегосударственные нормы времени.
Обследование показало, что сотни библиотек так уже работали, и ничего оригинального, нового стандарт не вносил. Дело в том, что указанные процессы становились обязательными. Выявилось четкое соответствие между наличием и качеством АПУ в библиотеке и количеством обращений к каталогу. Там, где каталог «существовал без адекватного АПУ, он оставался «вещью в себе». Там, где АПУ просто перепечатывался с таблиц классификации, каталогом пользовались с трудом (новая тематика в нем не отражалась). Если же библиотека постоянно вела АПУ, читатель эффективно работал с каталогом.
Новой, конечно, была терминология. Если взять учебники 1940–1950-х гг., то там многих терминов, которыми успешно оперируем сегодня, мы не встретим. Каждая эпоха обогащает наш профессиональный язык. Но если взять ГОСТ 7.59, мы вправе говорить не столько об «обогащении», сколько об уточнении понятий. Впрочем, практика показала, что новая терминология прижилась быстро. Наибольшие трудности возникли с понятием «термин индексирования» (indexing term), разобраться в котором нам еще предстоит.
Структура ГОСТ 7.59–2003
В соответствии с современными требованиями стандарт состоит из 6 разделов. В первом («Область применения») говорится (здесь и далее текст стандарта будет цитироваться без каких-либо изменений и выделяться особым шрифтом):
Настоящий стандарт устанавливает общие требования к индексированию: систематизации и предметизации документов и информационно-поисковым языкам, применяемым при индексировании. Стандарт предназначен для библиотек, органов научно-технической информации, книжных палат, редакций и издательств.
Затем следует довольно обширный раздел «2 Нормативные ссылки»:
В настоящем стандарте использованы ссылки на следующие стандарты:
ГОСТ 7.66–92 (ИСО 5963-85) Система стандартов по информации, библиотечному и издательскому делу. Индексирование документов. Общие требования к координатному индексированию.
ГОСТ 7.73–96 Система стандартов по информации, библиотечному и издательскому делу. Поиски распространение информации. Термины и определения.
ГОСТ 7.74–96 Система стандартов по информации, библиотечному и издательскому делу. Информационно-поисковые языки. Термины и определения.
ГОСТ 7.76–96 Система стандартов по информации, библиотечному и издательскому делу. Комплектование фонда документов. Библиографирование. Каталогизация. Термины и определения.
Очень ценным является раздел «3 Определения», в котором после слов «В настоящем стандарте применяют следующие термины с соответствующими определениями…» дан перечень 45 терминов, большая часть – со ссылками на указанные выше терминологические стандарты, а на 16 других терминов даны определения здесь же.
Вся дальнейшая структура стандарта будет понятна из приведенной схемы.
Структура ГОСТ 7.59–2003 «СИБИД. Индексирование Документов. Общие требования к систематизации и предметизации»

  1. Область применения
  2. Нормативные ссылки
  3. Определения
  4. Общие положения 4.1 Сущность индексирования 4.2 Объект индексирования 4.3 Условия индексирования 4.4 Принципы индексирования 4.5 Виды ИПЯ и терминов индексирования
  5. Требования к ИПЯ 5.1 Общие требования 5.2 Требования к классификационным ИПЯ 5.3 Требования к предметизационным языкам
  6. Технологические процессы и общие правила индексирования 6.1 Общие правила индексирования 6.2 Правила систематизации 6.3 Правила предметизации

Мы начнем наши занятия с раздела 4 «Общие положения». Все терминологические пояснения будут даны по мере необходимости.

Please enable JavaScript to view the

07.02.12.

Литература:

  1. ГОСТ 7.59-2003 “Индексирование документов. Общие требования к предметизации”; введён 2006.03.01. – Минск, 2003.- 5 с.
  2. ГОСТ СТБ 7.74-2002 “Інфармацыйна-пошукавыя мовы. Тэрміны і азначэнні”; введён 2003.07.01. – Минск, 2003. – 15 с.
  3. Ляйко Н. А. Каталагізацыя дакументаў. Індэксаванне дакументаў: вучэбны дапаможнік для студэнтаў спецыяльнасці “Бібліятэкавядзенне і бібліяграфія” ВНУ/ Н. А. Ляйко, А. І. Фядорына. – Мінск, БГУКІ. – 115 с.

План:

  1. Индексирование документов – основные термины и определения.

Основным средством раскрытия содержания как одного документа, так и всего библиотечного фонда является индексирование .

Индексирование выражение содержания документа или информационного запроса на ИПЯ (СТБ 7.74-2002).

ИПЯ язык, предназначенный для выражения содержания документов, или запросов, или описания фактов с целью последующего поиска .

Индексирование представляет собой операции перевода (трансформации, конверсии) с одного языка на другой. Т.е. – перевод содержания документа с естественного языка на искусственный. Например, на естественном языке «Физика» - на ИПЯ это по ББК: 22.3.

Результаты перевода содержания документа на ИПЯ представляются в виде поискового образа документа (ПОД) или поискового образа запроса (ПОЗ), которые выражаются терминами индексирования:

· Классификационные индексы

· ключевые слова

· дескрипторы .

Поисковый образ – текст, который выражает содержание поискового запроса, предназначенный для поиска.

Поисковый образ документа – поисковый образ, который выражает основное смысловое содержание документа.

Поисковый образ запроса – поисковый образ, который выражает смысловое содержание информационного запроса (СТБ 7.74-2002).

При индексировании основное содержание следует представлять с необходимой и достаточной полнотой и точностью в поисковом образе документа в виде терминов индексирования , а, при необходимости, и его форму и назначение для обеспечения эффективного информационного поиска.

Видами индексирования являются следующие процессы:

· Систематизация.

· Предметизация.

· Координатное индексирование.

Термин «индексирование» - обобщённое понятие, которое при систематизации можно заменить полным индексом, а при предметизации – соответственно совокупностью предметных рубрик, которые составляют ПОД либо ПОЗ.

  1. Структура ГОСТ 7.59-2003. Общие положения.

Основные процессы и правила (принципы) индексирования представлены в ГОСТ 7.59-2003. В Беларуси данный стандарт введён с 1 марта 2006 года.



Состоит из 6 разделов.

Предназначен для библиотек, органов НТИ, книжных палат, редакций, издательств.

Стандарт устанавливает общие требования к индексированию, к процессам систематизации и предметизации. А так же к ИПЯ, которые применяются при индексировании.

В стандарте приводится перечень из 45 терминов, большая часть которых имеет ссылки на утверждённые терминологические стандарты.


Структура стандарта:

1. Область применения.

3. Определения.

4. Общие положения:

4.1. Сущность индексирования.

4.2. Объект индексирования.

4.3. Условия индексирования.

4.4. Принципы индексирования.

4.5. Виды ИПЯ и терминов индексирования.

5. Требования к ИПЯ:

5.1. Общие требования.

5.2. Требования к классификационным ИПЯ.

5.3. Требования к предметизационным ИПЯ.

6. Технологические процессы и основные правила индексирования:

6.1. Общие правила индексирования.

6.2. Правила систематизации.

6.3. Правила предметизации.

Объектом индексирования является отдельный документ, его часть, или совокупность документов . В качестве объектов индексирования могут рассматриваться различные виды документов: книги, продолжающиеся издания, изоиздания, картографические/нотные издания, кинофонофото документы, неопубликованные издания, документы на микроносителях (микрофиши, микроформы), электронные ресурсы .

Объект индексирования устанавливается на этапе составления библиографической записи документа.

Согласно ГОСТ 7.59-2003 определены основные условия индексирования:

· Индексирование должно производится на основе непосредственного анализа документа.

· Предварительно подготовленная библиографическая запись поступает на индексирование вместе с документом.

· Если объектом индексирования является часть документа, сотрудника необходимо обеспечить документом в целом.

При анализе документа необходимо познакомиться с документом в полном объёме. При не возможности полного ознакомления необходимо изучить основные источники индексирования (текстовые части):

· Заглавие.

· Предисловие.

· Заключение.

· Название разделов, глав.

При индексировании необходимо учитывать специфику библиотеки и информационные потребности пользователей библиотеки.

Принципы индексирования:

· Классификационный.

· Предметизационный.

· Принцип координатного индексирования.

Расшифровку принципов изучить по учебнику .

Класіфікацыйны прынцып індэксавання – у якасці тэрмінаў індэксавання выкарыстоўваюцца класіфікацыйныя індэксы. Класіфікацыйны прынцып індэксавання забяспечвае магчы­масць арганізацыі інфармацыйнага пошуку па іерархічнай прымеце.

Прадметызацыйны прынцып індэксавання – у якасці тэрмінаў індэксавання выкарыстоўваюцца лексічныя адзінкі натуральнай мовы (словы, словазлучэнні прадметнай рубры­кі). Прадметызацыйны прынцып індэксавання забяспечвае магчымасць арганізацыі інфармацыйнага пошуку па алфавіт­най прымеце.

Прынцып каардынатнага індэксавання – у якасці тэрмінаў індэксавання выкарыстоўваюцца дэскрыптары. Дэскрыптар – гэта лексічная адзінка каардынатнага індэксавання, яна выражаецца словам (вербальна) або кодам і абазначае клас блізкіх па сэнсе ключавых слоў. Пішацца дэскрыптар па пэўных правілах ці інструкцыях, прынятых у бібліятэцы, у адпаведнасці з тэзаурусам, альбо дэскрыптарным слоўнікам.

В зависимости от того, какой принцип является ведущим различают классификационные и предметизационные ИПЯ. Таким образом, в соответствии с характером ИПЯ, индексирование осуществляется в соответствии с классификационным, предметизационным, координатным индексирования принципом. В качестве терминов соответственно - индексы, рубрики, ключевые слова и дескрипторы.

  1. Требования к информационно-поисковым языкам (ИПЯ).

Процесс индексирования требует соблюдения определённых требований к ИПЯ. В состав ИПЯ входит множество лексических единиц и грамматические (парадигматические и синтогматические) отношения между ними.

Множество лексических единиц – множество классификационных индексов классификационного ИПЯ (ББК).

Парадигматические отношения – т.е. иерархические , отражают внутреннюю структуру классификационной системы, связи между делениями по вертикали.

Синтогматические отношения – проявляются в сложных и составных индексах.

Поделиться: