ИНДЕКСИРОВАНИЕ СТАТЕЙ КЛЮЧЕВЫМИ СЛОВАМИ
Методические рекомендации
(Версия 1 апреля 2005 года)
2005
1. Общие положения
1.1
. При индексировании статьи ключевыми словами (КС) библиотеки, входящие в корпорацию МАРС, ориентируются на термины, приведенные в ГОСТе 7.74-96 (перечень терминов см. в приложении в конце).
1.2
. Цель индексирования – обеспечить наиболее полное раскрытие содержания статьи.
1.3.
Библиотеки, входящие в корпорацию МАРС, при заполнении поля 653а «Ключевые слова» (RUSMARC – 610 «Неконтролируемые термины») применяют свободное индексирование КС (правильнее по ГОСТУ 7.74-96, лексическими единицами).
1.4. В перспективе – переход на координатное индексирование. Это станет возможным при создании определенных условий: разработка или приобретение корпорацией тезаурусов (словарей) КС и создание условий в библиотеках для их использования.
2. Анализ содержания статьи
2.1
. Начальным этапом индексирования является анализ содержания статьи. Предметом анализа являются все важнейшие для потенциальных пользователей аспекты содержания статьи.
2.2
. Анализу подлежат заглавие статьи и наименования ее частей, сведения относящиеся к основному заглавию, выделения в тексте, отдельные фрагменты текста (введение, заключение и т. п.), текст статьи, авторская аннотация или реферат, представленные автором ключевые слова, комментарии к статье, журнальная рубрика, оглавление журнала и т. д.
3. Правила составления ключевых слов
3
.1
. На основе проведенного анализа содержания статьи формируются КС. При составлении КС учитывается терминология автора статьи.
3.2
. Количество КС в ПОДе должно быть достаточным для полного отображения основных аспектов и объектов содержания индексируемой статьи, потенциально представляющих интерес для пользователей.
3.3
. При индексировании статей, посвященных конкретным, достаточно узким вопросам, в КС включаются термины и словосочетания обобщающего характера вышестоящего уровня.
Например:
Небольшая статья о магнитных ловушках.
магнитные ловушки ; магнитное поле ; магнетизм
карвы ; лыжи
фульбе ; народности
3.4
. Основное требование, которое предъявляется к КС – строгая определенность значения.
3.5
. Релятор используется только в случае крайней необходимости для устранения неоднозначности термина. Как правило, релятор содержит область знания, к которой относится термин.
Релятор не используется для объяснения непонятных терминов.
Релятор приводится без сокращений в круглых скобках, именительном падеже.
Например:
стабилизаторы (электротехника) ;
стабилизаторы (химия) ;
стабилизаторы (авиация)
Если библиотека при внесении КС использует словари (тезаурусы), перенося из них значения в создаваемую библиографическую запись, то перенос релятора в этом случае не является ошибкой. (Данный вопрос остается на контроле, так как следует посмотреть, какого качества словари используются в библиотеках).
3.6
. КС приводятся во множественном числе, за исключением слов используемых только в единственном числе.
Например:
инженеры ; налоги ; реки ; города; двигатели ; инновации ; азиаты ;
христиане ; передвижники ; шестидесятники ; кельты ; скифы ; татары
жилища ; храмы ; выставки
маркетинг ; менеджмент ; информация ; резонанс ; духовенство ;
пролетариат ; купечество ; аристократия ; археология ; ботаника ;
общеобразовательная школа
3.6.1
. Существительные, употребляемые в разных отраслях знаний то в единственном, то во множественном числе, приводятся в той форме, которая соответствует принятой в отрасли, с точки зрения которой рассматривается предмет.
Например:
кожа ; анатомия
кожи ; промышленное сырье
вода ; вещества; химические вещества
воды ; сточные воды ; природные воды
3.6.2
. Род, вид, семейства, классы, отряды и. т. д. животных и растений приводятся в том числе, в котором они содержатся в отраслевых справочных изданиях.
Например:
актинидия ; амариллисовые ; амариллис (род) ; амариллисы (цветы)
3.6.3
. Исчисляемые существительные употребляются в форме множественного числа, а неисчисляемые – в форме единственного числа.
Например:
В любой стране имеются в единственном числе:
финансовая система
банковская система
агропромышленный комплекс
система образования
высшая школа
общеобразовательная школа
3.6.4
. Сведения об отдельных договорах приводятся в форме единственного числа.
Например:
договор купли-продажи ; договоры
договор аренды ; договоры ; аренда
3.7
. КС приводятся в именительном падеже. В устойчивом словосочетании возможно применение любого падежа.
Например:
подшипники, лазерные принтеры ; системы слежения ; разведка боем
3.8
. Инверсия применяется для специальных терминов из различных отраслей знаний, когда эти термины без наличия инверсированной формы теряют изначальный смысл. Термины приводятся в том виде, как даны в отраслевых справочных изданиях. В расчете на массового пользователя, приводится вариант термина без инверсии.
Например:
гвоздика уральская ; уральская гвоздика
чайка сизая камчатская ; сизая камчатская чайка
роса мучнистая ; мучнистая роса
вероятностей теория ; теория вероятностей
Законы, правила, явления, теории, формулы и т. п., названные по именам авторов, открывателей и др. приводятся в КС в двух вариантах.
Например:
Ньютона бином ; бином Ньютона
Пифагора теорема ; теорема Пифагора
Доплера эффект ; эффект Доплера
Теоремы, формулы, законы и т. п., созданные двумя и более авторами, содержат тире между фамилиями разных авторов и дефис между двойной фамилией одного автора.
Например:
Бойля – Мариотта закон ; закон Бойля – Мариотта
Во всех остальных случаях вопрос применения инверсии решается библиографом. Если инверсия использована, то обязательно приводится второй вариант.
Например:
красная строка, но не надо строка красная
3.9
. При составлении КС применяются синонимы или эквиваленты, если они общеупотребительны, взаимозаменяемы или очень близки по смыслу, а также являются вариантами написания одного и того же термина. При индексировании используются энциклопедические и справочные издания.
Например:
оздоровительные лагеря ; летние лагеря
торговые марки ; бренды
биомониторинг ; биологический мониторинг
паблик-рилейшнз ; паблик-рилейшенз ; PR
INTERNET ; Интернет
демпфирование ; гашение колебаний ; борьба с вибрацией
жаргон ; сленг ; слэнг ; арго
3.10
. В качестве КС могут выступать слова (унитермы), терминологические словосочетания, фразы (в исключительных случаях), аббревиатуры, численные характеристики, имена собственные, символические обозначения.
3.11
. Общеупотребительные термины (метод, методы, принцип, принципы, свойства, уравнение, уравнения, проблемы, применение и. т. п.) приводятся в КС только в сочетании с другими словами, сужающими их значение.
Например:
оценка риска ; принцип взаимозаменяемости ; метод координат ;
уравнение турбулентной диффузии
3.12
. Для достижения строгой определенности значения прилагательные используются в сочетании с существительными.
Например:
биполярные транзисторы ; полимерно-битумные вяжущие материалы ;
английский язык
Если КС содержит несколько определений, относящихся к одному определяемому слову, то в этом случае словосочетание можно преобразовать в двух- или трехсловные реально существующие (а не надуманные) КС.
Например:
торированные вольфрамовые катоды ; торированные катоды ; вольфрамовые
катоды; катоды
электродинамические функциональные системы ; электродинамические
системы ; функциональные системы
русская народная музыка ; русская музыка ; народная музыка
Исключением являются случаи, когда прилагательное представляет собой самостоятельный термин.
Например:
прекрасное ; идеальное ; бессознательное ; иррациональное
3.13
. Частицы и междометия используются только в исключительных случаях, когда они входят в состав фразеологизмов, являющихся объектом рассмотрения в статье по языкознанию.
Например:
ни пуха ни пера ; фразеологизмы
ну и ну ; фразеологизмы
3.14
. Союзы в КС не применяются. Исключение составляет соединительный союз «и». Он используется в исключительных случаях в словосочетаниях, выражающих конкретную связь между понятиями.
Например:
государство и право ; наука и религия ; интеллигенция и власть
Если, например, внести отдельно слово «наука» и отдельно слово «религия», то в дальнейшем по этим словам могут быть выполнены следующие запросы: религия как наука, влияние религии на науку, влияние науки на религию (возможны еще варианты). Чтобы их идентифицировать, писать следует по-разному:
наука ; религия
наука и религия
религия и наука
3.15
. Предлоги применяются в устойчивых словосочетаниях.
Например:
бурение на нефть ; защита от пыли ; борьба с курением ;
подготовка к школе; работа с документами; движение за мир ;
налог на добавленную стоимость ; аварии при бурении ;
общества с ограниченной ответственностью ; потребность в запчастях ;
сварка под флюсом ; задача о рюкзаке ; игра в кости
3.16
. Частицы, междометия, предлоги, союзы, являющиеся в статье объектом лингвистического изучения, вносятся словосочетанием.
Например:
частица ни ; междометие ну ; союз и ; предлог в
3
.17
. Слова, состоящие из одной-двух букв, если они являются объектом рассмотрения в статье, приводятся после уточнения.
Например:
витамин А
язык программирования C ; язык программирования Си
3.18
. Термины-предложения и фразы оставляются без деления их на словосочетания только в том случае, когда такое разделение приводит к потере смысла исходного предложения.
Например:
спорт высоких достижений
русский язык как иностранный
3.19
. Числительные характеристики (диапазоны температур, давлений и т. д.) приводятся в КС со словесной формулировкой.
Например:
диапазон температур 373-453 К
3.20
. Все цифровые обозначения приводятся в КС арабскими цифрами.
Например:
5 класс
3.21
. В роли КС употребляются символические обозначения.
Например:
Sr-90
H[2]O (подстрочные сведения отображаются в квадратных скобках)
x{2}y{3} (надстрочные сведения отображаются в фигурных скобках)
Фор
Например:
H[2]O ; вода
NaCl ; хлорид натрия
3
.22
. Аббревиатуры приводятся в КС наряду с полной формой.
Например:
НЭП ; Новая экономическая политика
АОЗТ ; акционерные общества закрытого типа
АПК ; агропромышленный комплекс ; аграрно-промышленный комплекс
ИПЯ ; информационно-поисковые языки
Если краткая форма вытеснила полное наименование предмета и аббревиатура используется чаще в терминосистемах, то в КС приводится только аббревиатура.
Например:
ЭВМ ; ПЭВМ
3.23
. В качестве КС приводятся имена собственные.
3.23.1
. Названия исторических, политических и т. п. событий приводятся как устойчивые словосочетания. В качестве основного словосочетания дается название, приведенное в универсальных и отраслевых энциклопедиях. Также приводятся другие варианты, по которым возможен поиск.
Даты, приведенные к событиям, отражаются в хронологической рубрике, географические наименования – дополнительно в географической рубрике.
Например:
653а Великая Отечественная война 650у 1941-1945 гг.
653а Взятие Константинополя 650у 1453 г.
653а Висло-одерская операция 650у 1945 г.
653а Французская буржуазная революция 650у 18 в. кон.
653а Военные реформы 650у 1860-1870 гг.
653а Судебная реформа в России 650у 1864 г. 650z Россия
653а Битва при Каннах 650у 216 г. до н. э.
653а Локкарта заговор 650у 1918 г.
653а Боснийский кризис 650у 1908-1909 гг.
653а Рисовые бунты 650у 1918 г.
653а Крестовые походы 650у 1096-1270 гг.
653а Крестьянское восстание под предводительством
И. И. Болотникова 650у 1606-1607 гг.
653а Вестфальский мир 650у 1648 г.
653а Процесс 14-ти 650у 1884 г.
653а Выборы Президента Российской Федерации 650у 2004 г.
Если потенциальным пользователем ПОЗ может быть сформирован иначе, приводятся
и другие варианты.
Например:
653а Советско-финляндская война 650у 1939-1940 гг.
653а Зимняя война
653а Зимняя кампания
Слова и словосочетания «войны», «восстания», «крестьянские восстания», «военные операции» и т. п. приводятся отдельно.
Примечание:
Пункт
3
.2
3
.1 должен в дальнейшем найти отражение в Рубрикаторе. Сведения должны быть включены в него в качестве тематических рубрик.
3.23.2
. Наименования учебных курсов, дисциплин, программ, классных часов и других мероприятий, сайтов и т. п. приводятся в поле 630 «О произведениях», если в статье рассказывается о них, и в поле 505, если в журнале даны их материалы.
3.23.3
. Имена собственные, присвоенные неодушевленным предметам, приводятся без кавычек.
Например:
Адмирал Нахимов ; корабли
Восток ; космические корабли
3.23.4
. Светские и религиозные праздники, термины народного календаря и лечебника записываются полными словосочетаниями без кавычек.
Например:
День Победы ; День Благодарения ; Татьянин день
8 Марта ; Восьмое марта
При наличии нескольких вариантов названий предпочтение отдается более краткому.
Например:
Рождество Христово следует внести как Рождество
3.23.5
. Наименования технических средств, марок стали, товарных знаков и т. п. приводятся в КС с конкретизацией названия.
Например:
ВАЗ-2101 ; Жигули ; автомобили; легковые автомобили
ЗИЛ ; холодильники ; холодильные установки
Boeing ; самолеты ; Боинги
PANASONIC-NV-SR-80 ; видеоплейеры ; видеоаудиотехника
ХГЗ-181 ; тракторы ; сельскохозяйственные тракторы
AWS-024 ; измерители ; измерительная техника
Павиком-1; измерительные комплексы; измерительная техника
Р6М5 ; марки стали
ABBYY ; товарные знаки; бренды
3.23.6
. Имена литературных героев, персонажей художественных и анимационных фильмов, спектаклей и т. п. приводятся в КС с соответствующим уточнением «литературные персонажи» или «персонажи».
Например:
Раскольников ; литературные персонажи
Евгений Онегин ; Владимир Ленский ; литературные персонажи
Бемби ; персонажи
3.23.7
. Нумерация версий программных продуктов приводится в словосочетании с наименованием программного продукта.
Например:
Excel 5 ; Windows 95
3.24
. Для художественных произведений приводятся жанр произведения во множественном числе и его тема.
Например:
романы ; поэмы ; фэнтези ; романы в стихах ; стихотворения
тема любви ; тема одиночества ; тема детства
3.25
. Если в литературоведческой статье рассматривается теория и история жанра, то наименование жанра приводится в КС в единственном числе.
Например:
роман ; жанры
рыцарский роман ; роман; жанры
лирическая поэма ; жанры
бурлеск ; жанры
3.26
. В КС по усмотрению библиографа возможно употребление формулировок рубрик и подрубрик из Рубрикатора. Данное положение применяется в случаях, когда в статье основная тема отражена в рубрике и подрубриках, а другие аспекты статьи нет необходимости приравнивать по значению к рубрикам и подрубрикам.
Например:
Пример 1.
Статья: Научно-исследовательская работа учащихся по проблемам экологии.
Статья посвящена вопросам организации внешкольной работы по вопросам
экологии.
650а Образование. Педагогика
650х Теория и методика воспитания
В КС будет приведен термин «экология», хотя он присутствует в Рубрикаторе в ка-
честве основной рубрики.
Пример 2.
Имеющаяся в Рубрикаторе, например, основная рубрика «Сельское и лесное
хозяйство» не позволяет в дальнейшем найти информацию только по сельскому или лесному хозяйству без отражения в КС словосочетаний «сельское хозяйство» и «лесное хозяйство» в зависимости от содержания статьи.
3.27. Если статья является официальным документом, то в КС вносятся словосочетание «Официальные материалы» и вид принятого нормативного документа (законы, постановления, распоряжения и т.п.).
Аналогично приводятся сведения, если официальный документ является объектом рассмотрения в статье.
3.28. Если статья является рецензией, рефератом или описывает конференцию, семинар, съезд и т. п., то в КС приводится соответствующий термин: рефераты, рецензии, конференции, семинары, съезды и т. п.
4. Примечания
4.1
. Географические наименования вносятся в подполе 650z «Географическая рубрика».
4.2
. Место хронологии - в подполе 650у «Хронологическая рубрика».
4.3
. Наименования фирм, заводов, гостиниц, компаний, общественных и политических организаций и т. п. приводятся в поле 610 «Об организациях» по правилам, применяемым в этом поле.
4.4
. Сведения о персоналиях отражаются поле 600.
4.5
. Заглавия рассматриваемых в статье произведений и различных документов находятся в поле 630 «О произведениях». Сюда вносятся названия журналов, сайтов, ГОСТов, ИСО, учебных курсов, дисциплин, мероприятий и т. п., когда эти документы являются объектом рассмотрения в статье.
4.6
. Если статья представляет собой текст документов или материалов, то заглавия этих документов или материалов отражаются в поле 505.
4.7
. В подполе «Ключевые слова» можно не оставлять пробел перед разделительным знаком точка с запятой, т. к. по этому знаку сведения автоматически разбиваются в разные подполя.
4. Приложение.
Перечень использованных терминов.
Индексирование
– выражение содержания документа и/или смысла информационного запроса на информационно-поисковом языке.
Свободное индексирование
– индексирование, технология которого не предусматривает замену ключевых слов текста в соответствии с рекомендациями специального словаря.
Координатное индексирование
– индексирование, предусматривающее многоаспектное выражение смыслового содержания документа или смыслового содержания информационного запроса множеством ключевых слов или дескрипторов.
Полнота индексирования
– степень отражения в поисковом образе аспектов содержания документа и (или) запроса.
Язык ключевых слов
– информационно-поисковый язык, предназначенный для индексирования документов и информационных запросов посредством ключевых слов.
Ключевое слово
– информативное слово, приведенное в стандартной лексикографической форме и используемое для координатного индексирования (входит в раздел «Элементы дескрипторных ИПЯ ГОСТа 7.74-96).
В традиционном понимании ключевыми словами
называются полнозначные слова, устойчивые сложные и сложносокращенные слова и терминологические словосочетания, несущие смысловую нагрузку в текстах документов (в ГОСТах такого определения нет).
Лексическая единица (ЛЕ)
– обозначение отдельного понятия, принятое в информационно-поисковом языке и неделимое в этой функции. Лексические единицы могут представлять собой принятые в естественном языке слова, устойчивые словосочетания, аббревиатуры, символы, даты, общепринятые сокращения, лексически значимые компоненты сложных слов.
Дескриптор
– лексическая единица, выраженная информативным словом (вербально) или кодом и являющаяся именем класса синонимичных или близких по смыслу ключевых слов.
Поисковый образ
–текст, состоящий из лексических единиц информационно-поискового языка, выражающий содержание документа или информационного запроса и предназначенный для реализации информационного поиска.
Поисковый образ документа
(ПОД) – поисковый образ, выражающий основное смысловое содержание документа.
Поисковый образ запроса
(ПОЗ) – поисковый образ, выражающий смысловое содержание информационного запроса.
Релятор
– символ или слово, используемое для различения значений многозначного термина.
Словосочетание
– сочетание двух или нескольких слов, объединенных грамматически или по смыслу.
Устойчивое словосочетание
– это словосочетание, при добавлении или изъятии слов из которого, меняется его смысл.
5. Список использованных материалов:
1. ГОСТ 7.74-96. Информационно-поисковые языки. Термины и определения.
2. ГОСТ 7.59-90 (ИСО 5693-85). Индексирование документов. Общие требования к систематизации и предметизации.
3. ГОСТ 7.66-92. Индексирование документов. Общие требования к координатному индексированию.
4. ГОСТ 7.25-2001. Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления.
5. Типовая технологическая инструкция по индексированию документов в узлах КСПБМ - № 5 ОКиО.
6. Никольцева Н. П. О возможности содержательного индексирования документов ключевыми словами / Н. П. Никольцева, О. А. Седышева // Предметный поиск в традиционных и нетрадиционных информационно-поисковых системах. – М., 1998. – Вып. 12. С. 60-73.