файл:
krab
1_0
9
.
doc
Курсовая работа
по дисциплине
“Семиотика информационных технологий”
для студентов групп ИУ5 – 91, 92, 93, 94.
(200
9 — 20
10 уч.год)
Вариант 1. — Анализ текста компьютерного журнала.
Цель курсовой работы:
Приобретение навыков исследования естественно-языкового описания предметной области.
Задачи курсовой работы:
– изучение материалов лекционных и практических занятий по дисциплине «Семиотика информационных технологий» (разделы лекционных курсов —
теория частот слов, формальные языки информационных технологий, структура и состав словарной компоненты баз лингвистических знаний, тезаурус, лингвистические процессоры и др.; практические занятия —
исследование частотных характеристик фрагмента естественно-языкового описания предметной области, исследование словаря определений, индексирование фрагмента текста, построение графа дефиниций и др.; специальное информационное программное обеспечение
— программные изделия LemmaLex, Interlex, FineStyle, текстовые файлы журналов по предметной области "Информатика и системы управления"; основная и дополнительная литература —
см. список программ дисциплин);
– приобретение навыков анализа и изучение методов и приемов исследования ЕЯ описания предметной области (ПО) в процессе выполнения заданий курсовой работы;
– приобретение знаний и навыков интегрированного использования программного обеспечения АСОИУ (текстовых процессоров, СУБД, электронных таблиц, специального программного обеспечения и других программных средств) для проведения анализа и исследования ЕЯ описания ПО;
– приобретение знаний и навыков по оформлению результатов анализа и исследования ПО при оформлении курсовой работы.
Задания курсовой работы.
1. Провести частотный анализ ЕЯ описания ПО.
2. Составить предметный (терминологический) и именной указатели.
3. Провести индексирование фрагментов ЕЯ описания ПО.
4. Провести анализ использования метафоры в ЕЯ описании ПО.
5. Составить грамматический словарь.
6. Составить конкорданс.
7. Составить словарь определений терминов.
8. Составить словарь метафор.
9. Составить информационно-поисковый терминологический тезаурус.
Порядок выполнения курсовой работы.
1. Получить у преподавателя методические материалы для выполнения курсовой работы (скопировать на дискету текстовые и программные файлы).
2. Последовательно выполнить задания 1–9 курсовой работы.
3. Оформить результаты курсовой работы.
4. Апробировать результаты курсовой работы у преподавателя.
Пояснения, рекомендации и требования к выполнению курсовой работы.
Задание на выполнение курсовой работы необходимо получить у преподавателя в течение первых двух недель семестра. После получения методических материалов курсовой работы рекомендуется внимательно их прочитать и изучить. Хорошее знание материалов в дальнейшем позволит качественно выполнять такие задания курсовой работы как: составление указателей, индексирование текста, составление словаря определений, составление тезауруса. Затем необходимо выбрать и согласовать с преподавателем информационный ресурс ПО (компьютерный журнал) такой как: "Мир ПК"; "Компьютер-Пресс"; "PC-Magazine"; "Byte (Россия)"; "Открытые системы"; "Микропроцессорные средства и системы"; "Электроника"; "Программирование"; "Программные продукты и системы"; "Теория и системы управления"; "Communication ACM". Hard&Soft, LAN и др. После согласования его следует также внимательно прочитать. Рекомендуется выполнять задачи курсовой работы в указанной последовательности.
Задание 1.
При проведении частотного анализа ЕЯ описания ПО необходимо выполнить следующие работы для фрагментов и всего текста:
– разбить текст на фрагменты (по статьям);
– построить частотные словники;
– построить графики ступенчатой функции распределения частот;
– вычислить основные частотные характеристики и представить их в таблицах;
– построить графики распределения частот слов.
Задание 2.
В предметный (терминологический) указатель
должны быть включены основные термины и понятия соответствующей ПО, выраженные словами, словосочетаниями (2-х и 3-х словными). Отдельно должны быть представлены аббревиатуры. Указатель должен содержать сведения об имени файла текстового фрагмента (статьи) и номере страницы в печатной версии журнала. Общее число понятий предметного указателя должно быть не менее 100. При формировании предметного указателя рекомендуется использовать в качестве дополнительного справочного материала переводные и толковые словари по соответствующей ПО (вычислительная техника, базы данных и др. существующие как в виде полиграфических изданий, так и в виде электронных версий, например, КОНТЕКСТ — фирма ИНФОРМАТИК, STYLUS LINGUA COLLECTION — фирма STYLUS и др. )
В именной указатель
ЕЯ описания ПО должны быть включены все имена собственные, встретившиеся в текстовых фрагментах (статьях), включая наименования фирм и информационно-программных изделий и их аббревиатуры. В указателе должны быть выделены разделы: персоналии, топонимы, организации, продукция и др. Указатель должен содержать сведения об имени файла текстового фрагмента (статьи) и номере страницы в печатной версии журнала.
Задание 3.
При индексировании текстовых фрагментов (статей) для каждого из них должны быть составлены поисковые образы, включающие 10–20 ключевых слов, словосочетаний, аббревиатур, имен. Данный индекс должен быть представлен в виде таблицы, содержащей следующие поля: имя файла фрагмента (статьи), заголовок, ключевые слова.
Задание 4.
Анализ использования метафоры в компьютерном журнале должен быть проведен раздельно для статей — научно-технических текстов (задача 1) и текстов рекламы аппаратных и программных средств вычислительной техники (задача 2). Результаты анализа должны быть сведены в таблицы, поддерживаемые системой FineStyle. Должны быть использованы в качестве метафорической картины мира модель Словаря метафор информационных технологий, предметной — рубрикатор справочника “Кто есть кто на компьютерном рынке России”, выпускаемом фирмой SK Communications International совместно с журналом PC Magazine / Russian Edition (см. список литературы). В отчетных материалах обнаруженные метафоры должны быть приведены в контексте предложения. Для каждой метафоры следует привести прямое и переносное значения (толкования), а также ассоциативные поля из ассоциативных словарей.
Задача 1.
Должны быть проанализированы научно-технические тексты (статьи журнала) с целью выявления в них примеров использования метафор.
Задача 2.
Должны быть проанализированы рекламные тексты с целью выявления в них примеров использования метафор.
Задание 5.
Грамматический словарь: а) должен включать слова, встретившиеся в текстовых фрагментах и относящиеся к следующим грамматическим классам: существительные, прилагательные, глаголы; б) может включать слова — наречия, числительные; в) возможно также составление полного грамматического словаря, включающего слова не только перечисленных грамматических классов, но и предлоги, междометия, союзы, частицы и местоимения. В грамматический словарь не должны включаться имена собственные, аббревиатуры, идентификаторы (слова, содержащие буквы и цифры). Грамматический словарь должен иметь следующую структуру словарной статьи:
<ЛЕММА> <МИ> {s} [S]
<СЛОВОФОРМА1> <МИ1> [i1
]
<СЛОВОФОРМА2> <МИ2> [i2
]
...
<СЛОВОФОРМАk> <МИk> [ik
]
Здесь: ЛЕММА — слово в основной форме; МИ — морфологическая информация о слове (грамматический класс, подкласс); МИj — подробная грамматическая информация); s — количество словоформ в тексте; S — общее количество словоформ в тексте; ij
— частота j-ой словоформы.
Общее количество слов в словаре не должно быть меньше 100.
Задание 6.
Конкорданс ЕЯ описания ПО должен быть составлен для понятий предметного указателя, составленного при решении третьей задачи курсовой работы.
При составлении конкорданса рекомендуется предварительно из списка понятий, вошедших в предметный указатель, выделить устойчивые словосочетания и составить “словарь словосочетаний”, имеющий следующую структуру словарной статьи:
<ЛЕММА>
(СЛОВОСОЧЕТАНИЕ1),
(СЛОВОСОЧЕТАНИЕ2),
...
(СЛОВОСОЧЕТАНИЕk).
Здесь: ЛЕММА — слово в основной форме из грамматического словаря, предметного указателя; СЛОВОСОЧЕТАНИЕ — двух–, трехсловное словосоче
Конкорданс ЕЯ описания ПО должен быть представлен в виде “словаря контекстов”, имеющего следующую структуру словарной статьи:
<ЛЕММА/ СЛОВОСОЧЕТАНИЕ> <КОНТЕКСТ> <АДРЕС>.
Здесь: КОНТЕКСТ — ближайшее “окружение” словоформы или словосочетания, размер которого может быть выбран произвольно, однако в большинстве случаев его следует ограничить предложением (количество контекстов для одной леммы должно быть от трех до пяти, а для словосочетания достаточно одного – двух);
АДРЕС — указание на источник контекста — фрагмент текста (статья).
Задание 7.
Перед составлением словаря определений необходимо разработать структуру словарной статьи и описать ее формально в виде графа, таблицы или на языке Бекуса-Наура.
Словарная статья словаря определений терминов ПО должна включать следующие сведения: заголовочное слово (понятие из предметного указателя), варианты определений (толкований), устойчивые словосочетания (из "словаря словосочетаний") и 2–3 эксцерпции (примеры контекстов из текстов ЕЯ описания ПО с указанием их источника из конкорданса).
Словарь определений должен быть загружен в базу данных. Структура должна быть согласована с преподавателем.
Задание 8.
Словарь метафор компьютерного журнала должен быть создан в среде FineStyle и должен содержать не менее 100 словарных статей.
Задание 9.
Информационно-поисковый терминологический тезаурус ЕЯ описания ПО должен содержать отношения двух типов: лингвистические (синонимии, антонимии, перевода, сокращения, аббревиации, синтагматические отношения и др.) и экстралингвистические (класс–подкласс, тип–подтип, часть–целое, род–вид, причина–следствие, временные отношения, пространственные отношения, отношения наследования, элемент–система и др.). В тезаурусе должны быть представлены не менее двух типов лингвистических отношений, причем, обязательно отношение синонимии. Из экстралингвистических отношений должны быть представлены не менее трех типов отношений. Выбор отношений и установление ограничений размерности тезауруса необходимо согласовать с преподавателем.
База данных информационно-поискового тезауруса должна представлять собой таблицу отношений между понятиями, состоящую из полей отношений для i-ого и j-ого понятий. Структура должна быть согласована с преподавателем.
Оформление курсовой работы.
Результаты и рабочие материалы выполнения курсовой работы должны быть представлены в печатной и электронной формах. Техническая документация результатов должна состоять из двух документов: (1) расчетно-пояснительной записки, (2) краткого описания курсовой работы с графической частью. Электронная форма результатов и рабочих материалов курсовой работы представляется на CD.
Расчетно-пояснительная записка
должна быть оформлена в соответствии с требованиями, предъявляемыми к оформлению отчетов по НИР. При этом должны выполняться требования соответствующих ГОСТ.
Объем расчетно-пояснительной записки оформленной курсовой работы должен составлять 80000 - 120000 знаков (2.0 - 3.0 а.л.), включая графическую часть (рисунки, графики, схемы, таблицы). Работа сдается в напечатанном виде и в виде файла форматов *.doc *.rtf на CD. Текстовая часть должна содержать ссылки на используемую литературу с указанием страниц издания. Список используемой литературы приводится в соответствии с требованиями ГОСТ. Текст оформленной курсовой работы не должен содержать орфографических ошибок, сносок, буквиц. Текст должен быть отформатирован с параметрами: отступы — нулевые, красная строка — 1 см, межстрочный интервал — одинарный, выравнивание — по ширине. Текст должен содержать переносы. Все страницы текста должны содержать верхний колонтитул с фамилией и шифром группы исполнителя работы, а также нумерацию страниц с размещением над колонтитулом по центру. Размер основного шрифта — 12.
В отчете рекомендуется иметь следующие разделы:
Введение. Девять разделов, заголовки которых должны соответствовать формулировкам заданий курсовой работы. Технология проведения исследования. Заключение. Литература.
В разделе "Введение"
перечисляются цели и задачи курсовой работы, дается краткое описание предметной области и ее естественно-языкового описания.
В девяти разделах, посвященных выполненным заданиям курсовой работы, приводятся основные результаты исследования естественно-языкового описания предметной области в виде таблиц, графиков, расчетов и примеров словарных статей.
В разделе "Технология проведения исследования"
приводится описание общей технологии проведения исследования, программного обеспечения, баз данных, "ручных" и автоматизированных процедур и операций.
В "Заключении"
приводятся выводы по результатам исследований, выполненных в курсовой работе.
В разделе "Литература"
указываются использованные источники.
Титульный лист курсовой работы должен содержать:
в верхней части листа
Московский государственный технический университет им. Н.Э. Баумана
кафедра "Системы обработки информации и управления"
в середине листа
АНАЛИЗ ТЕКСТА журнала
"НАЗВАНИЕ журнала"
(номер, год)
Расчетно-пояснительная записка
курсовой работы по дисциплине
"Семиотика информационных технологий"
студент группы ИУ5-GG
Фамилия Имя Отчество.
Шифр:GG_NN
Преподаватель: к.т.н.,доц. Ю.Н.Филиппович
в нижней части листа
Москва, 2009 г.
Краткое описание курсовой работы
должно состоять из двух частей: текстовой и графической.
Титульный лист краткого описания курсовой работы оформляется аналогично, за исключением того, что вместо названия “Расчетно-пояснительная записка” пишется “Краткое описание”.
Текстовая часть краткого описания представляет собой изложение содержания курсовой работы и основных результатов, полученных при ее выполнении. Объем текстовой части — 2 страницы. Изложение должно быть построено в стиле доклада и содержать ссылки на графическую часть.
Графическая часть краткого описания курсовой работы
представляет собой макеты плакатов, иллюстрирующих основные результаты курсовой работы. Объем графической части — 3 листа. Макеты плакатов должны быть выполнены на листах формата А4 или А3, “машинным” способом. Макеты должны представлять собой уменьшенную точную копию плакатов, выполненных на листах формата А0. Результаты курсовой работы должны быть равномерно распределены по плакатам. Информация, помещенная на плакаты, должна иллюстрировать наиболее существенные результаты исследования, математические методы их расчета и получения, технологический процесс проведения исследования, концептуальную модель ПО, информационные модели и структуры хранения данных.
Расчетно-пояснительная записка сдается в стандартных полиэтиленовых файлах, собранных в папку по разделам (заданиям).
Рабочие материалы
курсовой работы сдаются на CDRW. Все файлы должны быть собраны в папку с именем GG_NN_X (GG — номер группы 91, 92, 93, 94; NN — номер студента в списке группы; Х — номер версии). В папке должен быть файл Readme.txt, содержащий описание всех папок и файлов работы. Файл расчетно-пояснительной записки должен иметь имя, соответствующее шифру курсовой работы GG_NN.doc. Рабочие материалы должны быть сгруппированы по заданиям.
CDRW должен быть оформлен (вкладыш и «оборотка»). Вкладыш оформления должен содержать четыре полосы: 1) титульный лист, 2,3,4) краткое описание. «Оборотка» должна содержать сведения о составе материалов (папки и файлы). Оформление CDRW должно удовлетворять требованиям ГОСТ.
Не допускается использование архиваторов и автоматического запуска каких-либо файлов, размещенных на диске. Файлы не должны содержать вирусов.
Несоблюдение данных требований приводит к снижению оценки на один балл, но не ниже «удовлетворительно».
Апробация курсовой работы.
Для апробации курсовой работы у преподавателя необходимо сдать для анализа и оценки: техническую документацию курсовой работы (расчетно-пояснительную записку и краткое описание), рабочие материалы курсовой работы (исходные, промежуточные и результирующие файлы данных), выданный текстовый материал (книги, журналы и др.).
Оценка курсовой работы
осуществляется по следующим правилам: “удовлетворительно” — при условии полного и качественного выполнения пунктов 1–4;
“хорошо” — при условии полного и качественного выполнения пунктов 1–7; “отлично” — при условии полного и качественного выполнения всех пунктов задания.
В случае сдачи работы после срока ее оценка снижается на один балл, но не ниже «удовлетворительно».
Срок сдачи курсовой работы
16 неделя семестра.