МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ
СЕВАСТОПОЛЬСКИЙ НАЦИОНАЛЬНЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
Кафедра менеджмента и экономико-математические методы
КУРСОВАЯ РАБОТА
по дисциплине:
"Информационные системы в менеджменте"
на тему:
Разработка подсистемы оперативного анализа данных в информационной системе анализа динамики посетителей Веб-сайта crimusic. info
Выполнил: ст. гр. МО-24 Ниязиева Д.З.
Руководитель:
Результат защиты
Председатель комиссии
Севастополь 2008
Содержание
Введение
1. Теоретические аспекты разработки подсистемы анализа данных в информационной системе анализа динамки посетителей веб-сайта crimusic. info
1.1 Характеристика веб-сайта crimusic. info
1.2 СУБД MS Access в разработке базы данных crimusic. info
1.3 OLAP-технологии в подсистеме анализа объекта исследований
2. Разработка подсистем анализа веб - сайта с использованием microsoftaccess и olap - технологий
2.1 Разработка базы данных веб-сайта crimusic. info с использованием MSAccess
2.2 Построение OLAP-куба в MSExcel для анализа данных
2.3 Анализ данных с использованием OLAP-технологии
Заключение
Библиографический список
Введение
Настоящее содержание данной курсовой работы посвящено разработке подсистемы оперативного анализа данных в информационной системе анализа динамики посетителей веб-сайта crimusic. info.
На сегодняшний день Интернет дает его пользователям все больше возможностей. И веб-сайт crimusic. info не является исключением. В данной курсовой работе отражается структурирование базы данных по статистической информации динамики посещения портала, а также сформулирован OLAP-куб.
Целью работы является разработка базы данных динамики посещения портала, обеспечивающей доступ к обновленным и точным сведениям, а также создание OLAP-куба, который позволяет управлять измерениями, применяющимися для моделирования основных характеристик объекта динамики посещения веб-сайта crimusic. info.
Задачи курсовой работы:
разработка базы данных в MicrosoftAccess в информационной системе анализа динамики посетителей веб-сайта crimusic. info с помощью современных информационных технологий оперативной аналитической обработки данных;
построение OLAP- куба в MSExcel для анализа данных;
анализ данных с использованием OLAP- технологии, то есть сформулировать ряд запросов в построенном OLAP-кубе.
Предметом данной работы являются информационные технологии оперативной обработки больших массивов данных (OLAP-технологии), то есть данных посещения веб-сайта crimusic. info.
Объектом курсовой работы является веб-сайт crimusic. info.
1. Теоретические аспекты разработки подсистемы анализа данных в информационной системе анализа динам
ики посетителей веб-сайта crimusic. info
1.1 Характеристика веб-сайта
crimusic. info
Объектом исследования курсовой работы является крымский клубный музыкальный портал.
Главная цель и задача портала - доносить до прогрессивных клубных людей в Крыму информацию о грядущих мероприятиях. Создатели сайта занимаются анонсированием клубных вечеринок, опен-эйров, специфических концертов в Крыму. Работа с Крымским посольством республики Казантип, международными фестивалями Skygravity и Джазз Коктебель.
Пользователи портала могут получить информацию о проведении клубных мероприятий на ближайшие выходные. Есть возможность посмотреть фотоотчёты с прошедших вечеринок, поделиться мнением на форуме и/или в чате, узнать мнение других, а также ознакомиться с описаниями и фотографиями крымских клубов, кроме того, можно также ознакомиться биографии крымских ди-джеев, увидеть их фотографии, узнать о тенденциях в мировой клубной культуре и ярких вечеринках не только в Крыму, но и в Украине и в мире.
Портал является первоисточником клубных новостей, анонсов и фотографий. Здесь содержатся описания 20 крымских клубов, биографии 42 крымских ди-джеев, информация о 6 промо-группах - творческих объединениях ди-джеев.
Здесь было проведено 9 статистических опросов. На сайте можно найти множество статей на различные клубные/околоклубные темы.
Сайт функционирует с 2004 года. За это время портал приобрел постоянную устойчивую аудиторию.
За время деятельности сайта налажены контакты практически со всеми форматными ночными клубами Крыма, такими как NightClub 86 (Симферополь), Zeppelin (Севастополь), Два Капитана (Симферополь), Звёздный Ильяс (Севастополь), Zeon (Симферополь), Morpheus (Алушта), Весёлый Роджер (Алушта), Уругвайский лётчик (Севастополь), Malibu (Евпатория), Азия (Севастополь), Апельсин (Ялта), Lexx (Евпатория), Dr. Nagual (Симферополь), Club 117 (Феодосия), Beach-Club 117 (Феодосия), 100 Пудофф (Симферополь), Ультра (Севастополь), 911 (Севастополь), Волна (Севастополь), Moon Beach - аквапарк Зурбаган (Севастополь), Коктейль холл В ОБЛАКАХ - Япи (Севастополь), бизнес клуб Премьер (Севастополь), клуб-пляж Куба (Балаклава), Biscuit (Керчь), летний развлекательный комплекс ТРОЯ (TROY), LA LA LAND (Алушта), Глобус (Симферополь). Fixius (Симферополь), Cobra (Симферополь), Кактус (Ялта).
Портал оказывает информационную поддержку вечеринкам, проводящимся в вышеперечисленных клубах, является официальным информационным партнёром некоторых из них. Сайт осуществляет официальную Интернет-поддержку вечеринок Крымского посольства республики Казантип. Информационные партнёры международных фестивалей Skygravity, Звездоловы, ORBITA, LiquidBeach, SpaceofJoy, Spirit Ritual Dance, Джазз Коктебель, международного фестиваля ТЕХНОСФЕРА, Джазз Коктебель, OPENSPACE.
Также сотрудничает со следующими промо-группами: Крымская Ассоциация диск-жокеев, SoulTempoProject, TechDanceDj'sLeague, IN-STATION, LSDPromo, MixFactoryGroup, ЭЛЕКТРОSHITОВАЯ Promo Group, High Level; и с почти всеми клубными ди-джеями Крыма, Журналами Про Симферополь, Chillout, Туристическим агентством Турсалон, Аудио-магазином Allegro Music, Арендой звука и света - Медалист, Dj магазином ProDJ.
Данный ресурс по своему уникален - подобных по информационному направлению и содержательности в Крыму не существует.
Здесь содержится 8244 фотографий в 122 альбомах и 42 категориях.
Ежесуточная учетная посещаемость - 300-500 посетителей с уникальными адресами, 765 постоянных зарегистрированных пользователей.
Изначально проект развивался для целевой аудитории, для публики, которая ходит в ночные клубы. Благодаря использованию чистых методов рекламы, за три года деятельности портал пользуется известностью и имеет постоянную целевую аудиторию.
Был проведен опрос среди пользователей портала, результаты которого представлены на рисунке 1.1
Рисунок 1.1 - Возраст посетителей веб-сайта crimusic. Info
Из рисунка видно, что почти 90% - это посетители в возрасте 18-30 лет; 4% посетителей - 30 - 50 лет, остальных 6%.
Постоянными посетителями портала являются ди-джеи, промоутеры, владельцы клубов, композиторы и музыканты, дизайнеры, фотографы и другие люди, которые являются поклонниками клубной электронной музыки.
Согласно статистике сайт посещают люди из Украины, России, Белоруссии, Германии, Канады, США (рисунок 1.2).
Рисунок 1.2 - Аудитория посетителей
Пользователи регулярно попадают на сайт, пользуясь поисковыми системами и находя по своим запросам crimusic. info на первых местах в списке ответов.
Средняя ежесуточная посещаемость согласно независимым системам учёта и статистики:
Уникальные IP-адреса составляют около 800. Уникальных пользователей ежесуточно на портале бывает от 1500 до 2000. Переходов по страницам сайта осуществляется от 5000 до 7000 раз.
Таким образом, данный портал можно сделать объектом исследования и целесообразно разработать подсистему оперативного анализа данных в информационной системе анализа динамики посетителей веб-сайта.
1.2 СУБД MS
Access в разработке базы данных crimusic. info
MicrosoftAccess - реляционная СУБД корпорации Microsoft, которая обладает интуитивно понятным интерфейсом. Имеет широкий спектр функций, включая связанные запросы, сортировку по разным полям, связь с внешними таблицами и базами данных. Благодаря встроенному языку VBA, в самом Access можно писать приложения, работающие с базами данных.
Основные компоненты MS Access:
просмотр таблиц;
построитель экранных форм;
построитель SQL-запросов;
построитель отчётов, выводимых на печать.
Все они могут вызывать скрипты на языке VBA. Таким образом, MS Access позволяет разработать СУБД практически "с нуля" или написать оболочку для любой внешней СУБД.
База данных с правильной структурой обеспечивает доступ к обновленным и точным сведениям. Для выполнения поставленных задач при работе с базой данных важна правильная структура. Это позволит создать базу данных в соответствии с требованиями и с возможностью быстро вносить в нее изменения.
В Microsoft Office Access данные организуются в таблицы - совокупности строк и столбцов. Простая база данных может состоять всего из одной таблицы. Большинство баз данных включают несколько таблиц.
Каждая строка называется также записью, а каждый столбец, или тип элемента, называется также полем. Записи позволяют комбинировать данные. Поля представляют собой отдельные элементы данных - типы элементов для каждой строки.
Цель создания базы данных для данной курсовой работы - облегчение поиска информации. База данных изучаемого объекта содержит сведения о посещении посетителями.
Создадим таблицы: "Посетители", "Посещения сайта", "Разделы", "Посещения разделов" со следующими полями (рисунок 1.3).
Посетители |
Имя Код пользователя Дата регистрации |
Разделы |
Номер раздела Имя раздела |
Посещение сайта |
Код пользователя Номер Дата и время входа Дата и время выхода IP - адрес |
Посещение разделов |
Номер Номер посещения Номер раздела Время посещения |
Рисунок 1.3 - Таблицы БД сайта crimusic. info, спроектированные в MSAccess
В таблице "Посетители" находятся следующие поля: "Имя", "Код пользователя", "Дата регистрации". Их тип данных следующий: "Имя" - текстовый, "Код пользователя" - счетчик, "Дата регистрации" - дата/время. В данной таблице ключевым полем будет являться "Код пользователя".
Таблица "Разделы". Здесь ключевым полем будет являться "Номер раздела". Поля и тип их данных: "Номер раздела" - счетчик, "Имя раздела" - текстовый.
Следующая таблица имеет название "Посещения сайта". Ключевое поле - "Номер". Тип данных полей таблицы: "Код пользователя" - числовой, "Номер" - счетчик, "Дата и время входа" - дата/время, "Дата и время выхода" - дата/время, "IP- адрес" - текстовый.
Последняя таблица называется "Посещения раздела". Ключевое поле - "Номер". В ней 4 поля, которые имеют разные типы полей: "Номер" - счетчик, "Номер посещения" - числовой, "Номер раздела" - числовой и "Время посещения" - дата/время.
Установим связи между таблицами по ключевым полям (рисунок 1.4).
Посещение сайта |
Код пользователя Номер посещения Дата и время входа Дата и время выхода IP– адрес Длительность |
Посетители |
Имя Код пользователя Дата регистрации |
Посещение разделов |
Номер посещения Номер Номер раздела Время посещения |
Разделы |
Номер раздела Имя раздела |
|
|
Рисунок 1.4 - Таблицы и межтабличные связи БД сайта crimusic. info, спроектированные в MSAccess
Таблица "Посетители" связана с таблицей "Посещения сайта" ключевым полем "Код пользователя" (связь между таблицами один ко многим).
Таблица "Посещения сайта" связана с таблицей "Посещения разделов" по полю "Номер посещения" (связь один ко многим).
Таблица "Разделы" связана с таблицей "Посещения разделов" отношением один ко многим.
1.3
OLAP-технологии в подсистеме анализа объекта исследований
Термин OLAP, или оперативная аналитическая обработка, был введен в 1993 г. Эдгаром Коддом (Edgar Codd), автором реляционной модели. Первоначально OLAP использовался как профессиональное словечко, обозначающ
Основная функция OLAP - управление измерениями, которые применяются для моделирования основных характеристик объекта исследований.
Управлять этими измерениями несложно, во-первых, потому что манипулирование выполняется с помощью графического интерфейса. Во-вторых, внесенные изменения переносятся на все задействованные данные, хранящиеся в базе данных OLAP.
С помощью OLAP-технологий можно легко создавать и рассматривать "альтернативные отношения". При использовании же электронных таблиц одновременный просмотр всех измерений невозможен. В этом случае, данные, скорее всего, поступали бы в виде иерархии связанных электронных таблиц, причем каждая таблица более высокого уровня консолидировала и суммировала бы информацию таблиц более низкого уровня. Поскольку такие электронные таблицы оказываются несвязанными и не обеспечивают прозрачность всей модели, чрезвычайно сложно модифицировать модель в приемлемые временные сроки. Возможность визуального моделирований иерархий и управления ими, а также отображения различных представлений отношений между элементами измерений является неоспоримым преимуществом OLAP. В данной курсовой работе будет спроектирован OLAP- куб по данным посещения сайта: таблицы "Посетители", "Посещения сайта", "Разделы", "Посещения разделов".
Он схематично представлен на рисунке 2.1
Рисунок 2.1 - OLAP– куб
Оси построенного OLAP- куба имеют названия: "имя пользователя", "Дата и время входа"
В результате пересечения размерностей данного OLAP-куба образовалась мера, то есть узловая точка. Этот агрегат называется "Длительность посещения".
Данный OLAP-куб был построен по следующим этапам:
Работа по построению OLAP куба начинается с построения сводной таблицы. в MicrosoftExcel через путь Данные - Сводная таблица.
Открывается Мастер сводных диаграмм и таблиц. В ней предложено, по каким данным можно создать таблицу. Выбираем вариант: по внешним источникам данных.
Чтобы извлечь данные из внешнего источника с помощью MicrosoftQuery, нажимаем кнопку "Получить данные". В появившемся окне Выбор источника данных выбираем Базы данных в MSAccess.
Необходимо выбрать созданную нами базу данных.
Появляется окно: Создание запроса: выбор столбцов. В нем имеющиеся созданными нами таблицы переносим в столбцы запроса.
Следующие окна по созданию запроса оставляем без изменений (отбор данных, порядок сортировки).
Когда мы доходим до окна Создание запроса: заключительный шаг следующим нашим действием будет - Вернуть данные в MSExcel.
Таким образом, мы получили данные. Далее в Мастере сводных таблиц и диаграмм выбираем, куда поместить таблицу.
В результате из списка полей свободных таблиц перетаскиваем элементы в сводную таблицу. Соответственно в поля строк - "Имя" и "Дата и время входа", а в элементы данных - "Длительность". Также необходимо выбрать окне Вычисление поля сводной таблицы операцию: Сумма для агрегата "Длительность". Далее следует изменить формат ячеек данной меры на "Время".
Таким образом, был сформирован OLAP-куб.
2. Разработка подсистем анализа веб - сайта с использованием
microsoftaccess и olap- технологий
2.1 Разработка базы данных веб-сайта
crimusic. info с использованием MSAccess
Основной целью создания базы данных в данной курсовой работе является облегчение поиска информации. База данных изучаемого объекта, то есть веб-сайта crimusic. info содержит сведения о посещении пользователями главной страницы и отдельных разделов. Составление таблиц в соответствии с этапом 1.2 - СУБД MicrosoftAccess в разработке базы данных объекта исследований. Для начала необходимо составить таблицы, которые должна содержать данная база данных. В этой работе их четыре. Итак, таблица "Посетители" изображена на рисунке 2.1
Рисунок 2.1 - Таблица "Посетители"
В таблице "Посетители" находятся следующие поля: "Имя", "Код пользователя", "Дата регистрации". Их тип данных следующий: "Имя" - текстовый, "Код пользователя" - счетчик, "Дата регистрации" - дата/время. В данной таблице ключевым полем будет являться "Код пользователя".
Таблица "Разделы". Здесь ключевым полем будет являться "Номер раздела". Поля и тип их данных: "Номер раздела" - счетчик, "Имя раздела" - текстовый. (Рисунок 2.2)
Рисунок 2.2 - Таблица "Разделы"
Следующая таблица имеет название "Посещения сайта" и изображена на рисунке 2.3 Ключевое поле - "Номер". Тип данных полей таблицы: "Код пользователя" - числовой, "Номер" - счетчик, "Дата и время входа" - дата/время, "Дата и время выхода" - дата/время, "IP- адрес" - текстовый.
Рисунок 2.3 - Таблица "Посещения сайта"
Таблица "Посещения раздела". Ключевое поле - "Номер". В ней 4 поля, которые имеют разные типы полей: "Номер" - счетчик, "Номер посещения" - числовой, "Номер раздела" - числовой и "Время посещения" - дата/время.
Рисунок 2.4 - Таблица "Посещения разделов"
Определим связи между таблицами.
Таблица "Посетители" связана с таблицей "Посещения сайта" следующим ключевым полем - "Код пользователя". Связь между таблицами один ко многим и она изображена на рисунке 2.5
Рисунок 2.5 - Связь между таблицами "Посетители" и "Посещения сайта"
Таблица "Посещения сайта" связана с таблицей "Посещения разделов" по полю "Номер посещения". Связаны они как один ко многим. (Рисунок 2.6)
Рисунок 2.6 - Связь между таблицами "Посещения сайта" и "Посещения разделов"
Таблица "Разделы" связана с таблицей "Посещения разделов" отношением один ко многим по полю "Номер раздела". Такая связь изображена на рисунке 2.7
Рисунок 2.7 - Связь между таблицами "Посещения разделов" и "Разделы"
2.2 Построение
OLAP-куба в MSExcel для анализа данных
Для того чтобы построить OLAP- куб, необходимо освоить его основную задачу: получение любых многомерных таблиц за короткое время. Строится он поэтапно.
Открываем новый лист в MSExcel и создаем в нем сводную таблицу через путь: Данные - Сводная таблица.
В открывшемся окне "Мастер сводных таблиц и диаграмм" выбираем данные для создания таблицы, находящиеся во внешнем источнике данных.
Чтобы извлечь данные из внешнего источника с помощью MicrosoftQuery, нажимаем кнопку "Получить данные" в открывшемся окне.
В окне "Выбор источника данных" выбираем "База данных MSAccess"
Далее следует выбрать базу данных, созданную ранее в MicrosoftAccess.
В вновь появившемся окне "Создание запроса: выбор столбцов" переносим из имеющихся таблиц и столбцов таблицы "Посетители", "Посещения разделов", "Посещения сайта", "Разделы" в столбцы запроса.
В окнах "Создание запроса: отбор данных" и "Создание запроса: порядок сортировки" ничего не изменяем.
В появившемся окне "Создание запроса: заключительный" следующим действием будет "Вернуть данные в MicrosoftExcel".
Таким образом, мы получили данные для составления сводной таблицы.
В появившемся окне выбираем местоположение таблицы.
Необходимо заполнить эту таблицу следующим образом: из списка полей сводной таблицы перетаскиваем поле "Имя" в поле столбцов и "Дата и время входа" в поле строк. Это будут оси нашего OLAP-куба.
Далее в элементы данных перетаскиваем поле "Длительность", которое будет являться мерой.
В результате, изменив формат ячеек агрегата, мы получаем OLAP-куб, отражающий длительность посещения пользователя со времени его входа на веб-сайт:
2.3 Анализ данных с использованием OLAP-технологии
В данной курсовой работе были сформирован ряд запросов с использованием OLAP-технологий в MicrosoftExcel. В соответствии с построенным OLAP-кубом в пункте 2.2 данной работы создаем запросы.
1. Запрос по конкретному посетителю. В результате такого запроса можно узнать, когда и как долго был конкретный посетитель на веб-сайте crimusic. info. Кроме того, можно узнать общий итог его посещения за определенный период времени.
Запрос изображен на рисунке 2.8
Рисунок 2.8 - Запрос по конкретному посетителю
Другими словами, пользователь "baster" посетил веб-сайт crimusic. info 7 раз и общая длительность посещения составила 6 часов 14 минут и 31 секунды.
2. Запрос по конкретной дате. По итогам этого запроса видно, кто посещал сайт и какова длительность его посещения на определенную дату. (Рисунок 2.9)
Рисунок 2.9 - Запрос по конкретной дате
Таким образом, делаем вывод, что 1 января 2007 года в 11 вечера и 23 минуты заходил только один пользователь - "closer", который находился там 1 час 25 минут и 53 секунды.
3. Запрос по средней продолжительности пользователей на сайте. Запрос создается через вычисление поля свободной таблицы. (Рисунок 2.10)
Рисунок 2.10 - Запрос на среднюю продолжительность
В результате формирования запроса видно, какова средняя продолжительность каждого пользователя и средняя продолжительность посещения в отдельные дни пользователями.
4. Запрос по минимальной длительности конкретным пользователем. В результате такого запроса, который изображен на рисунке 2.11 можно узнать, сколько раз и когда пользователь посещал сайт, а по итогам вывести его минимальную длительность посещения портала.
Рисунок 2.11 - Запрос на минимальную длительность посещения конкретным пользователем
Таким образом, делаем вывод, что минимальная длительность посещения пользователя "closer" 1 час 25 минут и 53 секунды.
5. Запрос на дату минимального посещения пользователем. Из этого запроса мы можем узнать, какой именно пользователь имеет минимальную продолжительность на определенную дату. (Рисунок 2.12)
Рисунок 2.12 - Запрос на определение пользователя, с минимальным посещением по конкретной дате
По итогам этого запроса находим, что на 14 января 2007 года наименьшую продолжительность посещения веб-сайта crimusic. info имеет пользователь "long".
Заключение
На основе проведенных научных исследований были сделаны следующие выводы:
была разработана база данных в MicrosoftAccess в информационной системе анализа динамики посетителей веб-сайта crimusic. info;
был проведен анализ данных с использованием OLAP- технологии;
Библиографический список
1. Барсегян А.А. Методы и модели анализа данных: OLAP и DataMining / А.А. Барсегян, М.С. Куприянов, В.В. Степаненко, И.И. Холод. - СПб.: БХВ-Петербург, 2004. - 336 с.
2. Бергер А. Microsoft SQL Server 2005 Analysis Services. OLAP и многомерный анализ данных / А. Бергер. - СПб: БХВ-Петербург, 2007. - 928 с.
3. Киселев М. Средства добычи знаний в бизнесе и финансах / М. Киселев, Е. Соломатин // Открытые системы. - 1997. - № 4. - С.41-44.
4. Коннолли Т. Базы данных: проектирование, реализация, сопровождение. Теория и практика / Т. Коннолли, К. Бегг. - М.: Изд-во "Вильямс", 2003. - 1436 с.
5. Коровкин С.Д. Решение проблемы комплексного оперативного анализа информации хранилищ данных / С.Д. Коровкин, И.А. Левенец, И.Д. Ратманова, В.А. Старых, Л.В. Щавелёв // СУБД. - 1997. - № 5-6. - С.47 - 51.
6. Кречетов Н. Продукты для интеллектуального анализа данных / Н. Кречетов // Рынок программных средств. - 1997. - № 14-15. - С.32-39.
7. Пржиялковский В.В. Сложный анализ данных большого объема: новые перспективы компьютеризации / В.В. Пржиялковский // СУБД. - 1996. - № 4. - С.71 - 83.
8. Раден Н. Данные, данные и только данные / Н. Раден // ComputerWeek-Москва. - 1996. - № 8. - С.28.
9. Рудикова Л.В. MicrosoftOfficeAccess 2007/Л.В. Рудикова, И.А. Харитонова. - М: BHV, 2008. - 1280 с.
10. Сахаров А.А. Концепция построения и реализации информационных систем, ориентированных на анализ данных / А.А. Сахаров // СУБД. - 1996. - № 4. - С.55 - 70.
11. Сахаров А.А. Принципы проектирования и использования многомерных баз данных (на примере Oracle Express Server) / А.А. Сахаров // СУБД. - 1996. - № 3. - С.44 - 59.
12. Туо Дж. Инструменты для анализа информации на настольных ПК / Дж. Туо // ComputerWeek-Москва. - 1996. - № 38. - С 34-46.
13. Туо Дж. Каждому пользователю - свое представление данных / Дж. Туо // ComputerWeek-Москва. - 1996. - № 38. - С.32-33.
14. Федоров А. Введение в OLAP-технологии Microsoft / А. Федоров, Н. Елманова. - М.: Диалог-МИФИ, 2002. - 268 с.
15. http://www.olapreport.com
16. http://www.olap.ru
17. http://www.crimusic. info