РефератыИнформатикаТеТехнологии OLAP, понятие ее реализации и структуры

Технологии OLAP, понятие ее реализации и структуры

ВВЕДЕНИЕ. 4


1. OLAP-СИСТЕМЫ.. 6


1.1. Многомерная модель данных
. 6


1.2 Определение
OLAP
-систем
. 9


2. КОНЦЕПТУАЛЬНОЕ МНОГОМЕРНОЕ ПРЕДСТАВЛЕНИЕ. 11


2.1. Двенадцать правил Кодда
. 11


2.2. Дополнительные правила Кодда
. 13


2.3. Тест FASMI
15


3. АРХИТЕКТУРА OLAP-СИСТЕМ.. 18


ЗАКЛЮЧЕНИЕ. 21


ГЛОССАРИЙ.. 24


БИБЛИОГРАФИЧЕСКИЙ СПИСОК.. 26


СПИСОК СОКРАЩЕНИЙ.. 28


ПРИЛОЖЕНИЕ 1. 29


ПРИЛОЖЕНИЕ 2. 30


ПРИЛОЖЕНИЕ 3. 31


ВВЕДЕНИЕ


Целью курсовой работы является изучение технологии OLAP, понятие ее реализации и структуры.


В современном мире компьютерные сети и вычислительные системы позволяют анализировать и обрабатывать большие массивы данных.


Большой объем информации сильно усложняет поиск решений, но дает возможность получить намного точнее расчеты и анализ. Для решения такой проблемы существует целый класс информационных систем, выполняющих анализ. Такие системы называют системами поддержки принятия решений (СППР) (DSS, Decision Support System).


Для выполнения анализа СППР должна накапливать информацию, обладая средствами ее ввода и хранения. Всего можно выделить три основные задачи, решаемые в СППР:


· ввод данных;


· хранение данных;


· анализ данных.


Ввод данных в СППР осуществляется автоматически от датчиков, характеризующих состояние среды или процесса, или человеком-оператором.


Если ввод данных осуществляется автоматически от датчиков, то данные накапливаются по сигналу готовности, возникающему при появлении информации или путем циклического опроса. Если же ввод осуществляется человеком, то они должны предоставлять пользователям удобные средства для ввода данных, проверяющих их на правильность ввода, а так же выполнять необходимые вычисления.


При вводе данных одновременно несколькими операторами, необходимо решать проблемы модификации и параллельного доступа одних и тех же данных.


СППР предоставляет аналитику данные в виде отчетов, таблиц, графиков для изучения и анализа, именно поэтому такие системы обеспечивают выполнение функции поддержки принятия решений.


В подсистемах ввода данных, называемых OLTP (On-linetransactionprocessing), реализуется операционная обработка данных. Для их реализации используют обычные системы управления БД (СУБД).


Подсистема анализа может быть построена на основе:


· подсистемы информационно-поискового анализа на базе реляционных СУБД и статических запросов с использованием языка SQL;


· подсистемы оперативного анализа. Для реализации таких подсистем применяется технология оперативной аналитической обработки данных OLAP, использующая концепцию многомерного представления данных;


· подсистемы интеллектуального анализа. Данная подсистема реализует методы и алгоритмы DataMining[1]
.


С точки зрения пользователя, OLAP-системы представляют средства гибкого просмотра информации в различных срезах, автоматического получения агрегированных данных, выполнения аналитических операций свёртки, детализации, сравнения во времени. Благодаря всему этому OLAP-системы являются решением с большими преимуществами в области подготовки данных для всех видов бизнес-отчетности, предполагающих представление данных в различных разрезах и разных уровнях иерархии, таких как, отчетов по продажам, различных форм бюджетов и других. OLAP-системы имеет большие плюсы подобного представления и в других формах анализа данных, в том числе для прогнозирования.


1.
OLAP-СИСТЕМЫ


1.1. Многомерная модель данных

Подсистемами анализа решают проблемы связанные с организацией эффективного анализа данных и предоставления к ним доступа. В процессе принятия решений пользователь составляет некоторые гипотезы чтобы они стали законченными решениями необходимо провести их. Проверка гипотез осуществляется на основании информации об анализируемой предметной области. Обычно наиболее удобный способ представления такой информации для человека является зависимость между некоторыми параметрами.


В процессе анализа данных, поиска решений часто появляется необходимость в построении зависимостей между различными параметрами, но так как число таких параметров может изменяться в широких пределах, а традиционные средства анализа, работающие с данными, представленных в виде таблиц реляционной БД, не могут полностью соответствовать этим требованиям. В 1993 г. Э. Ф. Кодд — основоположник реляционной модели БД — рассмотрел ее недостатки в первую очередь он указал на невозможность "объединять, просматривать и анализировать данные с точки зрения множественности измерений, т. е. самым понятным для аналитиков способом". Измерение — это последовательность значений одного из анализируемых параметров. Множественность измерений предполагает представление данных в виде многомерной модели. По измерениям в многомерной модели откладывают параметры, относящиеся к анализируемой предметной области.


По Кодду, многомерное концептуальное представление есть множественная перспектива, состоящая из нескольких независимых измерений, вдоль которых могут быть проанализированы определенные совокупности данных.


Одновременный анализ по нескольким измерениям определяется как многомерный анализ[2]
, где измерение можно представлять не только в виде иерархической структуры, но и в некоторых случаях как несколько видов иерархического представления.


На пересечениях осей измерений располагаются данные, количественно характеризующие анализируемые факты, — меры, такие как издержки, остатки на складе или же объемы продаж, выраженные в единицах продукции или в денежном выражении и т. п.


Многомерную модель данных можно представить как гиперкуб (приложение 1, a) (конечно, название не очень удачно, поскольку под кубом обычно понимают фигуру с равными ребрами, что в данном случае далеко не так). Я ячейками гиперкуба, представляющего модель данных являются меры, а ребрами – измерения. Благодаря такой модели данных пользователи могут получать подмножества данных, формулировать сложные запросы, генерировать отчеты.


Над гиперкубом могут выполняться три типа операций:


· Срез (приложение 1, b) — формируется подмножество многомерного массива данных, которое должно соответствовать единственному значению нескольких или даже одного элементов измерений, не входящих в это подмножество. Если рассматривать термин «Срез» со стороны конечного пользователя, то чаще всего его роль выполняет двумерная проекция куба.


· Вращение (приложение 2) — изменение расположения измерений, представленных на отображаемой странице или же в отчете. Кроме того, вращением куба данных является перемещение внетабличных измерений на место измерений, представленных на отображаемой странице, и наоборот (при этом внетабличное измерение становится новым измере­нием строки или измерением столбца). В качестве примера для первого случая может служить такой отчет, для которого элементы измерения "Время" располагаются поперек экрана (являются заголовками столбцов таблицы), а элементы измерения "Продукция" — вдоль экрана (являются заголовками строк таблицы). После применения операции вращения отчет будет иметь следующий вид: элементы измерения "Продукция" будут расположены по горизонтали, а элементы измерения "Время" — по вертикали. Примером второго случая может служить преобразование отчета с измерениями "Меры" и "Продукция", расположенными по вертикали, и измерением "Время", расположенным по горизонтали, в отчет, у которого измерение "Меры" располагается по вертикали, а измерения "Время" и "Продукция" — по горизонтали. При этом элементы измерения "Время" располагаются над элементами измерения "Продукция". Для третьего слу­чая применения операции вращения можно привести пример преобразова­ния отчета с расположенным по горизонтали измерением "Время" и изме­рением "Продукция", расположенным по вертикали, в отчет, у которого по горизонтали представлено измерение "Время", а по вертикали — измере­ние "География" (синоним: Pivot).


· Консолидация и детализация (приложение 3) — операции, определяющие переход вверх по направлению от детального (down) представления данных к агрегированному (up) и наоборот, соответственно. Направление детализации (обобщения) может быть задано как по ие­рархии отдельных измерений, так и согласно прочим отношениям, уста­новленным в рамках измерений или между измерениями. Например, если при анализе данных об объемах продаж в Северной Америке выполнить операцию DrillDown для измерения "Регион", то на экране будут отобра­жены такие его элементы, как "Канада", "Восточные Штаты Америки" и "Западные Штаты Америки". В результате дальнейшей детализации эле­мента "Канада" будут отображены элементы "Торонто", "Ванкувер", "Монреаль" и т. д[3]
.


1.2 Определение
OLAP
-систем

Технология комплексного многомерного анализа данных получила название OLAP. OLAP — это ключевой компонент организации ХД.


OLAP-функциональность может быть реализована различными способами, как простейшими, такими как анализ данных в офисных приложениях, так и более сложными - распределенными аналитическими системами, основанными на серверных продуктах.


OLAP (On-LineAnalyticalProcessing) – технология оперативной аналитической обработки данных использующая средства и методы для сбора, хранения и анализа многомерных данных и целях поддержки процессов принятия решений.


Основное назначение OLAP-систем — поддержка аналитической деятельности, произвольных запросов пользователей-аналитиков. Целью OLAP-анализа является проверка возникающих гипотез.


В 1993 году Эдгаром Коддом опубликовал статью «OLAP для пользователей-аналитиков: каким он должен быть». В работе Кодд изложил основные концепции оперативной аналитической обработки и определил двенадцать правил, которым должны удовлетворять продукты, позволяющие выполнять оперативную аналитическую обработку:


· Многомерность;


· Прозрачность;


· Доступность;


· Постоянная производительность при разработке отчетов;


· Клиент-серверная архитектура;


· Равноправие измерений;


· Динамическое управление разреженными матрицами;


· Поддержка многопользовательского режима;


· Неограниченные перекрестные операции;


· Интуитивная манипуляция данными;


· Гибкие возможности получения отчетов;


· Неограниченная размерность и число уровней агрегации.


2. КОНЦЕПТУАЛЬНОЕ МНОГОМЕРНОЕ ПРЕДСТАВЛЕНИЕ


2.1. Двенадцать правил Кодда

1. Многомерность— OLAP-система на концептуальном уровне должна представлять данные в виде многомерной модели, так как это сильно упрощает процессы восприятия и анализа информации.


2. Прозрачность— OLAP-система должна скрывать от пользователя реальную реализацию многомерной модели, способ организации, источники, средства обработки и хранения.


3. Доступность — OLAP-система должна предоставлять пользователю единую, согласованную и целостную модель данных, обеспечивая доступ к данным независимо от места и способа их хранения.


4. Постоянная производительность при разработке отчетов — производительность OLAP-систем не должна значительно уменьшаться при увеличении количества измерений, по которым выполняется анализ.


5. Клиент-серверная архитектура— OLAP-система должна быть способна работать в среде "клиент-сервер", т. к. большинство данных, которые требуется подвергать оперативной аналитической обработке, хранятся распределено. Главной идеей является то, что серверный компонент инструмента OLAP должен быть достаточно интеллектуаль­ным и позволять строить общую концептуальную схему на основе консолидации и обоб­щения различных физических и логических схем корпо­ративных БД для обеспечения эффекта прозрачности.


6. Равноправие измерений— OLAP-система должна поддерживать многомерную модель, в которой все измерения равноправны. При необходимо­сти дополнительные характеристики могут быть предоставлены отдель­ным измерениям, но такая возможность должна быть предоставлена лю­бому измерению.


7. Динамическое управление разреженными матрицами — OLAP-система должна обеспечивать оптимальную обработку разреженных матриц. Скорость доступа должна сохраняться вне зависимости от расположения ячеек данных и быть постоянной величиной для моделей, имеющих разное число измерений и различную степень разреженности данных.


8. Поддержка многопользовательского режима — OLAP-система должна предоставлять возможность работать нескольким пользователям совместно с одной аналитической моделью или создавать для них различные модели из единых данных. Из-за возможности чтения и записи данных, система должна обеспечивать целостность и без­опасность информации.


9. Неограниченные перекрестные операции— OLAP-система должна обеспечивать сохранение функциональных отношений, описанных с помощью определенного формального языка между ячейками гиперкуба при выполнении любых из возможных четырех операций: среза, вращения, консолидации или детализации. Система должна самостоятельно выполнять преобразование установленных отношений, не требуя от пользователя их переопределения.


10. Интуитивная манипуляция данными — OLAP-система должна предоставлять способ выполнения операций среза, вращения, консолидации и детализации над гиперкубом без необходимости пользователю совершать множество действий с интерфейсом. Измерения, определенные в аналитической модели, должны содержать всю необходимую информа­цию для выполнения всех возможных операций над гиперкубом.


11. Гибкие возможности получения отчетов — OLAP-система должна поддерживать различные способы визуализации данных, т. е. отчеты должны представляться в любой возможной ориентации. Средства формирования отчетов должны представлять синтезируемые данные или информацию, следующую из модели данных в ее любой возможной ориентации.


12. Неограниченная размерность и число уровней агрегации — исследование о возможном числе необходимых измерений, требующихся в аналитической модели, показало, что одновременно может использоваться до девятнадцать измерений. Отсюда вытекает настоятельная рекомендация, чтобы аналитический инструмент мог одновременно предоставить не меньше пятнадцати измерений, а предпочтительнее двадцати измерений. Более того, каждое из общих измерений не должно быть ограничено по числу определяемых пользователем-аналитиком уровней агрегации и путей консолидации[4]
.


2.2. Дополнительные правила Кодда

Набор этих требований, послуживших де-факто определением OLAP, достаточно часто вызывает различные нарекания, например, правила 1, 2, 3, 6 являются требованиями, а правила 10, 11 — неформализованными пожеланиями. Таким образом, перечисленные 12 требований Кодда не позволяют точно определить OLAP. В 1995 г. Кодд добавил еще шесть правил:


13. Пакетное извлечение против интерпретации — OLAP-система должна в равной степени эффективно обеспечивать доступ как к собственным, так и к внешним данным.


14. Поддержка всех моделей OLAP-анализа — OLAP-система должна поддерживать все четыре модели анализа данных, определенные Коддом: толковательную, стереотипную, категориальную и умозрительную.


15. Обработка ненормализованных данных — OLAP-система должна быть интегрирована с ненормализованными источниками данных. Модификации данных, выполненные в среде OLAP, не должны приводить к изменениям данных, хранимых в исходных внешних системах.


16. Сохранение результатов OLAP: хранение их отдельно от исходных данных — OLAP-система, работающая в режиме чтения-записи, после модификации исходных данных должна сохранять результаты отдельно друг от друга, т.е. обеспечивать безопасность всех исходных данных.


17. Исключение отсутствующих значений — OLAP-система, представляя данные пользователю, должна отбрасывать все отсутствующие значения, т.е. они должны отличаться от нуле­вых значений.


18. Обработка отсутствующих значений— OLAP-система должна игнори­ровать все отсутствующие значения без учета их источника. Эта особенность связана с 17-м правилом.


Кроме того, Кодд разбил все восемнадцать правил на четыре группы, и назвал их особенностями. Группы получили названия: В, S, R и D.


Основные особенности (В) включают следующие правила:


· многомерное концептуальное представление данных (правило 1);


· интуитивное манипулирование данными (правило 10);


· доступность (правило 3);


· пакетное извлечение против интерпретации (правило 13);


· поддержка всех моделей OLAP-анализа (правило 14);


· архитектура "клиент-сервер" (правило 5);


· прозрачность (правило 2);


· многопользовательская поддержка (правило 8).


Специальные особенности (S):


· обработка ненормализованных данных (правило 15);

r />

· сохранение результатов OLAP: хранение их отдельно от исходных данных (правило 16);


· исключение отсутствующих значений (правило 17);


· обработка отсутствующих значений (правило 18).


Особенности представления отчетов (R):


· гибкость формирования отчетов (правило 11);


· стандартная производительность отчетов (правило 4);


· автоматическая настройка физического уровня (измененное оригинальное правило 7).


Управлениеизмерениями (D):


· универсальность измерений (правило 6);


· неограниченное число измерений и уровней агрегации (правило 12);


· неограниченные операции между размерностями (правило 9).


2.3. Тест FASMI

Определенные ранее особенности распространены. Более известен тест FASMI (FastofSharedMultidimensionalInformation), созданный в 1995 г. Ричардом Критом и Найджелом Пендсом на основе анализа правил Кодда. В данном контексте акцент сделан на скорость обработки, наличие средств статистического анализа, многопользовательский доступ, многомерность и релевантность информации, т. е. представление анализируемых фактов как функций от большого числа их характеризующих параметров. Они определили OLAP следующими пятью ключевыми словами: Fast(Быстрый), Analysis (Анализ), Shared (Разделяемой), Multidimensional (Многомерной), Information (Информации).


Fast (Быстрый) — OLAP-система должна обеспечивать выдачу большинства ответов пользователям в пределах приблизительно пяти секунд. При этом самые простые запросы обрабатываются в течение одной секунды, и очень немногие более двадцати секунд. Конечные пользователи воспринимают процесс неудачным, если результаты не получены на протяжении тридцати секунд. Они способны нажать комбинацию клавиш <Ctrl>+<Alt>+<Del>, если система не предупредит их, что обработка данных требует большего времени. Даже если система предупредит, что процесс будет длиться существенно дольше, пользователи могут отвлечься и потерять мысль, после чего качество анализа сильно страдает. Такой скорости трудно достигнуть с большим количеством данных, в особенности при специальных очень быстрых вычислениях. Для достижения такой цели используются разные методы, включая применение аппаратных платформ с большей производительностью.


Analysis(Анализ) — OLAP-система должна справляться с любым логиче­ским и статистическим анализом, характерным для данного приложения, и обеспечивать его сохранение в виде, доступном для конечного пользователя. Система должна позволять пользователю определять новые спе­циальные вычисления как часть анализа и формировать отчеты любым же­лаемым способом без необходимости программирования. Все требуемые функциональные возможности анализа должны обеспечиваться понятным для конечных пользователей способом.


Shared(Разделяемой) — OLAP-система должна выполнять все требования защиты конфиденциальности. Если множественный доступ для записи необходим, обеспечивается блокировка модификаций на соответствующем уровне. Обработка множест­венных модификаций должна выполняться своевременно и безопасным спо­собом.


Multidimensional(Многомерной) — OLAP-система должна обеспечить многомерное концептуальное представление данных, включая полную поддержку для иерархий и множественных иерархий, обеспечивающих наиболее логичный способ анализа. Это требование не устанавливает минимальное число измерений, которые должны быть обработаны, поскольку этот показа­тель зависит от приложения. Оно также не определяет используемую техно­логию БД, если пользователь действительно получает многомерное концеп­туальное представление информации.


Information(Информации) — OLAP-система должна обеспечивать получение необходимой информации в условиях реального приложения. Мощность различных систем измеряется не объемом хранимой информации, а количеством входных данных, которые они могут обработать. В этом смысле мощность продуктов сильно различается. Большие OLAP-системы могут оперировать в тысячу раз большим количеством данных по сравнению с простыми версиями OLAP-систем. При этом следует учитывать множество факторов, включая дублирование данных, использование дискового пространства, эксплуатационные показате­ли, требуемую оперативную память, интеграцию с информационными хранилищами и т. п[5]
.


3. АРХИТЕКТУРА
OLAP-СИСТЕМ


Многомерность в OLAP-приложениях представляют в виде трех уровней:


· Многомерное представление данных - средства конечного пользователя, обеспечивающие многомерную визуализацию и манипулирование данными; слой многомерного представления абстрагирован от физической структуры данных и воспринимает данные как многомерные.


· Многомерная обработка - средство (язык) формулирования многомерных запросов (традиционный реляционный язык SQL здесь оказывается непригодным) и процессор, умеющий обработать и выполнить такой запрос.


· Многомерное хранение - средства физической организации данных, обеспечивающие эффективное выполнение многомерных запросов.


Во всех OLAP-системах первые два уровня присутствуют обязательно, а третий уровень не обязательно присутствует в них, хотя и является широко распространенным, так как данные для многомерного представления могут извлекаться и из обычных реляционных структур, и тогда процессор многомерных запросов будет транслировать многомерные запросы в SQL-запросы, которые выполняются реляционной СУБД.


OLAP-продукты, чаще всего, представляют собой OLAP-сервер, многомерную серверную СУБД (такую как, MicrosoftOLAPServices или OracleExpressServer) или же OLAP-клиент, средство многомерного представления данных (такое как, PivotTables в Excel 2000 фирмы Microsoft или ProClarity фирмы Knosys)[6]
.


OLAP-сервер обеспечивает хранение данных, выполнение над ними необходимых операций и формирование многомерной модели на концептуальном уровне.


OLAP-клиент обеспечивает пользователю возможность удобно манипулировать данными для выполнения задач анализа, представляя пользователю интерфейс к многомерной модели данных[7]
.


Слой многомерной обработки обычно бывает встроен в OLAP-клиент и/или в OLAP-сервер, но так же этот слой может быть выделен в чистом виде, как, например, компонент PivotTableService фирмы Microsoft.


OLAP-серверы, или серверы многомерных БД, могут хранить свои многомерные данные по-разному. В любом ХД как в обычном так и в многомерном вместе с детальными данными, извлекаемыми из оперативных систем, хранятся и суммарные показатели (агрегированные показатели, агрегаты), такие, как суммы объемов продаж по месяцам, по категориям товаров и т. п. Агрегаты хранятся в явном виде с единственной целью - ускорить выполнение запросов.


Как детальные данные, так и агрегаты могут храниться либо в реляционных, либо в многомерных структурах. Многомерное хранение позволяет обращаться с данными как с многомерным массивом, благодаря чему обеспечиваются одинаково быстрые вычисления суммарных показателей и различные многомерные преобразования по любому из измерений. Некоторое время назад OLAP-продукты поддерживали либо реляционное, либо многомерное хранение. Сегодня, как правило, один и тот же продукт обеспечивает оба этих вида хранения, а также третий вид - смешанный. Способ реализации хранения данных очень важен, т. к. от него зави­сят такие характеристики, как занимаемые ресурсы и в следствии производительность. Выделяют три основных способа реализации:


· MOLAP (MultidimensionalOLAP) - детальные данные и агрегаты хранятся в многомерной БД. В этом случае получается наибольшая избыточность, так как многомерные данные полностью содержат реляционные.


· ROLAP (RelationalOLAP) - детальные данные остаются в реляционной БД; агрегаты хранятся в той же БД в специально созданных служебных таблицах.


· HOLAP (HybridOLAP) - детальные данные остаются в реляционной БД, а агрегаты хранятся в многомерной БД.


Каждый из этих способов имеет свои преимущества и недостатки и должен применяться в зависимости от различных условий - объема данных, мощности реляционной СУБД и т. д.


При хранении данных в многомерных структурах возникает потенциальная проблема «разбухания» за счет хранения пустых значений. Если в многомерном массиве зарезервировано место под все возможные комбинации меток измерений, а реально заполнена лишь малая часть, то большая часть куба будет пустовать, хотя место будет занято. Современные OLAP-продукты умеют справляться с этой проблемой[8]
.


ЗАКЛЮЧЕНИЕ


Таким образом, в ходе рассматриваемой темы мы узнали, что системами поддержки принятия решений может быть построена на подсистеме оперативного анализа. Для реализации которой и применяется технология оперативной аналитической обработки данных OLAP (On-lineanalyticalprocessing), использующая концепцию многомерного представления данных.


Узнали, что множественность измерений предполагает представление данных в виде многомерной модели. Измерение — это последовательность значений одного из анализируемых параметров. По измерениям в многомерной модели откладывают параметры, относящиеся к анализируемой предметной области.


По Кодду, многомерное концептуальное представление — это множественная перспектива, состоящая из нескольких независимых измерений, вдоль которых могут быть проанализированы определенные совокупности данных.


Одновременный анализ по нескольким измерениям определяется как многомерный анализ.


Оказалось, что многомерную модель данных можно представить как гиперкуб. Ребрами которого являются измерения, а ячейками — меры.


На пересечениях осей измерений располагаются данные, количественно характеризующие анализируемые факты, — меры.


Над ним могут выполнятся операции:


· Срез (Slice).


· Вращение (Rotate).


· Консолидация (Drill Up) и детализация (Drill Down).


Как оказалось с концепцией многомерного анализа данных тесно связывают оперативный анализ, который выполняется средствами OLAP-систем.


Узнали, что основным назначением OLAP-систем является поддержка аналитической деятельности, произвольных запросов пользователей-аналитиков. А целью OLAP-анализа — проверка возникающих гипотез.


Выяснили, что у истоков технологии OLAP стоит основоположник реляционного подхода Э. Кодд, который изложил 12 правил, изложенных определяющих OLAP:


1. Многомерность.


2. Прозрачность.


3. Доступность.


4. Постоянная производительность при разработке отчетов.


5. Клиент-серверная архитектура.


6. Равноправие измерений.


7. Динамическое управление разреженными матрицами.


8. Поддержка многопользовательского режима.


9. Неограниченные перекрестные операции.


10. Интуитивная манипуляция данными.


11. Гибкие возможности получения отчетов.


12. Неограниченная размерность и число уровней агрегации.


Оказалось, что позже он добавил еще шесть правил:


13. Пакетное извлечение против интерпретации.


14. Поддержка всех моделей OLAP-анализа.


15. Обработка ненормализованных данных.


16. Сохранение результатов OLAP: хранение их отдельно от исходных данных.


17. Исключение отсутствующих значений.


18. Обработка отсутствующих значений.


Узнали что OLAP-система включает в себя два основных компонента:


· OLAP-сервер;


· OLAP-клиент.


ГЛОССАРИЙ














































№ п/п Новое понятие Содержание
1

Вращение (Rotate)


Изменение расположения измерений, представленных в отчете или на отображаемой странице.
2

Детализация


(Drill Down)


Операция, которая определяет переход от агрегированного представления данных к детальному.
3 Измерение Последовательность значений одного из анализируемых параметров.
4

Консолидация


(Drill Up)


Операция, которая определяет переход по направлению от детального представления данных к агрегированному.
5

Многомерное концептуальное представление


(multi-dimensional conceptual view)


Множественная перспектива, состоящая из нескольких независимых измерений, вдоль которых могут быть проанализированы определенные совокупности данных.
6 Система поддержки принятия решений СППР Системы, обладающие средствами ввода, хранения и анализа данных, относящихся к определенной предметной области, с целью поиска решений.
7

Срез (Slice)


Формируется подмножество многомерного массива данных, соответствующее единственному значению одного или нескольких элементов измерений, не входящих в это подмножество.
8

OLAP-клиент


Представляет пользователю интерфейс к многомерной модели данных, обеспечивая его возможностью удобно манипулировать данными для выполнения задач анализа.
9 OLAP-сервер Обеспечивает хранение данных, выполнение над ними необходимых операций и формирование многомерной модели на концептуальном уровне.
10 OLAP (On-Line Analytical Processing) Технология оперативной аналитической обработки данных использующая методы и средства для сбора, хранения и анализа многомерных данных и целях поддержки процессов принятия решений.


БИБЛИОГРАФИЧЕСКИЙ СПИСОК


1. Администрирование баз данных. Полное справочное руководство по методам и процедурам Автор: Крейг С. Маллинс Издательство: КУДИЦ-Образ Год издания: 2003 г.


2. Атре Ш. Структурный подход к организации баз данных. М.: Финансы и статистика, 1983.


3. Базы данных (2-е издание). Кузин А. В., Левонисова С. В.


4. Бойко В.В., Савинков В.М. Проектирование баз данных информационных систем. – М.: Финансы и статистика, 1989.


5. Введение в системы баз данных. Восьмое издание, К. Дж. Дейт; 2008, 3 кв.; Вильямс


6. Введение в системы баз данных (седьмое издание). К. Дж. Дейт Издано: 2001, Вильямс.


7. Основы будущих систем баз данных. Третий манифест. К.Дж.Дейт, Хью Дарвен. Перевод: С.Д.Кузнецов, Т.А.Кузнецова. Под ред. С.Д.Кузнецова. Издано: Издательство Янус-К, 2004 г.


8. Проектирование и разработка баз данных. Визуальный подход. Реймонд Фрост, Джон Дэй, Крейг Ван Слайк. Перевод с англ. А.Ю.Кухаренко – М.: НТ Пресс 2007.


9. Теория и практика построения баз данных, 8-е изд. Крёнке Д. Издано: 2003, "Питер".


10. Энциклопедия технологий баз данных. М.Р. Когаловский Издано: 2002, М.: Финансы и статистика.


11. http://www.infology.ru


12. http://www.radar-soft.com


13. http://www.iso.ru/journal/articles/370.html


14. http://www.olap.ru


15. http://lissinski.narod.ru


16. http://interface.ru/misc/cyc/htm


17. http://itshop.ru/level4.asp?ItemId=12809


18. http://subscribe.ru/catalog/comp.soft.others.itnews


19. http://www.docflow.ru/analytic_fuul.asp?param=32331


20. http://www.mirrabot.com/work/work_69426.html


21. http://www.olap.ru/basic/alpero2i.asp


22. http://www.olap.ru/basic/olap_intro2.asp



СПИСОК СОКРАЩЕНИЙ


БД – Базы данных


СППР – Системами поддержки принятия решений


СУБД – Системы управления базами данных


ХД – Хранилища данных


ПРИЛОЖЕНИЕ 1


a) Представление данных в виде гиперкуба



b) Операция среза



ПРИЛОЖЕНИЕ 2


Операция вращения



ПРИЛОЖЕНИЕ 3


Операции консолидации и детализации



[1]
http://www.iso.ru/journal/articles/370.html


[2]
http://www.olap.ru


[3]
http://www.docflow.ru/analytic_fuul.asp?param=32331


[4]
Основы будущих систем баз данных. Третий манифест. К.Дж.Дейт, Хью Дарвен. Перевод: С.Д.Кузнецов, Т.А.Кузнецова. Под ред. С.Д.Кузнецова. Издано: Издательство Янус-К, 2004 г.


[5]
http://www.infology.ru


[6]
http://www.olap.ru/basic/alpero2i.asp


[7]
http://subscribe.ru/catalog/comp.soft.others.itnews


[8]
http://www.olap.ru/basic/olap_intro2.asp

Сохранить в соц. сетях:
Обсуждение:
comments powered by Disqus

Название реферата: Технологии OLAP, понятие ее реализации и структуры

Слов:3818
Символов:35822
Размер:69.96 Кб.