Współczesny biznes to sfera, w której szczególną rolę odgrywa informacja. I to informacja odpowiednio przygotowana - taka, którą można szybko i łatwo przekuć w wartościową wiedzę ułatwiającą podejmowanie decyzji. Przetwarzanie gromadzonych w firmie danych ułatwiają systemy klasy Business Intelligence wykorzystujące tzw. kostkę OLAP. Czym ona jest i jak z niej korzystać? O tym w dzisiejszym artykule.

{flike}

Czym jest kostka OLAP?

To, co kryje się pod pojęciem kostki OLAP jest zdecydowanie prostsze niż mogłaby to sugerować jej enigmatyczna nazwa. Kostka OLAP (z j. ang. OLAP cube, przy czym OLAP to skrót od OnLine Analytical Processing) jest po prostu strukturą danych (bazą danych) stworzoną w sposób pozwalający na szybką analizę zawartych w niej informacji.

Dlaczego akurat "kostka"? Dlatego, że struktura OLAP nie gromadzi danych w tabelach (jak standardowa, relacyjna baza danych), a w obiektach wielowymiarowych - kostkach. Przy czym trójwymiarowa "kostka" jest tu jedynie terminem umownym - w praktyce wymiarów OLAP może być więcej (mówimy wówczas o tzw. hiperkostce).

Przykład kostki OLAP

Wyznając zasadę, że dobry przykład to najlepsze wyjaśnienie, poniżej przedstawiam schemat kostki OLAP, którą wykorzystam w kolejnym akapicie tego tekstu. Moja kostka zawiera informacje o szansach sprzedaży danej firmy dla klientów różnych typów w określonym czasie. Dla zobrazowania przykładu każdy z wymienionych parametrów jest przedstawiony na schemacie jako jeden z wymiarów kostki OLAP.

W praktyce, tj. w systemach BI, struktura OLAP nie występuje jednak jako bryła. Jest to po prostu arkusz danych, a mówiąc ściślej - wielowymiarowa tabela, z której korzystamy w sposób zbliżony do tradycyjnego Excela. Z tym, że dzięki typowym dla OLAP operacjom, zgromadzone w kostce dane możemy analizować z różnych punktów widzenia.

Kostka OLAP w praktyce

Przedstawiona poniżej kostka OLAP została wykonana w opensource'owym systemie klasy Business Intelligence - Tibco Jaspersoft. Tak jak wcześniej wspomniałem, zawiera ona dane dot. zarejestrowanych szans sprzedaży dla klientów różnych typów w pewnym okresie (lata 2002 - 2005). Źródłem danych dla systemu BI jest popularna platforma do zarządzania relacjami z klientami - SugarCRM.

Tabela składa się z trzech części (wymiarów), rozbitych na mniejsze elementy:

  • Typy klientów (branża, rodzaj działalności),
  • Czas (rok, kwartał),
  • Sprzedaż (wartość sprzedaży, liczba tematów sprzedażowych, średnia wartość transakcji, średnia liczba dni do zamknięcia tematu, średnie prawdopodobieństwo zamknięcia tematu).

Zwróćmy uwagę, że poszczególne elementy składające się na wymiar kostki OLAP pojawiają się na arkuszu stopniowo - w miarę zagłębiania się w dane. Przykładowo, w ramach wymiaru "czas" początkowo widzimy informacje ogólne (brak jakiejkolwiek podziałki). Po rozwinięciu dane uszczegóławiają się - dzielą na kolejne lata, następnie kwartały, miesiące, tygodnie i dni. Pozwala to na ich bardzo elastyczną i efektywną analizę - te same informacje możemy przeglądać zarówno na dużym poziomie ogólności, jak i z uwzględnieniem najdrobniejszego szczegółu.

Kostka OLAP jako struktura danych w systemach Business Intelligence jest zazwyczaj wzbogacana o zestaw narzędzi analitycznych. Oprócz wielowymiarowego arkusza danych, oprogramowanie udostępnia m.in. możliwość wizualizacji danych - np. za pomocą wykresów. Ponadto, ważnym elementem kostki są mechanizmy do jej obróbki, pozwalające na jej obracanie (prezentacja informacji pod innym kątem), rozwijanie i zwijanie (czyli wspomniane wyżej uogólnianie i doprecyzowywanie), sortowanie, wycinanie interesujących fragmentów itp.

Możliwość analizy firmowych danych za pomocą kostki OLAP i związanych z nią narzędzi to jedna z głównych zalet systemów BI, a zarazem przyczyn ich popularności. Biorąc pod uwagę, że na rynku istnieje bezpłatne oprogramowanie tego typu, warto jest choćby się z nim zapoznać i zweryfikować ewentualne korzyści płynące ze stosowania Business Intelligence.

Na koniec warto wspomnieć skąd dane w kostce OLAP tak właściwie się biorą. Najczęściej pochodzą z zewnętrznych źródeł (arkusze CSV, relacyjne bazy danych) - w moim przypadku z bazy danych systemu SugarCRM. Samą strukturę kostki definiuje natomiast odpowiednio skonstruowane zapytanie. Więcej szczegółów na ten temat postaram się przedstawić w jednym z kolejnych wpisów.

Przeczytaj również:


  • Brak komentarzy
Dodaj komentarz


Piotr Rawski
Informatyk i ekonomista z kilkunastoletnim doświadczeniem w rozwoju i wdrażaniu systemów IT dla biznesu.

Doradzam, optymalizuję procesy biznesowe i dobieram oprogramowanie do indywidualnych potrzeb. Wszystko po to, aby zwiększyć efektywność Twojej firmy. ⮕ kontakt i współpraca

Zapraszam również na mój nowy blog poświęcony zarządzaniu w IT:
⮕ piotrrawski.pl

Również na stronie: