OLAP ir duomenų saugyklos

rašyta gana seniai, apie 2003 m., bet gal kam pravers 🙂

Duomenų saugyklos ir jų taikymai

Kas yra duomenų saugykla

Duomenų saugykla (DS) – nuo veiklos sistemų atskira duomenų saugojimo sistema. Joje saugomi duomenys yra statiški, t.y., nekeičiami, o tik papildomi ir skirti užklausoms ir analizei, o ne transakcijoms.

Žymiausių DS technologijų tyrinėtojų pateikiami apibrėžimai:

“Orientuotas į teminę sritį, integruotas, skirtingas laike, nekintantis duomenų rinkinys, skirtas paremti vadybos sprendimų priėmimo procesą.” W.H. Inmon

“Transakcinių duomenų kopija, struktūruota specialiai užklausoms ir analizei.” Ralph Kimball

Duomenų saugyklose kaupiami įvairūs istoriniai organizacijų duomenys. Dažniausiai tai būna veiklos sistemose, kurios kasdien naudojamos versle ir kuriose duomenys greitai kinta, esančių transakcinių duomenų kopijos, daromos kas tam tikrą laiko tarpą. Šie duomenys yra sutvarkomi taip, kad vėliau gerai tiktų kuo įvairesnėms užklausoms, ataskaitoms, analizei. Paprastai DS saugomi kelių metų trukmės organizacijos duomenys, fiksuojami gana dažnai – kas savaitę, kasdien, priklausomai nuo taikymo. DS integruoja duomenis apie įvairias organizacijos veiklos sritis tam, kad duomenys nebūtų dubliuojami, taip pat, kad juos galima būtų analizuoti plačiau, būtų lengviau rasti ryšius tarp duomenų.

DS taikymo sritys

Vienas svarbiausių DS pritaikymų – sprendimų pagalbos sistemos (SPS). Dažniausiai duomenys saugyklose kaupiami tam, kad vėliau juos galima būtų analizuoti, gauti įvairias ataskaitas bei pagal jas spręsti ar pasirinkta teisinga organizacijos veiklos kryptis, kurie sprendimai efektyvūs, kurie ne, taip pat numatyti tolesnę organizacijos veiklos kryptį, ieškoti, kokius pakeitimus galima būtų padaryti, siekiant pagerinti rezultatus. Šiose sistemose duomenų saugyklos naudojamos kartu su OLAP (interaktyvi duomenų analizė), duomenų gavybos (DG) priemonėmis.

Šių sistemų pritaikymų yra gana įvairių. Daugiausiai jas naudoja didelės verslo organizacijos, bankai, telekomunikacijų bendrovės, įvairūs tyrimų centrai, valstybinės organizacijos. Prekybinės organizacijos jas taiko kainų politikos pasirinkimui, reklamos bei klientų išlaikymo programoms, rinkos tyrimams, gamybinės – gamybos krypčių, gaminamų produktų linijų, būtino kokybės lygio nustatymui, bankai, draudimo kompanijos – klientų patikimumo, rizikos lygio nustatymui.

Taip pat duomenų saugyklas naudoja įvairios mokslinės, valstybinės organizacijos, duomenų rinkimui, kad vėliau galima būtų palyginti jų kitimą laike, pagal geografiją ir panašiai, rasti įvairius ryšius.

Duomenų saugyklų savybės

Orientacija į teminę sritį. DS paprastai būna orientuotos į verslo sritį, jos kuriamos pagrindu imant konkrečios verslo srities struktūrą, veiklas.

Duomenų vieningumas (integruotumas). Duomenys iš skirtingų sistemų turi būti vieningi ir suderinti tarpusavyje.

Duomenų skirtingumas laike. Nauji duomenys į duomenų saugyklą perkeliami kas tam tikrą laiko tarpą, kiekvieną kartą jie būna pasikeitę. Tai leidžia analizuoti kaip jie kinta laike, pastebėti įvairias tendencijas.

Duomenų nekintamumas. Vieną kartą į duomenų saugyklą įkelti duomenys jau nebekeičiami ir iš jos nešalinami, jie ten yra visą laiką tokie, kokie buvo juos įkraunant. Vienintelis jos atnaujinimas – tai papildymas duomenimis, prijungiant juos prie jau esančių.

Duomenų saugyklų projektavimo būdai

Iš viršaus žemyn

Projektuojant šiuo metodu pirma apibrėžiama visa duomenų saugykla, o po to ji skirstoma į smulkesnes duomenų vitrinas (DV), labiau pritaikytas atskirų padalinių poreikiams.

Iš apačios į viršų

Kitas duomenų saugyklų projektavimo būdas – pirmiausiai palaipsniui sukurti atskiras DV, po to jas sujungti į bendrą DS, arba prijunginėti prie esančios saugyklos naujas DV.

Hibridinis

Tai – abiejų aukščiau aprašytų būdų sujungimas. Abu jie turi tam tikrų trūkumų, o hibridinis būdas yra bandymas tuos trūkumus pašalinti. Kuriant DS iš viršaus į apačią, pagrindinis trūkumas yra jos kūrimo laikas, nes ji tampa naudojama tik tada, kai pilnai baigiama kurti. Iš apačios į viršų projektavimo būdas leidžia palaipsniui kurti atskiras duomenų vitrinas, šiuo atveju galima naudotis sukurtomis DV nelaukiant, kol bus pabaigta visa DS. Tačiau šio metodo trūkumas – prasta atskirų duomenų vitrinų integracija, nes kuriamos atskirai, jos gali turėti nesuderinamus duomenų formatus, kai kurias vėliau gali būti išvis sunku integruoti į bendrą DS.

Hibridinis metodas pasižymi tuo, kad pirmiausiai yra sukuriamas bendras visos DS modelis, apibendrinami standartai, nustatomi metaduomenys, atskirų DV bendravimas, kas leidžia išvengti vėlesnių nesuderinamumų, tada pradedamos kurti atskiros DV, kurios gali būti pradedamos naudoti, kaip ir projektuojant iš apačios į viršų, daug anksčiau nei baigiama visa DS.

Pagrindinės duomenų saugyklų veiklos

Duomenų telkimas

Duomenų saugyklų duomenys – veiklos sistemų duomenų kopijos. Telkimas ir yra jų perkėlimas iš veiklos sistemų į duomenų saugyklą. Kadangi duomenų saugyklų struktūra skiriasi nuo transakcinių (reliacinių) duomenų bazių, iš kurių duomenys gaunami, be to, į vieną duomenų saugyklą gali būti perkeliami duomenys iš kelių, dažnai tarpusavyje nevisiškai suderintų veiklos sistemų, tai duomenų perkėlimas nėra labai paprastas procesas. Jis susideda iš šių pagrindinių etapų: duomenų išrinkimo, transformavimo, įkrovimo (ITĮ).

Duomenų išrinkimas

Pirmojo duomenų telkimo etapo metu iš veiklos sistemų gaunami duomenys perkėlimui į duomenų saugyklą. Tam reikia nustatyti, kokius duomenis norėsime perkelti į duomenų saugyklą iš veiklos sistemų.

Transformavimas

Duomenys transformuojami į duomenų saugyklai priimtiną formą. Duomenų formatai veiklos sistemose ir duomenų saugyklose gali skirtis, taigi tais atvejais formatus reikia pakeisti. Jei duomenys į duomenų saugyklą perkeliami iš skirtingų šaltinių, reikia sekti, kad jų formatai sutaptų. Be to, duomenys veiklos sistemose saugomi kitokiu principu, nei duomenų saugyklose, todėl reikia nuspręsti, kur kurie duomenys turi patekti. Ne visi duomenys iš veiklos sistemų gali būti vertingi, todėl reikia atskirti vertingus duomenis.

Įkėlimas

Duomenų išrinkimo ir transformavimo veiksmai paprastai atliekami duomenų telkimo srityje, kuri yra atskirai nuo duomenų saugyklos, iš jos duomenys perkeliami į saugyklą.

Užklausos ir ataskaitos

Su duomenų saugykloje esančiais duomenimis atliekami veiksmai – tai daugiausiai įvairios iš anksto numatytos ataskaitos, tikslingos (ad hoc) vartotojų užklausos, įvairios analizės.

Duomenų saugyklos struktūra

Struktūriškai DS – tai tarsi daugiamatė erdvė (kubas ar hiperkubas), kurioje tam tikrose vietose išdėlioti tam tikri duomenys. Ką tie duomenys atspindi, nurodo matavimai (dimensijos), pagal kurias jie dėliojami, o jų konkretūs dydžiai – faktai (matai) – tai šių matavimų reikšmės. Paprasčiausią trijų matavimų modelį galimą įsivaizduoti kaip kubą, sudalintą į mažus kubelius, kurių kiekvienas atitinka faktą, o kubo kraštinės – matavimus.

1 pav. Pardavimų pavaizdavimas kubu

Ši daugiamatė struktūra gali būti realizuojama žvaigždės schema. Ją sudaro centrinė faktų lentelė ir daug matavimų lentelių.

Matavimai

Kiekvienas logiškai skirtingas parametras, pagal kurį norime analizuoti savo duomenis, gali būti matavimu. Vienas iš pagrindinių matavimų dažnai būna laikas, kiti matavimai paprastai priklauso nuo teminės srities. Matavimų paprastai būna nuo trijų, gali būti ir daugiau. Pavyzdžiui, pardavimų duomenų saugykloje, matavimai gali būti Laikas, Parduotuvė, Prekė, Kaina. Pagal tai vėliau galima gauti įvairias ataskaitas apie tai, kiek, pavyzdžiui, kažkokioje parduotuvėje už kažkokią kainą parduota kažkokių konkrečių prekių. Matavimai dažniausiai būna ne vientisi, bet sudaryti iš daug hierarchinių lygių. Pavyzdžiui, laiko dimensijoje metai gali būti skirstomi į ketvirčius, šie į mėnesius, dienas; prekės gali būti skirstomos į maistą, gėrimus, buities reikmenis, maistas dar gali būti smulkinamas į kepinius, mėsos, pieno produktus, daržoves.

Matai (faktai)

Faktai yra konkrečios, dažniausiai skaitinės, reikšmės. Pagrindinė jų savybė yra adityvumas, t.y., kad jie būtų tokie, kad juos galima būtų sudėti, tačiau būna ir išimčių. Faktai atspindi kas kurį laiką iš veiklos sistemų perkeliamas realias matavimų reikšmes.

Žvaigždės schema

Žvaigždės schema skirta daugiamačio duomenų modelio konstravimui reliacinėje duomenų bazėje. Faktų lentelėje kartu su kiekvienu faktu saugomi keli svetimi raktai kaip nuorodos į matavimų lenteles kaip šių lentelių pirminiai raktai. Taip faktai susiejami su juos apibūdinančiu matavimu. Jei nebūtų šių ryšių, faktai būtų tik nieko nesakančių skaičių kratinys. Šiuo būdu, žvaigždės schemos pagalba, yra realizuojamas “daug su daug” ryšys, nes per faktų lentelę dimensijos yra susiejamos ir vienos su kitomis, taip susiejama, pavyzdžiui, daug prekių su daug parduotuvių.

Raktams patogiausia naudoti iš eilės einančius skaičius, o ne iš taikymo sričių paimtas reikšmes.

Smulkumas

Projektuojant DS, svarbu nustatyti jos smulkumą. Jis nurodo, kokios bus pačios smulkiausios duomenų dalelės. Kuo smulkumas didesnis, t.y., kuo dalelės smulkesnės, tuo tiksliau ir įvairiau vėliau jas galima analizuoti. Pavyzdžiui, laiko smulkumas nurodo, kas kiek laiko duomenys bus fiksuojami – kas mėnesį, savaitę, dieną ar pan.

Duomenų saugyklos ir paprastos ITA duomenų bazės skirtumai

Kas yra ITA duomenų bazė, jos struktūra, paskirtis, taikymai

ITA (interaktyvus transakcijų apdorojimas) – realaus laiko sistemos, paremtos reliacinėmis duomenų bazėmis, pritaikytos operuoti greit besikeičiančiais duomenimis. Tai – įvairios prekybos bei gamybos apskaitos, bankų operacijų, bilietų užsakymo ir kitos panašios paskirties sistemos.

Duomenų saugyklų ir ITA taikymo skirtumai

ITA sistemos paprastai būna naudojamos kaip dalis paties verslo, jos versle reikalingos kasdien, be jų nutrūktų jas naudojančių organizacijų veikla, o DS yra tarsi šalia verslo, labiau nutolusios nuo kasdieninės veiklos. ITA sistemos vartotojų veiksmai dažniausiai patenka į daug labiau iš anksto apibrėžtą ir siauresnę galimų veiksmų aibę nei DS vartotojų užklausos.

Duomenų saugyklų ir ITA struktūrų ir veikimo skirtumai

Duomenų modelis. ITA duomenų modelis yra reliacinis, sudarytas iš daugelio lentelių, susijusių viena su kita ryšiais “vienas su daug”. Šių sistemų pagrindas dažniausiai būna reliacinė duomenų bazė, skirta transakcijoms. DS duomenys struktūruoti pagal daugiamatį modelį, realizuojamą per centrinę faktų lentelę ir daug matavimų lentelių.

Duomenų pastovumas. Duomenys ITA sistemose yra pastoviai kintantys, atnaujinami. DS saugomi duomenys yra tik papildomi, tačiau esantys duomenys nekeičiami.

Duomenų apimtis. DS apimtis paprastai būna daug didesnė nei ITA, taip pat ji apima daug didesnio laiko tarpo duomenis.

Greitis. ITA sistemos pritaikytos greitam transakcijų vykdymui, tačiau jų struktūra yra per daug sudėtinga norint analizuoti didelius kiekius duomenų, nes jose yra daugybė lentelių su daugybe ryšių ir sudėtingesnės užklausos ilgai užtrunka, o DS šios užklausos atliekamos labai greitai, nes daugiamatėje struktūroje duomenys išdėlioti taip, kad atsakymai beveik iš anksto paruošti.

Vartotojų veiklos. Vartotojai duomenis į ITA dažniausiai ir užkrauna ir paima realiame laike, o iš duomenų saugyklų tik paima.

OLAP priemonės ir jų panaudojimas analitikų darbe

Kas yra OLAP

OLAP (Interaktyvus analitinis duomenų apdorojimas) – priemonės analitiniam apdorojimui realiu laiku. OLAP dažniausiai yra naudojama kaip SPS dalis. OLAP priemonės yra taikomosios programos, leidžiančios nagrinėti duomenis įvairiais požiūriais ir pjūviais. Jos pateikia vartotojui daugiamatį duomenų vaizdą, leidžia gauti apibendrintus duomenis ir, jei reikia, greitai gauti detalesnius ar bendresnius duomenų vaizdus, peržiūrėti juos pagal norimus kriterijus, parametrus. Vartotojas norimus duomenis gali matyti lyginamosiose lentelėse, taip pat naudodamasis įvairiomis vaizdinėmis priemonėmis – grafikais, diagramomis. OLAP pagrindas yra daugiamatė duomenų struktūra, vadinama kubu ar hiperkubu. Ši struktūra turi kelis matmenis, į ją surašomi duomenys – faktai. Duomenys, skirti OLAP, gali būti saugomi DS.

Galimi vartotojų veiksmai OLAP sistemose

Duomenis OLAP sistemose galima peržiūrinėti iš įvairių atskaitos taškų. Paprastai vartotojui pateikiama dvimatė daugiamačio vaizdo projekcija, pagal pasirinktus matavimus. Vaizdinių priemonių naudojimas gali leisti gana aiškiai matyti ir analizės bent jau pagal tris matavimus rezultatus. Pagrindinės operacijos, atliekamos OLAP programose, yra sumavimas (funkcija sum), kiekio skaičiavimas (count), mažiausios ir didžiausios reikšmių radimas (min, max), vidurkio skaičiavimas (average), dispersija (variance). Kadangi matavimai dažniausiai daromi kelių hierarchinių lygių, duomenis galima išskleisti ir suglausti pereinant į aukštesnį ar žemesnį lygį, t.y., duomenis stebėti detalesnius arba bendresnius, tam naudojami išskleidimo ir suglaudimo operatoriai.

Kartais tam, kad skaičiavimai būtų atliekami greičiau, naudojamos agregacijos – iš anksto suskaičiuotos sumos, vidurkiai, kt., kad jų nereikėtų perskaičiuoti kiekvieną kartą, kai jų reikia, ypač tų duomenų, kurių prireikia dažniausiai.

OLAP taikymo sritys

OLAP dažniausiai naudojama norint palyginti įvairius duomenis laike, pavyzdžiui, įvairių ketvirčių pardavimus, vienus su kitais, tokius kaip skirtingų parduotuvių pardavimus, ar pamatyti bendresnį, platesnį vaizdą.

OLAP tipai

MOLAP – daugiamatis (multidimensinis) OLAP. MOLAP sistemų pagrindas – daugiamatės DB (DS). Duomenys jose saugomi išdėlioti daugiamačiuose masyvuose. Kiekvienas masyvo matavimas atitinka daugiamačio duomenų modelio matavimą. Duomenys MOLAP pasiekiami daug greičiau, todėl greičiau atliekamos užklausos. MOLAP gerai tinka dažnai naudojamoms sistemoms.

ROLAP – reliacinis OLAP, paremtas reliacinėmis DB. Daugiamatis duomenų modelis čia realizuojamas per žvaigždės schemą. Šios sistemos paprastai būna lėtesnės už MOLAP. Jei duomenys reti, t.y., jei juose daug neįvardintų reikšmių, tai joms geriau tinka ROLAP, nes užima mažiau vietos.

HOLAP – hibridinis OLAP. Dalis duomenų yra saugoma reliacinėje DB, dalis – daugiamatėje. Agregacijos, apibendrinti duomenys paprastai saugomi daugiamatėje DB, smulkesni duomenys – reliacinėje.

Duomenų gavyba (DG) ir jos ryšys su duomenų saugyklomis

Duomenų gavyba skirta automatiškai surasti duomenyse įvairius dėsnius, tendencijas, kurie yra nežinomi arba apie juos tik numanoma.

Taikymo sritys

OLAP priemonės leidžia apibendrinti duomenis, konstatuoti realius faktus, bet retai atskleidžia to priežastis. Pavyzdžiui OLAP gali parodyti, kad viena parduotuvė parduoda daugiau konkrečių prekių nei, kita, bet neparodys, kodėl. DG priemonės gali padėti atsakyti į šiuos klausimus, atrasdama dėsningumus, kurių analitikai gali nepastebėti. Taip pat DG priemonės gali padėti atrasti net nenumanytus ryšius tarp tam tikrų dalykų, klasifikuoti duomenis, daryti prognozes ateičiai, turint duomenis apie praeitį. OLAP daugiau naudojama patikrinti analitikų iškeltoms hipotezėms, o DG – naujų hipotezių iškėlimui. Duomenų gavyba taikoma įvairiose srityse – moksle, versle, medicinoje ir kitur. Konkretūs taikymai gali būti tokie, kaip rinkos segmentacija, pirkėjo krepšelio nustatymas, sukčiavimų atskleidimas, kt. Duomenų gavyba dažnai būna platesnės srities – žinių išgavimo iš duomenų – sritimi.

Pagrindinės duomenų gavybos metodai

Ryšių analizė padeda rasti anksčiau nežinomus ryšius tarp duomenų. Dvi pagrindinės ryšių analizės kryptys yra asociacijų paieška ir sekų paieška. Asociacijų paieška padeda nustatyti ryšius tarp skirtingų duomenų, sekų paieška nustato ryšius tarp duomenų laike.

Klasterizavimas yra duomenų bazės dalinimas į bendrus požymius turinčias grupes. Prieš pradedant klasterizuoti, nežinoma, kokie yra tie bendrumo požymiai, jie nustatomi klasterizavimo eigoje.

Klasifikacija – tai duomenų skirstymas į jau iš anksto žinomas grupes. Jos gali būti arba iš anksto apibrėžtos, arba nustatytos klasterizavimo metodu.

Prognozavimas – tendencijų radimas ir galimų ateities įvykių nustatymas pagal jas.

Pagrindiniai algoritmai

Dirbtiniai neuroniniai tinklai. Jie yra efektyvūs didelių problemų sprendime. Šiuo atveju jie gali būti naudojami klasifikacijai ir prognozavimui. Dirbtinių neuroninių tinklų pavadinimas kilęs iš biologinių neuroninių tinklų, tik dirbtiniai daug paprastesni. Jie remiasi sudėtinga kelių sluoksnių struktūra, kuri yra paslėpta viduriniuose sluoksniuose. Į pirmą sluoksnį būna paduodami įėjimo duomenys, paskutiniame gaunami rezultatai.

Sprendimų medžiai. Šie medžiai skirsto duomenis į kategorijas pagal tam tikras taisykles, besišakojančiu būdu, kai pritaikius vieną taisyklę, pereinama prie kitos, dar kitos ir t.t., kol gaunamas rezultatas.

Genetiniai algoritmai. Jie pagrįsti selekcija, mutacija, kryžminimu ir evoliucionuoja, kaip natūralioje gamtoje. Jie po truputį keičiasi ir lieka tie, kurie geriausiai tinka uždavino sprendimui.

Artimiausių kaimynų metodas. Šiuo metodu duomenys skirstomi pagal tai, kurios klasės duomenų, kaimyninių jiems, yra daugiausia.

Taisyklių metodas. Šis metodas skirsto duomenis pagal tam tikras taisykles. Jis skirasi nuo sprendimų medžių tuo, kad taisyklės yra nepriklausomos ir medžio suformuoti neišeina.

Tikimybiniai metodai. Šiais metodais yra nustatomos tam tikrų įvykių tikimybės ir pagal tai jie priskiriami įvairioms klasėms.

Metodų sujungimas. Kartais algoritmas, sudarytas vienai duomenų aibei, gali blogai veikti su kita, algoritmai gali duoti nepatikimus rezultatus ar pan. Tam kartais naudojamas kelių metodų sujungimas, o gavus rezultatus iš jų, imamas tas, kurį pateikia dauguma algoritmų.

Duomenų saugyklų naudojimas duomenų gavyboje

Duomenys DG sistemoms gali būti tiekiami iš įvairių sistemų – veiklos sistemų, transakcinių duomenų bazių, tačiau vienas iš efektyviausių būdų – duomenis tiekti iš DS. Imant duomenis iš paprastų duomenų bazių, juos reikia apdoroti, kad būtų galima naudoti duomenų gavybai, o duomenų saugyklose duomenys jau būna tam paruošti.

Duomenų saugyklos kūrimo etapai

1.      Reikalavimų rinkimas

1.1.   Susipažinimas su reikalavimais

1.1.1.      Organizacijos veiklos sričių apžvalga

1.1.2.      Duomenų saugyklos diegimo tikslų nustatymas

1.1.3.       Numatomos kuriamos DS taikymo sritys

1.2.   Galimų vartotojų veiklų nustatymas

1.2.1.      Galimų užklausų nustatymas

1.2.2.      Galimai reikalingų ataskaitų nustatymas

1.2.3.      Galimos vartotojų navigacijos duomenyse nustatymas

1.3.   Reikiamų ir esamų organizacijos informacinių technologijų apžvalga

1.3.1.      Esamų organizacijos veiklos sistemų (duomenų šaltinių) apžvalga

1.3.2.      Reikiamų technologijų apžvalga

1.3.3.      Esamų organizacijos informacinių technologijų apžvalga ir jų pritaikymo galimybių įvertinimas

1.3.4.      Būtinų technologijų įsigijimas

1.4.   Projektavimo metodo parinkimas:

1.4.1.      Iš viršaus žemyn

1.4.2.      Iš apačios į viršų

1.4.3.      Hibridinis

2.      Projektavimas

2.1.   DS projektavimas

2.1.1.      Duomenų modelio projektavimas

2.1.1.1.Metaduomenų projektavimas

2.1.1.2.Dimensijų parinkimas

2.1.1.3.Dimensijų lentelių sudarymas

2.1.1.4.Faktų lentelės sudarymas

2.1.1.5.Duomenų agregavimo projektavimas

2.1.2.      Duomenų telkimo projektavimas

2.1.2.1.Duomenų išrinkimo procesų

2.1.2.2.Duomenų transformavimo procesų

2.1.2.3.Duomenų įkrovimo procesų

2.2.   Galutiniam vartotojui skirtų programų projektavimas ir parinkimas

2.2.1.      Užklausų programų projektavimas

2.2.2.      Programų ataskaitoms projektavimas

2.2.3.      Vaizdinės analizės projektavimas

2.2.4.      Galutiniam vartotojui skirtų programų ir DS susiejimas

3.      Įgyvendinimas (programavimas)

4.      Diegimas, testavimas

4.1.   DS integravimas į organizacijos informacinę sistemą

4.2.   Pradinių testinių duomenų užkrovimas

4.3.   Testinis pagrindinių užklausų vykdymas

4.4.   Vartotojų apmokymas

4.5.   DS įvertinimas iš vartotojų pusės

4.6.   Pilnas sistemos paleidimas

5.      Priežiūra, plėtimas

5.1.   Vartotojų apmokymas

5.2.   DS administratoriaus paskyrimas

5.3.   Bendravimas su vartotojais

5.4.   Techninė priežiūra

5.5.   DS veiklos stebėjimas

5.6.   Naujai iškylančių poreikių analizė

5.7.   DS keitimas ir vystymas

Naudota literatūra

  1. www.dwinfocenter.org
  2. http://system-services.com/dwintro.asp
  3. DATABASE DESIGN, 2001 – 2002 – TOM OSMAN
  4. Thinking dimensionally aids business intelligence design and use. Apr 16, 2001 | Dan Pratte
  5. Understanding Data Warehousing Strategically. Bernard (Bernie) Boar
  6. Data Warehousing, Dr. Navneet Goyal, BITS, Pilani
  7. http://misdb.bpa.arizona.edu/~mis551/
  8. The Data Warehouse Diary: Source System Assessment for Data Warehouse. Richard J. Kachur. Published in DM Review Online in March 2000
  9. The Data Warehouse Lifecycle Toolkit (1 skyrius). Ralph Kimball, Laura Reeves, Margy Ross, Warren Thornthwaite
  10. Introduction to OLAP (A beginner’s guide to OLAP & the concepts behind it). Seagate Info Technical Roadmap Series. Crystal decisions.
  11. Just What Are Cubes Anyway? (A Painless Introduction to OLAP Technology) Carl Dubler and Colin Wilcox, Microsoft Corporation (msdn.microsoft.com/library).
  12. A Survey on Logical Models for OLAP Databases. Panos Vassiliadis, Timos Sellis, National Technical University of Athens, Department of Electrical and Computer Engineering, Computer Science Division, Knowledge and Database Systems Laboratory.
  13. http://doc.ddart.net/mssql/sql70/agcubesstore_1.htm
  14. From Data Mining to Knowledge Discovery in Databases Usama Fayyad, Gregory Piatetsky-Shapiro, and Padhraic Smyth.
  15. Duomenų gavyba – naujas informacinių sistemų procesas. Rūta Šileikienė. Kompiuterija, 2001 m. sausis.
  16. Spredimų paramos sistemų plėtra: Informacinis aspektas. Laima Zalieckaitė, Zenonas Brazaitis. http://www.leidykla.vu.lt/inetleid/inf-mok/22/str8.html
  17. Introduction to Data Mining and Knowledge Discovery Third Edition by Two Crows Corporation
  18. H&H Technologies. Data Warehouse Lifecycle. www.h-htech.com
  19. lakids.dss.state.la.us/Documents/General/ Data%20Warehouse%20Plan.PDF
  20. www.corpinfodesigns.com/priv_docs/Dwlife.pdf
Reklama

1 mintis apie “OLAP ir duomenų saugyklos”

Parašykite komentarą

Įveskite savo duomenis žemiau arba prisijunkite per socialinį tinklą:

WordPress.com Logo

Jūs komentuojate naudodamiesi savo WordPress.com paskyra. Atsijungti / Keisti )

Twitter picture

Jūs komentuojate naudodamiesi savo Twitter paskyra. Atsijungti / Keisti )

Facebook photo

Jūs komentuojate naudodamiesi savo Facebook paskyra. Atsijungti / Keisti )

Google+ photo

Jūs komentuojate naudodamiesi savo Google+ paskyra. Atsijungti / Keisti )

Connecting to %s