Uvod v shemo zvezd

Shema zvezd je najlažji pristop in dimenzijski model, pri katerem so funkcijske tabele, dimenzije in dejstva urejene organizirano in se večinoma uporabljajo v poslovni inteligenci in skladiščenju podatkov. Zvezdna shema je oblikovana tako, da vsako dejstvo razporedi z ustreznimi dimenzijami, ki so podobne zvezdi. Dejstvo je neskončen rezultat, kot so prodajni podatki in število prijav. Razsežnost je zbiranje referenčnih podatkov, vključno z dejstvi, kot so datum, podrobnosti o izdelku in kupcih. Star shema je optimizirana za ogromno podatkovnih poizvedb pri shranjevanju podatkov, spletnih analitičnih obdelavah kock podatkov in tudi ad-hoc poizvedb.

Kako ustvariti shemo zvezd?

Tu bo uporabnik ustvaril shemo zvezd s pretvorbo modela odnosa med subjekti. Modeli odnosov med entitetami so preveč zapleteni, da bi razložili funkcionalne količine in atribute, zato je poenostavljena na dimenzijsko shemo zvezd, kot sledi:

  • Poiščite postopek podjetja iz pogleda odnosa med subjekti in razumejte model, ki ga lahko razdelite na več dimenzijskih modelov. Razmerje med subjekti je sestavljeno iz poslovnih podatkov.
  • Poiščite veliko do veliko tabel v odnosih med subjekti, ki pojasnjujejo postopek podjetja in jih pretvorite v tabele realnosti dimenzijskih modelov. Ta tabela vsebuje podatke, sestavljene iz tabele dejstev in dimenzijske tabele s številskimi vrednostmi in edinstvenimi ključnimi atributi.
  • Ideja tega procesa je razlikovati tabele, ki temeljijo na izmenjavi, ali tabele, izbrisane z informacijami. Zato je treba oblikovati marsikaj do številnih odnosov. Na primer, v zbirki podatkov ERP so podatki o računih, ki so menjalna tabela. Podrobnosti, ki so posodobljene in osvežene, so tabele, ki temeljijo na izmenjavi. Zdaj, če primerjamo obe tabeli, izhaja, da so podatki resnično statični.
  • Tabela resničnosti je prikaz dimenzionalnega modela, ki prikazuje številne do številne mreže med končnimi meritvami. Posledica tega je, da tuji ključi v tabelah resničnosti delijo številne na številne, kar je števen odnos. večina tabele spada pod tabele, ki temeljijo na izmenjavi
  • Zadnji korak pri načrtovanju zvezdne sheme je de-normalizacija rezidenčnih tabel v merilne tabele. Obvezen ključ je izdelava podvojenega ključa. Ta ključ temelji na tabeli resničnosti, ki pomaga pri boljšem razumevanju. Poiščite datum in čas iz zasnove odnosa subjekta in izpolnite tabelo dimenzij. Datumi se shranijo kot datum in čas. Stolpec z dimenzijo datuma predstavlja leto, mesec ali datum ali uro

Primer: Tabela časovne dimenzije ima TIMEID, Quartername, QuarterNo, MonthName, MonthNo, DayName, DayofMonth, DayOfWeek, ki so lahko pomembni kriteriji dimenzijskih tabel. Podobno imajo vse tabele edinstven id in atribute. Poizvedbeni jeziki, kot je SQL, se lahko uporabijo za rudarjenje podatkov, skladišče podatkov in analitiko podatkov.

Sintaksa definicije kocke:

Define cube (cube-name)(dimension-list): (measure-list)

Kocke so nameščene za obravnavo opozoril na različnih ravneh, odzivni čas za odgovor na poizvedbo pa je minimalen. Na voljo je kot vnaprej izdelana zasnova in uporabna v zahtevanih situacijah. Ustvarjanje sheme Star je zelo enostavno in učinkovito uporabljati in je tudi prilagodljivo. Obvezno je dopolnjevanje tabele z dejstvi in ​​dimenzijske tabele, ki je nato zvezda in se lahko oblikuje z uporabo poizvedb SQL ali teče kode. Ta zasnova je narejena za boljše razumevanje in enostavno pridobivanje podatkov.

Značilnosti sheme zvezd

1. Zvezdna shema zagotavlja hitre združevanja in izračune, kot so skupna prodana postavka in prihodki, pridobljeni na koncu vsakega meseca. Te podrobnosti in postopek je mogoče filtrirati v skladu z zahtevami tako, da določite ustrezne poizvedbe.

2. Ima sposobnost filtriranja podatkov iz normaliziranih podatkov in zagotavljanja potreb po shranjevanju podatkov. Povezane informacije normalizirane tabele so zložene v zavihku z več dimenzijami. Za vsako tabelo dejstev se ustvari enkraten ključ za prepoznavanje vsake vrstice.

3. Tabela dejstev je meritev specifičnih dogodkov, vključno z vrednostmi končnih številk in je sestavljena iz tujih ključev, povezanih z dimenzijskimi tabelami. Ta tabela je na atomski ravni uokvirjena z vrednostmi dejstev in omogoča hranjenje več zapisov hkrati. Obstajajo tri različne vrste tabele dejstev.

4. Tabele dejstev o transakcijah sestavljajo podatke o posebnih dogodkih, kot so praznični dogodki, prodajni dogodki.

5. Zapisovanje dejstev za določena obdobja, kot so podatki o računu, na koncu vsakega četrtletja.

6. Tabele s hitrim združevanjem za določeno obdobje se imenujejo Tabele kopičenja posnetkov.

7. Dimenzijske tabele ponujajo podrobne podatke o atributih, zapise, najdene v tabeli. Tabela dimenzij ima lahko različne lastnosti. Dimenzijske tabele se uporabljajo v glavnem kot tabela in datum Tabela dimenzij, Izdelek in naročilo Dimenzijska tabela, Podrobnosti o zaposlenem in računu Dimenzijska tabela, Geografija in lokacije. Te tabele so dodeljene enemu številu celotnih podatkov, ki je dvojnik primarnega ključa.

8. Uporabnik lahko svojo mizo oblikuje v skladu z zahtevami. Na primer, če potrebuje prodajno dimenzijsko tabelo s ključem izdelka in odjemalca, datumom in časovnim ključem, ključ za ustvarjen dohodek. Če poslovnež okvirji dimenzijsko tabelo izdelka s ključnimi atributi, kot so barva, datum kupljenega izdelka, promocijski ključ in ključ stranke.

Prednosti

  • Oblikovana je s preprosto logiko in poizvedbami, ki omogočajo enostavno pridobivanje podatkov iz transakcijskega postopka.
  • Ima skupno logiko poročanja, ki se implicira dinamično.
  • Shema z zvezdicami lahko poveča zmogljivost poročanja o aplikacijah.
  • Zvezdna shema zasnovana s krmljenjem kock, ki jih uporablja spletni postopek transakcij, da bi ustvarili in omogočili učinkovito delovanje kock.

Slabosti

  • Ima visoko celovitost in visoko denormalizirano stanje. Če uporabnik ne posodobi vrednosti, se bo celoten postopek sesul. Zaščita in varnost do sedaj nista zanesljivi. Ni tako prilagodljiv kot analitični model in ne podpira svoje učinkovite podpore v mnogih odnosih.
  • Shema zvezd je nameščena v bazi podatkov za nadzor hitrejšega obnavljanja podatkov. Poizvedba je uporabljena za izbiro potreb in ne za iskanje celotne baze podatkov. Filtrirane in izbrane podatke je mogoče uporabiti v različnih primerih. Zato je ta shema zvezd preprost model, ki ga je enostavno sprejeti.

Priporočeni članek

To je vodnik za Kaj je shema zvezd? Tukaj razpravljamo o uvodu v shemo zvezd in njenih značilnostih, skupaj s prednostmi in slabostmi. Če želite izvedeti več, lahko preberete tudi druge naše predlagane članke -

  1. Pregled tabele dejstev
  2. Shema zvezd proti shemi Snowflake | Najboljše razlike
  3. Modeliranje podatkovnih skladišč s tipi
  4. AWS baze podatkov s prednostmi
  5. AWS Data Pipeline

Kategorija: