Uvod v tabelo dimenzij

Tabela dimenzij je v shemi zvezda ali snežinka. Tabele dimenzij 'pomagajo opisati dimenzije, tj. Vrednosti dimenzij, atribute in ključe. Na splošno je majhne velikosti. Velikost se lahko giblje od nekaj do tisoč vrstic. Opisuje predmete v tabeli dejstev. Tabela dimenzij se nanaša na zbiranje ali skupino informacij, povezanih s katerim koli merljivim dogodkom. Predstavljajo jedro za dimenzijsko modeliranje. Vsebuje stolpec, ki se lahko šteje za stolpec s primarnim ključem, ki pomaga enotno prepoznati vsako dimenzijsko vrstico ali zapis. S to tipko se povezuje s tabelami dejstev. Ko je ustvarjen ključ, imenovan nadomestni ključ, ki je sistemsko ustvarjen, se uporablja za enolično prepoznavanje vrstic v dimenziji.

Zakaj moramo uporabljati?

  • Njegova pomoč pri shranjevanju zgodovine informacij ali dimenzijskih informacij.
  • To je enostavno razumeti kot normalizirane tabele.
  • V tabelo je mogoče dodati več stolpcev, ne da bi to vplivalo na obstoječe aplikacije, ki te uporabljajo.

Vrste tabel dimenzij

Sledijo različne vrste tabele dimenzij:

1. SCD (počasi spreminjanje dimenzij)

Atributi dimenzij, ki se ponavadi počasi spreminjajo s časom in ne spreminjajo v rednem časovnem intervalu, imenujemo počasi spreminjajoče se dimenzije. Na primer, da se spremenijo naslov in telefonska številka, vendar ne redno. Poglejmo primer moškega, ki potuje v različne države, zato mora spremeniti svoj naslov glede na to državo. To je mogoče storiti na tri načine:

Type1: Prepišite prejšnjo vrednost. Ta metoda je enostavna za uporabo in pomaga prihraniti prostor in tako zmanjšati stroške. Toda zgodovina je v tem scenariju izgubljena.

Tabela pred spremembo

IDNAMEDRŽAVANACIONALNOST
1001RachelIndijaIndijski

Tabela po spremembi

IDNAMEDRŽAVANACIONALNOST
1001RachelKitajskaIndijski

Tip2: z novo vrednostjo dodajte novo vrstico. Pri tej metodi se zgodovina shrani in jo lahko uporabimo, kadar je to potrebno. Vendar je potreben velik prostor, zato poveča stroške.

Tabela pred spremembo

IDNAMEDRŽAVANACIONALNOST
1001RachelIndijaIndijski

Tabela po spremembi

IDNAMEDRŽAVANACIONALNOST
1001RachelIndijaIndijski
1001RachelKitajskaIndijski

Tip 3: Dodajte nov stolpec. To je najboljši pristop, saj je zgodovino mogoče enostavno vzdrževati.

Tabela pred Change

IDNAMEDRŽAVANACIONALNOST
1001RachelIndijaIndijski

Tabela za spremembo

IDNAMEDRŽAVASTARA DRŽAVANACIONALNOST
1001RachelKitajskaIndijaIndijski

2. Konformirana dimenzija

Ta razsežnost je deljena med več predmetnih področij ali podatkovnih podatkov. Enako je mogoče uporabiti v različnih projektih, ne da bi pri tem nastale kakršne koli spremembe. To se uporablja za ohranjanje doslednosti. Konformirane dimenzije so tiste, ki so popolnoma enake ali pravilna podvrsta katere koli druge dimenzije.

3. Neželena dimenzija

Neizmerna dimenzija je skupina lastnosti nizke kardinalnosti. Vsebuje različne ali različne atribute, ki niso povezani z nobenim drugim atributom. Z njimi se lahko uporablja RCD (hitro spreminjajoča se dimenzija), kot so zastave, uteži itd.

4. Degeneriraj dimenzijo

V atributih, ki so shranjeni v sami tabeli dejstev in ne kot ločena tabela dimenzij, se ti atributi imenujejo degenerirana dimenzija. Na primer številka vozovnice, številka računa, številka transakcije itd.

5. Roleplay dimenzija

Imajo več odnosov s tabelo dejstev imenujemo razsežnost igranja vlog. Z drugimi besedami, ko se isti dimenzijski ključ z vsemi povezanimi atributi pridruži številnim predstavljenim tujim ključem v tabeli dejstev. V isti obstoječi bazi podatkov lahko izpolni več namenov.

Kako deluje v skladišču podatkov?

  • Dimenzija se nanaša na zbiranje ali skupino informacij, povezanih s katerim koli merljivim dogodkom. Predstavljajo jedro za dimenzijsko modeliranje. Ko se ustvari dimenzija, se ustvari struktura projekta. Ustvarjeno je mogoče uporabiti v različnih projektih in odraža idejo o ponovni uporabi. Ko se v katerem koli od njih spremeni, se njen učinek odrazi samo v tej določeni tabeli. Ko je treba ustvariti poročilo, lahko uporabnik podatke vzame iz tabel dimenzij, ki vsebujejo vse potrebne informacije.
  • Pri izvajanju dimenzijskega modeliranja se atomski podatki naložijo v dimenzijske strukture. Nato so dimenzijski modeli ustvarjeni ali zgrajeni okoli poslovnih procesov. Pri ustvarjanju morate imeti v mislih filtriranje domenskih vrednosti in shranjevanje oznak poročil. Zagotoviti je treba, da je med izdelavo tabele z dimenzijami treba uporabiti nadomestni ključ (sistemsko ustvarjen ključ, ki se uporablja pri ustvarjanju tabele dimenzij, ki pomaga enotno prepoznati vsak zapis v tabeli z dimenzijami.) Treba jih je denormalizirati, ker je njihova naloga omogočiti uporabniku enostavno in učinkovito analiziranje podatkov, ne pa upravljanje transakcij. Glavni cilj dimenzije je zagotoviti filtriranje, izvajanje skupin in učinkovito označevanje.

Prednosti

Spodaj so različne prednosti tabele dimenzij:

  • Ima preprosto strukturo.
  • To je enostavno analizirati in razumeti.
  • Denormalizirani podatki.
  • Pomaga pri ohranjanju zgodovinskih informacij za katero koli razsežnost.
  • Enostavno pridobivanje podatkov iz njega.
  • Hitro ustvarjanje in izvajanje.
  • Daje kontekst, v katerem koli poslovnega procesa.

Zaključek - Tabela dimenzij

To je sestavni del modeliranja podatkov. Uporablja se v shemi zvezd ali snežinke. Vsebuje dimenzije, ključe in vrednosti atributov tabele dejstev. Obstajajo različne vrste, ki se uporabljajo v različnih scenarijih.

Priporočeni članki

To je vodnik po tabeli dimenzij. Tu smo razpravljali o vrstah, kako tabela dimenzij deluje v podatkovnem skladišču s prednostmi. Obiščite lahko tudi druge naše sorodne članke, če želite izvedeti več -

  1. Tabela dejstev v primerjavi s tabelo dimenzij
  2. Kaj je tabela dejstev?
  3. Kaj je Tableau?
  4. Podatkovno mešanje v Tableau

Kategorija: