Kaj je Data Mart? - Vrste, značilnosti in koraki za implementacijo podatkovne mar

Kazalo:

Anonim

Uvod v Data Mart

Svet postaja vse več številk in vsaka organizacija ustvari več petabajtov podatkov. Data Mart je ena takih razvrstitev podatkov iz podatkovnega skladišča, kjer je koncentracija na en predmet.

Lahko rečemo, da gre za podatke o enem posebnem oddelku ali kategoriji, kot so prodaja, finance ali trženje itd. V osnovi gre za podmnožico skladiščenja podatkov. Ker obstaja koncentracija na določene predmete ali oddelek, lahko rečemo, da je njen vir omejen ali pa je odvisen od zelo malo virov.

Data Mart v primerjavi s skladiščem podatkov

Skladišče podatkov je skladišče z zbirko podatkov iz več tokov predmeta. Z vzdrževalnim in nadzornim delom, kot je zbiranje neobdelanih podatkov in njihova obdelava, v glavnem skrbijo IT skupine za korporativno informacijsko tehnologijo, ki matičnim organizacijam zagotavljajo različne storitve.

Podatkovno skladišče se imenuje tudi centralno ali poslovno podatkovno skladišče. Torej bo vir v podatkovno skladišče več v nasprotju s podatkovnim poljem, ki je v nekaterih primerih podsklop podatkovnega skladišča.

Vrste podatkov Mart

Običajno obstajajo tri vrste podatkovnih podatkov. To so:

1. Odvisna shramba podatkov

Odvisen podatkovni niz je izključno iz podatkovnega skladišča in vsi združeni odvisni člani bodo tvorili skladišče podatkov podjetja. Je zgolj podskup podatkovnih skladišč, saj je ustvarjen iz osrednje DW.

Ker so čisti in povzeti podatki že prisotni v centralnem podatkovnem skladišču podatkov ETT ali Extract Transform and Transport je poenostavljeno. Tu moramo le določiti določeno podskupino in nad njo opraviti ETT.

Ti podatki so ponavadi izdelani za doseganje boljše razpoložljivosti in večjih zmogljivosti z boljšim nadzorom in učinkovitostjo.

2. Neodvisni podatki Mart

To ni ustvarjeno iz osrednjega podatkovnega skladišča, vir tega pa je lahko drugačen. Ker so podatki iz osrednjega DW ETT procesa, je malce drugačen.

Večino neodvisnih podatkovnih podatkov uporablja manjša skupina organizacij, vir tega pa je tudi omejen. Prostor neodvisnih podatkov na splošno nastane, ko moramo rešiti v razmeroma krajšem časovnem obdobju.

3. Hibridni podatkovni Mart

Hibridni mart podatkov vam bo omogočil, da podatke razvrstite iz vseh drugih virov, razen iz centralnega skladišča podatkov DW. Ko se ukvarjamo z ad hoc integracijo, bo to zelo koristilo vrhunskemu delu na vseh izdelkih, ki so jih organizacije dodale zunaj.

Značilnosti Data Mart

Spodaj je nekaj značilnosti podatkovnega mapa:

  • Ker je vir podatkov koncentriran na predmet, se odzivni čas uporabnika poveča z njegovo uporabo.
  • Za pogosto zahtevane podatke bo uporaba podatkovnih podatkov koristna, saj je podnastavljena na centralno DW in bo zato velikost podatkov manjša.
  • Ker je obseg podatkov omejen, bo čas obdelave v primerjavi s centralnimi Dws precej zmanjšan.
  • Ti so v osnovi prilagodljivi in ​​lahko v primerjavi s podatkovnim skladiščem sprejmejo spremembe modela precej hitro in učinkovito.
  • Datamart potrebuje v nasprotju s podatki v skladišču enega strokovnjaka, ki ga obravnava, v strokovnih skladiščih. Zaradi tega pravimo, da je podatkovni podatkov bolj okreten.
  • Dostopne kategorije lahko ločimo na nizko raven s particioniranimi podatki in s podatkovnim poljem, zelo enostavno je.
  • Odvisnost od infrastrukture je precej omejena, podatki pa se lahko segmentirajo na različnih platformah strojne opreme.

Koraki za uvajanje podatkov Mart

Spodaj so navedeni koraki, ki so potrebni za njegovo izvajanje.

1. Oblikovanje

To bo prvi korak pri izvajanju, kjer bodo opredeljene vse potrebne naloge in viri za zbiranje tehničnih in poslovnih informacij. Kasneje se logični načrt izvede in po pregledu se ta pretvori v fizični načrt. Prav tako se tukaj odloča o logični in fizični strukturi podatkov, na primer o tem, kako razdeliti podatke in polje particije, kot so datum ali katera koli druga datoteka.

2. Gradnja

To je druga faza implementacije, kjer so bile s pomočjo RDBMS ustvarjene fizične baze podatkov, ki so bile določene kot del procesa načrtovanja in logičnih struktur. Ustvarjajo vsi predmeti, kot so shema, indeksi, tabele, pogledi itd.

3. Prebivalstvo

To je tretja faza in podatki se v njej nabirajo po pridobivanju podatkov. Vse potrebne preobrazbe se izvedejo pred nabiranjem podatkov na njih.

4. Dostopanje

To je naslednji korak izvajanja, pri katerem bomo naseljene podatke uporabili za poizvedovanje za ustvarjanje poročil. Končni uporabnik uporabi ta korak za razumevanje podatkov s poizvedbami.

5. Upravljanje

To je zadnja faza izvajanja podatkovnega polja in tukaj so poskrbljene različne naloge, kot so upravljanje dostopa, optimizacija sistema in uglaševanje, upravljanje in dodajanje svežih podatkov v podatkovni scenarij ter načrtovanje obnovitvenih scenarijev za obravnavo vseh primerov neuspeha.

Prednosti Data Mart

Sledijo nekatere prednosti njegove uporabe.

  • Je ena izmed najbolj stroškovno najučinkovitejših možnosti za podatkovno skladišče, kjer morate delati le na majhnem segmentu podatkov.
  • Z ločevanjem podatkov iz virov bo podatkovno poročilo učinkovito, saj lahko določena skupina ljudi podatke uporablja iz določenega vira, namesto da vsi uporabljajo podatkovno skladišče.
  • Hitrejši dostop do podatkov je mogoč z uporabo podatkovnega polja, če vemo, do katere podmnožice potrebujemo dostop.
  • Datamart je veliko lažji za uporabo, tako da lahko končni uporabniki preprosto poizvedujejo po njih.
  • Do podatkovnega časa za izvedbo je potrebno manj časa v primerjavi s skladiščem podatkov, saj so podatki ločeni v skupinah.
  • Za enostavno analizo trendov je mogoče uporabiti pretekle podatke iz posameznega predmeta.

Zaključek

Ker je osredotočena na eno samo funkcionalno območje, ima številne prednosti tako za izvajalca procesov kot za končnega uporabnika. Zato je potrebna učinkovita izvedba trgov, skupaj s skladiščem podatkov v organizaciji.

Priporočeni članki

To je vodnik za Kaj je podatkovni Mart. Tukaj razpravljamo o uvodu, funkcijah in najboljših 3 vrstah, skupaj z njegovimi značilnostmi in koraki. Če želite izvedeti več, si oglejte tudi naslednje članke -

  1. Oracle skladiščenje podatkov
  2. R podatkovne vrste
  3. Vrste podatkov Python
  4. Cassandra Podatkovno modeliranje
  5. Celoten vodnik po podatkovnem modelu v Cassandri