10 bistvenih vprašanj za intervju z analitičnimi podatki (Posodobljeno za 2019)

Kazalo:

Anonim

Uvod v Intervju Vprašanja in odgovori za analitiko podatkov

Torej ste končno našli svojo sanjsko zaposlitev v storitvi Data Analytics, vendar se sprašujete, kako polomiti intervju s podatki iz leta 2019 in kaj bi lahko bila verjetna vprašanja o intervjuju s podatki o storitvi Data Analytics. Vsak intervju s podatki v storitvi Data Analytics je drugačen in tudi obseg dela. Upoštevajoč to, da smo zasnovali najpogostejša vprašanja in odgovore v zvezi z analitiko podatkov, ki vam bodo pomagali do uspeha v intervjuju s podatki o storitvi Data Analytics.

Spodaj je najboljših vprašanj v zvezi z intervjuji za leto 2019, ki so večinoma zastavljena v intervjuju

1. Kakšna je razlika med podatkovnim rudarjenjem in analizo podatkov?

Odgovor:

Data MiningAnaliza podatkov
Za rudarjenje podatkov ni potrebna hipotezaAnaliza podatkov se začne s hipotezo.
Data Mining zahteva čiste in dobro dokumentirane podatke.Analiza podatkov vključuje čiščenje podatkov.
Rezultatov podatkovnega rudarjenja ni vedno enostavno razlagati.Analitiki podatkov interpretirajo rezultate in jih predstavijo deležnikom.
Algoritmi za pridobivanje podatkov samodejno razvijejo enačbe.Analitiki podatkov morajo razviti lastne enačbe.

2. Navedite, kateri so različni koraki v projektu analitike?

Odgovor:
Analiza podatkov se ukvarja z zbiranjem, čiščenjem, preoblikovanjem in modeliranjem podatkov za pridobitev dragocenega vpogleda in podporo boljšemu odločanju v organizaciji. V postopku analize podatkov so naslednji koraki:

Raziskovanje podatkov - Ko je preučil poslovni problem, mora podatkovni analitik analizirati osnovni vzrok težave.
Priprava podatkov - V tem koraku postopka analize podatkov najdemo napake podatkov, kot so manjkajoče vrednosti znotraj podatkov.
Modeliranje podatkov - Korak modeliranja se začne po pripravi podatkov. Modeliranje je iterativni postopek, pri katerem se model za izboljšanje izvaja večkrat. Modeliranje podatkov zagotavlja najboljši možni rezultat za poslovne težave.
Validacija - V tem koraku se model, ki ga ponuja stranka, in model, ki ga je razvil analitik podatkov, validirata drug proti drugemu, da ugotovimo, ali bo razviti model izpolnjeval poslovne zahteve.
Izvajanje modela in sledenje - V tem zadnjem koraku izvajate model analize podatkov in po tem sledite, da se zagotovi pravilno izvajanje modela ali ne?

3.Kaj je odgovoren analitik podatkov?

Odgovor:
• Odpravite težave, povezane s podjetjem, za stranke in izvedite postopke za nadzor podatkov.
• Razlaga podatkov s statističnimi tehnikami.
• Opredelite področja za priložnosti za izboljšanje.
• Analizirajte, prepoznajte in razlagajte trende ali vzorce v kompleksnih zbirkah podatkov.
• Pridobite podatke iz primarnih ali sekundarnih virov.
• Vzdrževanje baz podatkov / podatkovnih sistemov.
• Poiščite in odpravite težave s kodo z uporabo kazalnikov uspešnosti.
• Zavarovanje baze podatkov z razvojem sistema dostopa.

4.Kaj so trki mize? Kako se temu izognemo?

Odgovor:
Trk heš tabele se zgodi, ko dva različna ključa uskladita z isto vrednostjo. Obstaja veliko tehnik, kako se izogniti trčenju hash mize, tukaj navajamo dve:
Ločeno vezanje: Uporablja strukturo podatkov, ki se združi v isti reži, za shranjevanje več elementov.
Odprto naslavljanje: z drugo funkcijo poišče druge slote in shrani element v prvo prazno režo.

5. Seznam nekaterih najboljših orodij, ki so lahko koristna za analizo podatkov?

Odgovor:
• Tableau
• RapidMiner
• OpenRefine
• KNIME
• Googlovi iskalci
• Solver
• NodeXL
• io
• Wolfram Alpha
• Google Fusion Tables

6. Kakšna je razlika med pridobivanjem podatkov in profiliranjem podatkov?

Odgovor:
Razlika med pridobivanjem podatkov in profiliranjem podatkov je naslednja -
• Profiliranje podatkov: cilja na takojšnjo analizo posameznih lastnosti, kot so različne cene, različne cene in njihova pogostost, pojav ničelnih vrednosti, vrsta podatkov, dolžina itd.
• Podatkovno rudarjenje: osredotoča se na odvisnosti, odkrivanje zaporedja, zadrževanje povezav med več atributi, analizo grozdov, odkrivanje nenavadnih zapisov itd.

7. Pojasnite K-srednji algoritem in hierarhični algoritem grozdanja?

Odgovor:
K-srednji algoritem - K srednja vrednost je znana metoda razdelitve. V algoritmu povprečja K so grozdi sferični, tj. Podatkovne točke v grozdu so osredotočene na to gručo. Tudi varianca grozdov je podobna, tj. Vsaka podatkovna točka pripada najbližji skupini
Hierarhični algoritem grozdanja - Hierarhični algoritem združevanja združuje in deli obstoječe skupine ter ustvarja hierarhično strukturo zanje, ki prikazuje vrstni red, v katerem so razdeljene skupine.

8.Kaj je čiščenje podatkov? Omenite nekaj najboljših praks, ki jih morate upoštevati pri čiščenju podatkov?

Odgovor:
Iz določenega nabora podatkov je izredno pomembno razvrstiti podatke, potrebne za analizo podatkov. Čiščenje podatkov je ključni korak, v katerem se podatki pregledajo, da bi našli morebitne nepravilnosti, odstranili ponavljajoče se in napačne podatke itd. Čiščenje podatkov ne vključuje odstranjevanja obstoječih informacij iz baze podatkov, temveč samo poveča kakovost podatkov, tako da jih je mogoče uporabiti za analizo .
Nekatere najboljše prakse za čiščenje podatkov vključujejo -
• Razvoj načrta kakovosti podatkov za določitev, kje prihaja do največjih napak v kakovosti podatkov, tako da lahko ocenite osnovni vzrok in načrtujete v skladu s tem.
• Sledite običajnemu načinu dokazovanja potrebnih informacij, preden jih vnesete v podatke.
• Identificirajte morebitne podvojene podatke in preverite točnost podatkov, saj boste s tem prihranili veliko časa med analizo.
• Spremljanje vseh postopkov za izboljšanje informacij, ki jih izvajate, je izjemno potrebno, da po potrebi ponovite ali odstranite vse operacije.

9.Kaj so nekatere statistične metode uporabne za analitik podatkov?

Odgovor:
Statistične metode, ki so koristne za znanstvenika podatkov so
• Bayesova metoda
• Markov postopek
• Prostorski in grozdni procesi
• Statistika uvrstitve, odstotek, odkritje zunanjih sodelavcev
• tehnike imputacije itd.
• Simplex algoritem
• Matematična optimizacija

10. Pojasnite, kaj je imputacija? Naštejte različne vrste tehnik imputacije? Katera metoda imputacije je ugodnejša?

Odgovor:
Med imputacijo imamo navadno manjkajoče informacije nadomestiti z nadomeščenimi vrednostmi. Vrste tehnik imputacije vključujejo:
• Single Imputation: Single imputation pomeni, da manjkajočo vrednost nadomesti z vrednostjo. Pri tej metodi se pridobi velikost vzorca.
• Imputacija vroče plošče: iz naključno izbranega podobnega zapisa se prikaže manjkajoča vrednost s pomočjo udarne kartice
• imputacija hladne palube: deluje enako kot imputacija vroče palube, vendar je nekoliko naprednejša in izbere donatorje iz drugih nizov podatkov
• Srednja imputacija: vključuje nadomestitev manjkajoče vrednosti s predvidenimi vrednostmi drugih spremenljivk.
• regresijska imputacija: vključuje nadomeščanje manjkajoče vrednosti s predvidenimi vrednostmi določene vrednosti, odvisno od drugih spremenljivk.
• Stohastična regresija: To je enako kot regresijska imputacija, kljub temu pa skupni regresijski variance doda v regresijsko imputacijo
• Večkratna imputacija: za razliko od enojne imputacije vrednosti večkratno oceni

Čeprav se enojna imputacija pogosto uporablja, ne odraža negotovosti, ki jo naključno manjkajo podatki. Torej je več imputacij ugodneje kot ena imputacija, če podatki naključno manjkajo.

Priporočeni članki

To je izčrpen vodnik za vprašanja o intervju v storitvi Data Analytics in odgovori, tako da lahko kandidat brez težav razreši ta vprašanja za intervju s podatki. Če želite izvedeti več, si oglejte tudi naslednje članke -

  1. 10 uporabnih agilnih vprašanj in odgovorov za intervju
  2. 8 Vprašanja za intervju z super algoritmom
  3. 25 Najpomembnejših vprašanj o intervjuju s področja računalništva
  4. 10 neverjetnih vprašanj in odgovorov za intervju z inženirjem podatkov