Pregled spretnosti, potrebnih za Data Scientist

Harvard Business Review je leta 2012 navedel, da je "Data Scientist najbolj seksi delo 21. stoletja". Vnaprej, da vemo, kakšne so veščine, ki so potrebne, da je podatkovni znanec, najprej poglejmo, kaj počne podatkovni znanstvenik. Podatkovnega znanstvenika lahko določimo na več načinov, vendar naj bo preprosteje povedano tako. Data Scientist je nekdo, ki zna iz podatkov pridobiti pomen in pridobiti dragocen vpogled. Delo znanstvenika, ki se ukvarja s podatki, večinoma vključuje zbiranje, čiščenje in manipuliranje s podatki.

Tehnične in netehnične spretnosti

Zdaj pa se potopimo v tehnične in netehnične veščine, ki so bistvene za podatkovnega znanstvenika.

Tehnična znanja

Tehnične veščine, ki jih potrebuje znanstvenik za podatke, so podane spodaj.

1. Sposobnost ravnanja z veliko količino podatkov

Količina ustvarjenih podatkov se v zadnjih letih eksponentno povečuje in večina je razvrščena kot nestrukturirani podatki. Nestrukturirani podatki se navadno nanašajo na podatke, ki ne prebivajo v tradicionalni bazi podatkov stolpcev vrstic, ki je ravno nasprotna strukturiranim podatkom, malo primerov nestrukturiranih podatkov so videoposnetki, fotografije, zvočna sporočila. Ker je glavna vloga podatkovnega znanstvenika pri pridobivanju pomena iz podatkov, bi bilo treba udobno obravnavati velike količine podatkov ne glede na naravo, ne glede na to, ali so strukturirani ali nestrukturirani.

2. Vizualizacija podatkov

Podatki, ki nastajajo v podjetjih, morajo biti prevedeni v obliko, ki ga je enostavno razumeti in sprejemati odločitve. Kot podatkovni znanstvenik si mora podatke omogočati vizualizacijo s pomočjo orodij, kot so Tableau, Plotly, Visual.ly, D3.js in Power BI. Pomembno je tudi, da je znanstvenik, ki se ukvarja s podatki, seznanjen z načeli vizualne združitve podatkov. To je ena od pomembnih vlog za podatkovnega strokovnjaka, saj je vizualizacija podatkov edina izbira ukrepov, ki jih podjetja lahko neposredno uporabljajo s podatki.

3. Statistika

Vloga statistike v podatkovni znanosti je zelo pomembna. Za podatkovne znanstvenike je statistika matematična disciplina, ki nudi potrebna orodja in metode za iskanje vzorcev in vpogled v zapleten nabor podatkov z izvajanjem matematičnih izračunov na njih. Ker je vloga podatkovnega znanstvenika pridobivanje pomena z identificiranjem vzorcev v podatkih, je znanje statistike ključna spretnost za podatkovnega strokovnjaka.

4. Spretnosti programiranja

Excel bi s količino podatkov, pridobljenih pred 20 leti, zadostoval za spopadanje z njimi, toda s količino strukturiranih in nestrukturiranih podatkov, ki nastaja v teh dneh, bi morali znanstveniki imeti znanje o programskih orodjih, kot so Python, R, SQL kot

  • Dajo več prostora za usposabljanje nabora podatkov z mnogimi statističnimi tehnikami
  • Izboljšajo učinkovitost postopka med analizo podatkov

5. Manipulacija podatkov

V večini primerov bodo podatki, ki jih potrebujemo, zmešani in bo znanstvenikom, ki se ukvarjajo s podatki, težko delati s tovrstnimi podatki. Po pridobitvi podatkov iz podatkovnih jezer je prvi korak odpravljanje teh nepopolnosti. Nekatere nepopolnosti vključujejo manjkajoče vrednosti, nepravilne vrvice, kot je LA za Los Angeles, oblikovanje datumov kot 10/09/2009 in 2009/09/10. Vse te nepopolnosti je treba razvrstiti pred začetkom usposabljanja ali analize podatkov.

6. Več spremenljiv izračun in linearna algebra

Razumevanje konceptov matric (linearna algebra) in diferenciacije (računanje) je pomembna veščina, ki bi jo moral imeti podatkovni znanstvenik. V organizaciji, pri kateri njeni obstoječi podatki igrajo pomembno vlogo pri prihodnjih napovedih, lahko majhne izboljšave napovedne uspešnosti ali algoritmična optimizacija za organizacijo zelo spremenijo. V začetnih fazah podatkovnega znanstvenika pri uporabi vnaprej kodiranih modelov ni treba poglobljenega razumevanja matric ali preračunavanja, ampak za razumevanje, kaj se dogaja pod pokrovom modelov, ali za izdelavo lastnih izvedb je vsekakor potrebno da bi razumeli te koncepte.

Netehniške spretnosti

Spodaj so navedena netehnična znanja, ki jih potrebuje znanstvenik za podatke.

1. Intelektualna radovednost

Medtem ko analiziramo podatke organizacije v večini primerov nihče ne bo mogel videti neposrednih rezultatov ali odgovorov. Več števila vprašanj, ki si jih začnete postavljati, več odgovorov boste razbrali iz podatkov. Na splošno je radovednost opredeljena kot močna želja, da bi nekaj razumeli. Zato je intelektualna radovednost zelo pomembna lastnost podatkovnega znanstvenika.

2. Močna poslovna pronica

Brez razumevanja podatkov organizacije ali elementov poslovnega modela vse tehnične spretnosti, ki jih ima podatkovni znanstvenik, ne bodo mogli pridobiti potrebnih rezultatov za organizacijo, saj ne bo mogel razumeti, katere značilnosti so prisotne v naboru podatkov je treba dati prednost in je treba šteti, da je zadnji. Torej, za podatkovnega strokovnjaka bo razumevanje poslovnega modela in podatkov organizacije pomagalo rešiti morebitne izzive, ki jih ima, da ohranijo in širijo svoje poslovanje.

3. Močne komunikacijske spretnosti

Kot znanstvenik, ki se ukvarja s podatki, mora pripraviti predstavitev svojih tehničnih ugotovitev in jo predstaviti netehničnim ekipam, kot so prodajni oddelki v nekem času ali v drugi karieri. Kot podatkovni znanstvenik bi moral imeti veščine, kot je pripovedovanje zgodb (sposobnost pripovedovanja zgodb iz ugotovitev), ker bo ves čas in energija, porabljena za raziskovanje podatkov, uporaba statističnih tehnik, iskanje rezultatov in vse druge stvari zaman če podatkovni znanstvenik ne more pravilno posredovati sporočil poslovnim vodjem. In v večini primerov vodstveni delavci ne bodo radi poslušali vseh korakov, ki smo jih spremljali do zaključkov, temveč bodo osredotočeni predvsem na rezultate in predstavljene vrednote. Zato je vedno najboljša praksa, da je zgodba jasna in na tekočem.

Zaključek - Spretnosti, potrebne za podatkovnega strokovnjaka

To je nekaj najpomembnejših veščin, ki bi jih človek moral imeti za podatkovnega znanstvenika, saj njihovo glavno delo vključuje delo na podatkih organizacije, njihovo analiziranje in predstavitev poslovnim vodjem.

Priporočeni članki

To je priročnik o spretnostih, potrebnih za znanstvenika podatkov. Tukaj razpravljamo o tehničnih in netehničnih veščinah, ki jih potrebuje znanstvenik za podatke. Če želite izvedeti več, lahko preberete tudi druge naše predlagane članke -

  1. Podatkovna kariera
  2. Jeziki znanosti o podatkih
  3. Plača velikih podatkov v storitvi Google Analytics
  4. Vprašanja o intervjuju z analitikom podatkov
  5. PHP Spremeni obliko datuma

Kategorija: