Razlika med Data Science in Data Mining

Data Mining govori o iskanju trendov v naboru podatkov. In s temi trendi prepoznati prihodnje vzorce. Je pomemben korak v procesu odkrivanja znanja. Pogosto vključuje analizo velike količine zgodovinskih podatkov, ki so bili prej prezrti. Podatkovna znanost je področje študija, ki vključuje vse od velike podatkovne analize, podatkovnega rudarjenja, predvidevanja, modeliranja, vizualizacije podatkov, matematike in statistike. Podatkovna znanost se imenuje četrta paradigma Science. (ostali trije so teoretični, empirični in računski). Academia pogosto izvaja ekskluzivne raziskave na področju Data Science.

Zgodovinska perspektiva

Preden preidemo na tehnične opise, si oglejmo razvoj izrazov. Zgodovinska preiskava bo razjasnila, kako se izrazi trenutno uporabljajo.

  • Beseda „Data Science“ se pojavlja okoli šestdesetih let prejšnjega stoletja, toda takrat se je uporabljala kot alternativa „Computer Science“. Trenutno ima popolnoma drugačen pomen.
  • Leta 2008 sta DJ Patil in Jeff Hammerbacher postala prva posameznika, ki sta se imenovala "Data Scientist", da bi opisala svojo vlogo na LinkedInu in Facebooku.
  • V letu 2012 je članek Harvard Business Review navedel Data Scientist kot "najbolj seksi delo 21. stoletja".
  • Izraz Data Mining se je razvijal vzporedno. V devetdesetih letih prejšnjega stoletja je med skupnostmi baz podatkov postal razširjen.
  • Data Mining je dolžan družbi KDD (odkritje znanja v bazah podatkov). KDD je postopek iskanja znanja iz informacij, ki so prisotne v bazah podatkov. In Data Mining je glavni podproces v KDD.
  • Podatkovno rudarjenje se pogosto uporablja kot zamenljiv s KDD.

Čeprav se ta imena pojavljajo samostojno, se med seboj pogosto dopolnjujejo, saj so navsezadnje tesno povezana z analizo podatkov.

Primerjava med podatki Data Science Vs Data Mining (Infographics)

Spodaj je najboljših 9 primerjav Data Science Vs Data Mining

Primer uporabe Primer

Razmislite o scenariju, kjer ste glavni trgovec v Indiji. Imate 50 trgovin, ki delujejo v 10 večjih mestih v Indiji in poslujete že 10 let.

Recimo, da želite preučiti podatke zadnjih 8 let, da bi ugotovili število prodaje sladkarij v prazničnih sezonah treh mest. Če je to vaš cilj, bi vam priporočil, da zaposlite osebo s strokovnim znanjem Data Mining. Data Miner bi verjetno šel skozi zgodovinske podatke, shranjene v starih sistemih, in uporabil algoritme za izsleditev trendov.

Razmislite o drugem primeru, v katerem želite vedeti, kateri bonboni so prejeli bolj pozitivne ocene. V tem primeru vaši viri podatkov niso omejeni na baze podatkov, lahko se razširijo na socialna spletna mesta ali povratna sporočila strank. V tem primeru bi vam predlagal, da zaposlite Data Scientist. Oseba, zaposlena kot podatkovni znanstvenik, je bolj primerna za uporabo algoritmov in izvajanje te družbeno-računske analize.

Ključne razlike med Data Science Vs Data Mining

Spodaj je razlika med podatkovno znanostjo in podatkovnim rudarjenjem naslednja

  • Podatkovno rudarjenje je dejavnost, ki je del širšega procesa odkrivanja znanja v bazah podatkov (KDD), medtem ko je Data Science študijsko področje, tako kot uporabna matematika ali računalništvo.
  • Pogosto se na Data Science gleda v širokem smislu, medtem ko Data Mining velja za nišo.
  • Nekatere dejavnosti v okviru podatkovnega rudarjenja, kot so statistična analiza, zapisovanje podatkovnih tokov in prepoznavanje vzorcev, se lahko sekajo s podatki Data Science. Zaradi tega Data Mining postane podmnožica Data Science.
  • Strojno učenje v podatkovnem rudarstvu se bolj uporablja pri prepoznavanju vzorcev, medtem ko ima v Data Science bolj splošno uporabo.

Opomba

  • Podatkovne znanosti in podatkovnega rudarjenja ne smemo zamenjati z Big Data Analytics in rudarji in znanstveniki lahko delajo na velikih zbirkah podatkov.

Tabela primerjave podatkov Science Vs Data Mining

Osnove za primerjavoData MiningData Science
Kaj je to?TehnikaObmočje
Osredotočite sePoslovni procesZnanstveni študij
CiljNaredi podatke bolj uporabneIzdelava izdelkov, osredotočenih na podatke, za organizacijo
IzhodVzorciRaznoliko
NamenIskanje trendov, ki prej niso bili znaniSocialna analiza, gradnja napovednih modelov, razkrivanje neznanih dejstev in še več
Poklicna perspektivaNekdo, ki ima znanje o krmarjenju po podatkih in statističnem razumevanju, lahko izvaja pridobivanje podatkovČlovek mora razumeti strojno učenje, programiranje, info-grafične tehnike in imeti znanje o domeni, da postane podatkovnik
ObsegRudarjenje podatkov je lahko podvrsta Data Science, saj so rudarske dejavnosti del nabora Data ScienceMultidisciplinarno - Podatkovna znanost je sestavljena iz vizualizacij podatkov, računalniških družbenih ved, statistike, podatkovnega rudarjenja, obdelave naravnega jezika in podobno
Se ukvarja z (vrsto podatkov)Večinoma strukturiranVse oblike podatkov - strukturirane, polstrukturirane in nestrukturirane
Druga manj priljubljena imenaArheologija podatkov, nabiranje informacij, odkrivanje informacij, pridobivanje znanjaZnanost, ki temelji na podatkih

Zaključek - Data Science Vs Data Mining

Torej, tukaj! Prepričan sem, da se zdaj bolj zavedate, kakšne so ključne razlike med njimi in v kakšnem kontekstu jih je treba uporabiti. Ne pozabite, da ni formalnih in natančnih definicij Data Science in Data Mining. Med akademskimi krogi in industrijo še vedno potekajo razprave o tem, kaj je natančna definicija. Vendar so vsi na isti strani glede na razlike na visoki ravni in opisov dveh pojmov, ki sva jih raziskala v tem članku.

Priporočeni članek

To je vodnik za Data Science Vs Data Mining, njihov pomen, primerjava med seboj, ključne razlike, tabela primerjave in sklep. Če želite izvedeti več, si oglejte tudi naslednje članke -

  1. Podatkovna znanost in njen vse večji pomen
  2. 7 pomembnih tehnik pridobivanja podatkov za najboljše rezultate
  3. Napovedna analitika v primerjavi z znanjem podatkov - naučite se 8 koristnih primerjav
  4. 8 Pomembne tehnike pridobivanja podatkov za uspešno poslovanje

Kategorija: