Uvod v nadzorovano učenje in nenadzorovano učenje

Nadzorovano učenje in nenadzorovano učenje sta nalogi strojnega učenja.
Nadzorovano učenje je preprosto postopek učenja algoritma iz baze podatkov o usposabljanju. Nadzorovano učenje je mesto, kjer imate vhodne spremenljivke in izhodno spremenljivko in uporabljate algoritem za učenje funkcije preslikave od vhoda do izhoda. Cilj je približati funkcijo preslikave, tako da lahko, ko imamo nove vhodne podatke, predvidimo izhodne spremenljivke za te podatke.

Nenadzorovano učenje modelira osnovno ali skrito strukturo ali distribucijo v podatkih, da bi izvedeli več o podatkih. Nenadzorovano učenje je tam, kjer imate samo vhodne podatke in nobene ustrezne izhodne spremenljivke.

Nabor podatkov o usposabljanju: Nabor primerov, ki se uporabljajo za učenje, kjer je znana ciljna vrednost.

Primerjava med osebami med nadzorovanim učenjem in nenadzorovanim učenjem (Infographics)

Spodaj je zgornja primerjava med nadzorovanim učenjem in nadzorovanim učenjem

Ključne razlike med nadzorovanim učenjem in nadzorovanim učenjem

Spodaj so seznami točk, opišite ključne razlike med nadzorovanim učenjem in nadzorovanim učenjem

1. algoritmi strojnega učenja odkrivajo vzorce v velikih podatkih. Te različne algoritme lahko razvrstimo v dve kategoriji na podlagi načina, kako se naučijo podatkov, da bi lahko predvideli. To je nadzorovano in nenadzorovano učenje.

2. Znanstvenik pri nadzorovanem učenju deluje kot vodilo za učenje algoritma, katere zaključke ali napovedi naj bi izoblikoval. Pri nenadzorovanem učenju ni pravilnega odgovora, učitelja ni, algoritmi so prepuščeni svojim, da odkrijejo in predstavijo zanimivo skrito strukturo v podatkih.

3. Nadzorovani model učenja bo uporabil podatke o usposabljanju za učenje povezave med vhodi in rezultati.

4. Nenadzorovano učenje ne uporablja izhodnih podatkov. Pri nenadzorovanem učenju njihovo "predhodno znanje ne bo" označeno, medtem ko bo pri nadzorovanem učenju dostop do oznak in predhodno znanje o naborih podatkov

5. Nadzorovano učenje: Ideja je, da se usposabljanje lahko posploši in da se lahko model uporablja z novimi podatki z nekaj natančnosti.

6. Nadzorovani algoritmi učenja: Podporni vektorski stroj, Linearna in logistična regresija, Nevronska mreža, Klasična drevesa in naključni gozd itd.

7. Nenadzorovane algoritme lahko razdelimo na različne kategorije: algoritmi grozdov, K-sredstva, Hierarhično združevanje, Algoritmi za zmanjševanje dimenzij, Zaznave nepravilnosti itd.

8. Razvrščeni in regresijski algoritmi, ki se pogosto uporabljajo pri nadzorovanem učenju. Podporni vektorski stroji (SVM) so nadzorovani modeli strojnega učenja s pripadajočimi algoritmi učenja, ki jih je mogoče uporabiti za namene klasifikacije in regresije, večinoma pa jih uporabljamo za težave s klasifikacijo.

9. V SVM modelu vsak podatek podatkov narišemo kot točko v n-dimenzionalnem prostoru (kjer je n lastnosti, ki jih imamo), pri čemer so vrednosti vsake lastnosti vrednost določene koordinate. Nato je razvrščanje izvedeno z iskanjem hiperplane, ki ločuje oba razreda.

10. Glavni cilj regresijskih algoritmov je predvideti diskretno ali nadaljevalno vrednost. V nekaterih primerih lahko predvideno vrednost uporabimo za prepoznavanje linearnega razmerja med atributi. Na podlagi regresijskih algoritmov razlike v težavah lahko uporabimo. Nekateri osnovni regresijski algoritmi so linearna regresija, polinomna regresija itd.

11.Kluster se pogosto uporablja pri nenadzorovanem učenju. Grozd je naloga razdelitve podatkovnih točk na število skupin, tako da bodo iste točke lastnosti skupaj v obliki grozda. Obstaja več številnih algoritmov združevanja; med njimi so nekateri modeli povezovanja, centriroidni modeli, modeli distribucije in modeli gostote.

12.Hierarhično združevanje spada pod nenadzorovano učenje. Hierarhično združevanje, kot že ime pove, je algoritem, ki gradi hierarhijo grozdov. Ta algoritem se začne z vsemi podatkovnimi točkami, dodeljenimi lastni skupini. Nato se dva najbližja grozda združita v isti grozd. Na koncu se ta algoritem konča, ko ostane samo en grozd.

13.KMeans spada pod nenadzorovano metodo združevanja. Podatki bodo razdeljeni na k skupine, glede na njihove značilnosti. Vsaka skupina je predstavljena s svojim centroidom, ki je opredeljen kot središče točk v grozdu. KMeans je preprost in hiter, vendar ne prinese enakega rezultata pri vsaki vožnji.

14.Da bi bolje razumeli nadzorovano učenje in nenadzorovano učenje, vzemimo primere iz resničnega življenja. Nadzorovano učenje: Vzemimo za primer eno od Gmailovih funkcij, to je neželena pošta. Na podlagi preteklih informacij o neželeni e-pošti, filtriranju novega dohodnega e-poštnega sporočila v mapo »Prejeto« ali »Neželena pošta«. V tem scenariju Gmail modelira funkcijo preslikave za ločevanje dohodne pošte na podlagi predhodnega znanja o pošti, to je nadzorovano učenje.

15. Nenadzorovano učenje: Predpostavimo, da vas prijateljica povabi na njeno zabavo, kjer spoznate nove ljudi. Zdaj jih boste razvrstili brez predhodnega znanja (Nenadzorovano učenje) in ta razvrstitev bi lahko bila na kateri koli lastnosti. To je lahko starostna skupina, spol, oblačenje, izobrazba ali kakršen koli način. Ker niste uporabili nobenega predhodnega znanja o ljudeh in jih razvrstili, je to pod nenadzorovanim učenjem.

Tabela primerjanega učenja nad nadzorovanim učenjem

Nadzorovano učenjeNenadzorovano učenje

Metoda

Podane bodo vhodne spremenljivke in izhodne spremenljivke.Navedeni bodo samo vhodni podatki

Cilj

Nadzorovan učni cilj je določiti funkcijo tako dobro, da lahko ob novih danih vhodnih podatkih napoveduje rezultat.Nenadzorovani učni cilj je modelirati skrite vzorce ali osnovno strukturo v danih vhodnih podatkih, da bi se naučili o podatkih.

Razred

Težave s strojnim učenjem, pridobivanje podatkov in nevronsko omrežje,Strojno učenje, rudarjenje podatkov, težave in nevronsko omrežje

Primeri

  • Razvrstitev
  • Regresija
  • Linearna regresija
  • Podporni vektorski stroj
  • Grozd
  • Združenje
  • k-pomeni
  • Združenje
Kdo uporabljaPodatkovni strokovnjakiPodatkovni strokovnjaki

Ekosistemi

Obdelava velikih podatkov, pridobivanje podatkov itd

Obdelava velikih podatkov, pridobivanje podatkov itd

Uporaba

Nadzorno učenje se pogosto uporablja za izvozne sisteme za prepoznavanje slike, prepoznavanje govora, napovedovanje, finančno analizo in usposabljanje nevronskih mrež in dreves odločitev itd.

Nenadzorovani algoritmi učenja se uporabljajo za predhodno obdelavo podatkov, med raziskovalno analizo ali za predhodno usposabljanje nadzorovanih algoritmov učenja.

Zaključek - Nadzirano učenje v primerjavi z nenadzorovanim učenjem

Izbira za uporabo nadzorovanega ali nenadzorovanega algoritma strojnega učenja je običajno odvisna od dejavnikov, povezanih s strukturo in obsegom vaših podatkov ter primerom uporabe. V resnici večinoma podatkovni znanstveniki za reševanje primerov uporabljajo skupaj pristope nadzorovanega učenja in nenadzorovanega učenja.

Priporočeni članek

To je vodnik za nadzorovano učenje proti nenadzorovanemu učenju, njihov pomen, primerjava med seboj, ključne razlike, primerjalna tabela in zaključek. Če želite izvedeti več, si oglejte tudi naslednje članke -

  1. Najboljša 7 primerjava med nadzorovanim učenjem in krepitvijo učenja
  2. 5 Najbolj uporabna razlika med podatkovnim znanjem in strojnim učenjem
  3. Naučite se 10 najboljših razlik med zmanjšanjem zemljevida in preje
  4. MapReduce vs Apache Spark - 20 uporabnih primerjav za učenje
  5. Kaj je okrepitev učenja?

Kategorija: