Uvod v nenadzorovano strojno učenje

Ste že kdaj razmišljali o tem, kako lahko otrok razlikuje med jabolki in pomarančami, ko ne ve, kakšna so v resnici, kako imajo okus, ampak glede na barvo in velikost jih lahko razdeli v dve skupini brez predhodnih informacij? Ali lahko od podatkov o barvi in ​​velikosti pričakujemo enako segmentacijo kot otrok. Poglejmo, kako to lahko storimo! V tej temi bomo spoznali nenadzorovano strojno učenje.

"Strojno učenje" kot izraz nakazuje, da učimo stroje za opravljanje človeško podobnih nalog in kako se ljudje učijo, od nekoga ali z opazovanjem. Tako kot ljudje, način učenja stroja.

Strojno učenje lahko razdelimo na 3 dele: -

  1. Nadzorovano učenje
  2. Nenadzorovano učenje
  3. Okrepitveno učenje

Vrste strojnega učenja

Okrepitveno učenje je učenje na podlagi agentov, ki vključuje nagrajevanje in kaznovanje zaradi dejanj, ki jih izvede agent. Končni cilj je maksimirati skupno nagrado v procesu učenja iz okolja.

Če imate vhodno-izhodne podatke, na kratko označene podatke, na primer glede na višino in težo, s katerimi lahko ugotovite, ali je človek moški ali ženska, se lahko šteje za nadzorovano učno nalogo (od nekoga v primeru ljudi).

Toda v številnih resničnih scenarijih ta označeni podatki niso vedno na voljo. Velikokrat se srečujemo s težavami segmentiranja objektov na podlagi njihovih lastnosti, ki niso izrecno omenjene. Kako rešiti to težavo? No, nenadzorovano učenje je rešitev.

Wikipedia pravi, da je nenadzorovano učenje vrsta samoorganiziranega učenja hebbovcev, ki pomaga najti prej neznane vzorce v naboru podatkov brez že obstoječih oznak. Pri nenadzorovanem učenju nimamo nobenih informacij o oznakah, vendar kljub temu želimo pridobiti vpogled v podatke, ki temeljijo na različnih lastnostih.

Vrste nenadzorovanega strojnega učenja

Nenadzorovane učne naloge lahko na splošno razdelimo v 3 kategorije:

  1. Pridružitveno pravilo rudarjenja
  2. Grozd
  3. Sistem priporočil

1. Pridružitveno rudarjenje

Kadar imamo podatke o transakciji za nekaj, gre lahko za prodane izdelke ali kakršne koli transakcijske podatke v zvezi s tem, želim vedeti, ali obstaja kakšen skriti odnos med kupcem in izdelkom ali izdelkom do izdelka, tako da lahko nekako izkoristim te podatke povečati prodajo. Pridobivanje teh odnosov je jedro Pridružitvenega rudarjenja. Za črpanje odnosov lahko uporabimo algoritme rasti AIS, SETM, Apriori, FP.

2. Grozdanje

Na gručiranje je mogoče narediti vse podatke, kjer nimamo podatkov o razredu ali nalepkah. Podatke želimo razvrstiti tako, da opazovanja s podobnimi lastnostmi pripadajo istemu grozdu / skupini, medkrakovna razdalja pa mora biti največja. Ker bi morala biti razdalja znotraj grozda minimalna. Podatke volivcev lahko zložimo tako, da ugotovimo mnenje o vladi ali izdelke v grozdu glede na njihove značilnosti in uporabo. Prebivalstvo po odsekih na podlagi dohodkovnih značilnosti ali uporabe skupin v prodaji in trženju.

Uporabimo lahko K-Means, K-Means ++, K-Medoids, Fuzzy C-sredstva (FCM),

Pričakovanje-maksimizacija (EM), aglomerativno grozdenje, DBSCAN, vrste hierarhične gruče kot enojna povezava, popolna povezava, srednja povezava, algoritmi Ward-ove metode za združevanje.

3. Priporočilni sistem

Priporočilni sistem je v bistvu podaljšek Pridružitvenih pravil rudarjenja v smislu, v ARM-ju pridobivamo razmerja in v Priporočnem sistemu uporabljamo ta razmerja, da priporočamo nekaj, kar ima končni uporabnik večje možnosti sprejemanja. Priporočljivi sistemi so pridobili na priljubljenosti, potem ko je Netflix leta 2009 razglasil glavno nagrado v višini 1.000.000 USD.

Priporočevalni sistemi delujejo na transakcijskih podatkih, naj gre za finančne transakcije, e-poslovanje ali transakcije z živili. Dandanes velikanski igralci v industriji e-trgovine privabljajo kupce tako, da za vsakega uporabnika pripravijo prilagojeno priporočilo, ki temelji na njihovi pretekli zgodovini nakupov in podobnih podatkih o nakupu drugih uporabnikov.

Metode za razvoj priporočilnih sistemov lahko na splošno delimo na kolaborativno filtriranje in filtriranje na podlagi vsebine. V kolaborativnem filtriranju imamo znova uporabniško-skupinsko filtriranje in skupinsko filtriranje v predmetih, ki sta pomnilniško zasnovana pristopa, matrična faktorizacija in dekompozicija vrednosti singularne vrednosti (SVD) pa sta zasnovana na modelu.

Uporaba nenadzorovanega učenja

Ker se svetovni podatki vsak dan izjemno povečujejo, ima nenadzorovano učenje številne aplikacije. Podatke vedno ustvarjamo s platformami družbenih medijev ali kakšno video vsebino na YouTubu, velikokrat pa tudi namerno ne. Vsi ti podatki so nestrukturirani in označevanje za nadzorovane učne naloge bo naporno in drago.

Sledi nekaj kul aplikacij nenadzorovanega strojnega učenja.

  1. Trgovina z živili ali trgovina / tržnica e-trgovine: Pravila združenja izvlečkov iz transakcijskih podatkov o kupcih in priporočila potrošnikom za nakup izdelkov.
  2. Platforma socialnih medijev: izvlečite odnose z različnimi uporabniki in predlagajte izdelke ali storitve. Priporočite nove ljudi za družabno povezovanje.
  3. Storitve: Priporočila potovalnih storitev, priporočilo hiš za najem ali povezovanje storitev.
  4. Bančništvo: grozdne stranke na podlagi njihovih finančnih transakcij. Goljufivna transakcija grozda za odkrivanje goljufij.
  5. Politika: Mnenja volivcev grozdov o možnostih za zmago določene stranke.
  6. Vizualizacija podatkov: S povezovanjem v skupine in t-distribuiranim stohastičnim sosedskim vdelovanjem (t-SNE) lahko vizualiziramo podatke velike dimenzije. To lahko uporabite tudi za zmanjšanje dimenzij.
  7. Zabava: Priporočila za filme, glasbo, kot to počneta Netflix in Amazon.
  8. Segmentacija slike: razdelki slik v gruči na podlagi najbližjih vrednosti pikslov.
  9. Vsebina: prilagojeni časopisi, priporočila spletnih strani, aplikacije za e-učenje in filtri za e-pošto.
  10. Strukturno odkritje: Z združevanjem lahko odkrijemo katero koli skrito strukturo podatkov. Podatki o twitterju grozda za analizo občutkov.

Zaključek

Nenadzorovano strojno učenje ni preveč merljivo, vendar lahko reši veliko težav, pri katerih nadzorovani algoritmi ne uspejo. Na številnih področjih, kjer imamo nestrukturirane in neoznačene podatke, obstaja veliko aplikacij za nenadzorovano učenje. Lahko uporabimo nenadzorovane tehnike učenja, da svoje stroje naučimo narediti boljše delo od nas. V zadnjih letih so stroji prekašali človeka v zvezi z nalogami, za katere velja, da jih stoletja rešujejo ljudje. Upam, da ste s tem člankom razumeli, kaj je in kako se lahko nadzorovane tehnike strojnega učenja uporabljajo za reševanje problemov v resničnem svetu.

Priporočeni članki

To je vodnik za nenadzorovano strojno učenje. Tukaj obravnavamo vrste strojnega učenja in vrste nenadzorovanega strojnega učenja skupaj z njegovimi aplikacijami. Za več informacij si lahko ogledate tudi naslednje članke -

  1. Algoritmi strojnega učenja
  2. Kaj je strojno učenje?
  3. Uvod v strojno učenje
  4. Orodja za strojno učenje
  5. Grozd v strojnem učenju
  6. Strojno učenje hiperparametrov
  7. Hierarhični algoritem grozda
  8. Hierarhična gruča | Aglomerativno in delitveno grozdenje
  9. Top 8 stopenj življenjskega cikla strojnega učenja

Kategorija: