Grozd v strojnem učenju - Najbolj priljubljene metode in aplikacije

Kazalo:

Anonim

Uvod v grozd v strojnem učenju

Najprej bomo razumeli strojno učenje. Vidimo, da podatki hitro rastejo okoli nas. Podatki so v različnih oblikah, kot so video, avdio, slike itd. Grozdanje v strojnem učenju te podatke uporabi za odgovor na vprašanje. Na primer (odkrivanje kožne bolezni) bo zdravnik s strojnim učenjem razumel znamko na koži in predvidel, za kakšno bolezen gre. Grozd ni nič drugega kot združevanje neoznačenih nizov podatkov. Vzemimo primer vašega filma (ki si ga želite ogledati). Morda boste radi romantični filmi, toda vaša sestra ima rada komedija. Morda vam bodo všeč bollywoodski romantični filmi ali hollywoodski romantični filmi. Toda vaša sestra ima rad filme o komedijah Telegu, tukaj lahko vidite, da ima vaša sestra drugačno izbiro filmov. Oba sta odkrila globinske informacije o filmih. Tu smo združili niz neoznačenih podatkovnih nizov (filmov) za ogled filma.

Kako grozd deluje v strojnem učenju?

Pri združevanju združujemo niz neoznačenih podatkov, ki je znan kot nenadzorovano učenje. Ko prvič združimo neoznačene podatke, moramo najti podobno skupino. Ko ustvarjamo skupino, moramo razumeti značilnosti nizov podatkov, tj. Podobnih stvari. Če skupino ustvarimo po eni ali dveh lastnostih, je preprosto izmeriti podobnost.

  • Primer # 1: Filmi režiserja. Ko je grozd končan, se vsakemu grozdu dodeli številka grozda, ki je znana kot ClusterID. Sistem strojnega učenja, kot je YouTube, uporablja clusterID, da najlažje predstavlja kompleksne podatke.
  • Primer # 2: YouTube uporablja našo zgodovino iskanja ali zgodovino ogledov in predlaga videoposnetke, ki bi nam bili morda všeč. Funkcijski podatki za Facebook vsebujejo ljudi, ki jih spremljamo, strani, ki jih spremljamo, komentarje, ki jih vnašamo, fotografije ali videoposnetke, ki so nam všeč, slike ali fotografije, na katere se označimo. Grozdanje Facebook ali fotografije na Facebooku bo zaradi stiskanja podatkov nadomestilo nabor funkcij z enim clusterID.

Top 4 metode grozdenja v strojnem učenju

Spodaj so opisane metode združevanja v strojnem učenju:

1. Hierarhično

Grozditev imena določa način dela, ta metoda tvori grozd na hierarhalni način. Nov grozd je oblikovan z uporabo predhodno oblikovane strukture. Razumeti moramo razlike med delitvenim in aglomerativnim pristopom. Aglomerative so pristop od spodaj navzgor, začne se s posameznimi točkami v grozdu in združuje nekaj poljubnih. Delitev se začne z enim skupinam, vse točke v grozdu in ga razdelijo na več grozdov.

2. Na podlagi gostote

V tej metodi je gosto območje obravnavano kot grozd, ki ima nekaj podobnosti. Razlikuje se od spodnjega gostega območja prostora predmeta. DBSCAN je znan kot gostotno zasnovanje aplikacij s hrupom na osnovi gostote. Za usmerjenost v podatkovne predmete DBSCAN išče nekaj epsilona, ​​postavili smo nekaj polmera epsilona in minimalno število točk. Če v polmeru presežemo minimalno število točk, uvrstimo gručo z visoko gostoto. Tako lahko na ta način upoštevamo podatke z območjem visoke gostote. DBSCAN se razlikuje od središčne metode združevanja, saj ni strog pristop. Točke hrupa so točke na območjih z nizko gostoto, ki jih pustimo neoznačene ali označene kot odstranjene. To je razlog, da ne potrebujemo določenega K. Lahko določimo minimalne točke za območje z visoko gostoto in polmer, ki ga želimo za območje ali grozde.

3. Razdelitev

Ko imamo nabor podatkov N število predmetov. Ta metoda tvori "K" kot particijo podatkov. Ta particija je grozd, tj. Konstrukcija K, particija (K <= N).

Zahteve, ki jih je treba izpolniti:

  • Vsaka skupina ali nabor podatkov mora vsebovati vsaj en predmet.
  • Vsak predmet bi moral pripadati samo eni skupini.

Eden od primerov particioniranja je združevanje s K-sredstvi.

4. Na osnovi mreže

Objektni prostor končno število celic tvori mrežno strukturo. Ta metoda omogoča hitro obdelavo grozdov. Te niso odvisne od prostora predmeta.

Uporaba gruče v strojnem učenju

Spodaj so aplikacije grozda v strojnem učenju:

1. Medicinski

Zdravnik lahko uporabi algoritem grozdanja za iskanje odkrivanja bolezni. Vzemimo primer bolezni ščitnice. Podatkovne podatke o bolezni ščitnice lahko prepoznamo z algoritmom združevanja, kadar na podlagi podatkov, ki vsebuje nabor podatkov o ščitnici in ne ščitnici, uporabimo nenadzorovano učenje. Grozd bo ugotovil vzrok bolezni in uspešno iskanje rezultatov.

2. Socialna mreža

Mi smo generacija internetne dobe, lahko srečamo katero koli osebo ali se preko interneta seznanimo s katero koli individualno identiteto. Spletna mesta v družabnih omrežjih uporabljajo grozd za razumevanje vsebine, osebe ali lokacijo uporabnika. Kadar se nenadzorovano učenje uporablja pri socialnem, je koristno za prevod jezika. Na primer, Instagram in Facebook zagotavljata funkcijo prevoda jezika.

3. Trženje

Vidimo ali opazimo, da drugačna tehnologija raste poleg nas in ljudi privlači k uporabi teh tehnologij, kot so oblak, digitalni marketing. Da bi pritegnili večje število kupcev, vsako podjetje razvija funkcije in tehnologijo, ki so enostavne za uporabo. Za razumevanje stranke lahko uporabimo grozdanje. Grozdanje bo podjetju pomagalo razumeti uporabniški segment in nato razvrstilo vsakega kupca. Tako lahko stranko razumemo in poiščemo podobnosti med strankami in jih združimo.

4. Bančništvo

Opazili smo, da se goljufije denarja dogajajo okoli nas in podjetje na to opozarja kupce. S pomočjo grozdenja lahko zavarovalnice najdejo goljufije, potrdijo stranke o tem in razumejo politike, ki jih prinese stranka.

5. Google

Google je eden izmed iskalnikov, ki jih ljudje uporabljajo. Vzemimo primer, ko iščemo nekatere informacije, kot je trgovina za hišne ljubljenčke na tem območju, nam bo Google ponudil različne možnosti. To je rezultat združevanja v skupine, združevanja podobnih rezultatov, ki so vam na voljo.

Zaključek

Spoznali smo grozdenje in strojno učenje. Način združevanja deluje pri strojnem učenju. Informacije o nenadzorovanem učenju. Uporaba sprotnega učenja brez nadzora. Metode združevanja in kako vsaka metoda deluje pri strojnem učenju.

Priporočeni članek

To je vodnik za grozdanje v strojnem učenju. Tukaj razpravljamo o najboljših 4 metodah združevanja v strojnem učenju skupaj z aplikacijami. Če želite izvedeti več, lahko preberete tudi druge naše predlagane članke -
  1. Okviri strojnega učenja Top 10
  2. K- Pomeni algoritem grozdanja s prednostmi
  3. Uvod v tehnike strojnega učenja
  4. Modeli strojnega učenja | Top 5 vrst
  5. Strojno učenje C ++ knjižnica