Uvod v metode jedra

Metode jeder ali jedra (imenovane tudi funkcije jedra) so sklopi različnih vrst algoritmov, ki se uporabljajo za analizo vzorcev. Uporabljajo se za reševanje nelinearne težave z uporabo linearnega klasifikatorja. Metode jeder se uporabljajo v SVM (podporni vektorski stroji), ki se uporabljajo pri klasifikaciji in regresijskih težavah. SVM uporablja tako imenovani "trik v jedru", kjer se podatki transformirajo in se najde možna meja za možne izhode.

Potreba po metodi jedra in njeno delovanje

Preden se lotimo delovanja Kernel metod, je pomembneje razumeti podporne vektorske stroje ali SVM, ker so jedra implementirana v SVM modele. Torej, Podporni vektorski stroji so nadzorovani algoritmi strojnega učenja, ki se uporabljajo pri težavah s klasifikacijo in regresijo, kot je razvrščanje jabolka v razred sadja in razvrščanje Leva v razred živali.

Spodaj je prikazano, kako izgledajo podporni vektorski stroji:

Tu lahko vidimo hiperplano, ki ločuje zelene pike od modrih. Hiperplana je ena dimenzija manj kot okoliška ravnina. Na zgornji sliki imamo 2 dimenzijo, ki predstavlja prostor okolice, toda samota, ki deli ali razvršča prostor, je ena dimenzija manj kot prostor in jo imenujemo hiperplana.

Kaj pa če imamo takšen vložek:

To klasifikacijo je zelo težko rešiti z linearnim klasifikatorjem, saj ni dobre linearne črte, ki bi lahko razvrstila rdeče in zelene pike, saj so točke naključno razporejene. Tu pride uporaba funkcije jedra, ki točke popelje v višje dimenzije, tam reši težavo in vrne izhod. Če pomislite na to na tak način, lahko vidimo, da so zelene pike zaprte na nekem območju, medtem ko rdeča leži zunaj nje, prav tako bi lahko obstajali drugi scenariji, kjer bi se zelene pike lahko razporedile na območju trapez.

Torej, pretvorimo dvodimenzionalno ravnino, ki jo je prvo razvrstila enodimenzionalna hiperplana ("ali ravna črta"), v tridimenzionalno območje in tu naš klasifikator, tj. Hiperplana, ne bo ravna, ampak dve -dimenzionalna ravnina, ki bo odrezala območje.

Da bi dobili matematično razumevanje jedra, naj razumemo enačbo jedra Lili Jiang, ki je:

K (x, y) = kje,
K je funkcija jedra,
X in Y sta dimenzijska vhoda,
f je zemljevid od n-dimenzionalnega do m-dimenzionalnega prostora in
je pika izdelek.

Ilustracija s pomočjo primera.

Povejmo, da imamo dve točki, x = (2, 3, 4) in y = (3, 4, 5)

Kot smo videli, je K (x, y) =.

Naj najprej izračunamo

f (x) = (x1x1, x1x2, x1x3, x2x1, x2x2, x2x3, x3x1, x3x2, x3x3)
f (y) = (y1y1, y1y2, y1y3, y2y1, y2y2, y2y3, y3y1, y3y2, y3y3)
torej
f (2, 3, 4) = (4, 6, 8, 6, 9, 12, 8, 12, 16) in
f (3, 4, 5) = (9, 12, 15, 12, 16, 20, 15, 20, 25)
izdelek s pikami,
f (x). f (y) = f (2, 3, 4). f (3, 4, 5) =
(36 + 72 + 120 + 72 +144 + 240 + 120 + 240 + 400) =
1444
In,
K (x, y) = (2 * 3 + 3 * 4 + 4 * 5) 2 = (6 + 12 + 20) 2 = 38 * 38 = 1444.

Kot smo ugotovili, nam f (x) .f (y) in K (x, y) dajeta enak rezultat, vendar je prejšnja metoda zahtevala veliko izračunov (zaradi projiciranja 3 dimenzij v 9 dimenzij), medtem ko uporabljamo jedro, bilo je veliko lažje.

Vrste jedra in metode v SVM

Oglejmo si nekatere funkcije jedra ali vrste, ki se uporabljajo v SVM:

1. Liner jedro - Recimo, da imamo dva vektorja z imenom x1 in Y1, potem je linearno jedro opredeljeno s pičnim izdelkom teh dveh vektorjev:

K (x1, x2) = x1. x2

2. Polinomno jedro - polinomno jedro je opredeljeno z naslednjo enačbo:

K (x1, x2) = (x1. X2 + 1) d,

Kje,

d je stopnja polinoma in x1 in x2 sta vektorja

3. Gaussovo jedro - To jedro je primer jedra z radialno osnovno funkcijo. Spodaj je enačba tega:

Dana sigma ima zelo pomembno vlogo pri delovanju Gaussovega jedra in je ne smemo precenjevati in ne smeti podcenjevati, temveč jo je treba skrbno prilagoditi glede na težavo.

4. eksponentno jedro - To je v tesni povezavi s prejšnjim jedrom, tj. Gaussovo jedro z edino razliko je - kvadrat norme se odstrani.

Funkcija eksponentne funkcije je:


To je tudi funkcija jedra na radialni osnovi.

5. Laplacijevo jedro - Ta vrsta jedra je manj nagnjena k spremembam in je popolnoma enaka predhodno razpravljanemu jedru eksponentne funkcije, enačba laplacijevega jedra je dana kot:

6. Hiperbolično ali sigmoidno jedro - To jedro se uporablja na področjih nevronske mreže strojnega učenja. Aktivacijska funkcija za sigmoidno jedro je bipolarna sigmoidna funkcija. Enačba za funkcijo hiperboličnega jedra je:

To jedro se zelo uporablja in je priljubljeno med podpornimi vektorski stroji.

7. Jedro Anova radial base - To jedro je zelo dobro, da deluje pri težavah z večdimenzionalno regresijo, tako kot Gaussovo in Laplacijevo jedro. To spada tudi v kategorijo radialnega osnovnega jedra.

Enačba jedra Anova je:

Obstaja veliko več vrst metode jedra in razpravljali smo o najpogosteje uporabljenih jedrih. Čisto odvisno je od vrste težave, ki bo odločila, da bo uporabljena funkcija jedra.

Zaključek

V tem razdelku smo videli definicijo jedra in kako deluje. Poskusili smo razložiti s pomočjo diagramov o delu jeder. Nato smo poskušali prikazati preprosto ilustracijo z uporabo matematike o funkciji jedra. V zadnjem delu smo videli različne vrste funkcij jedra, ki se danes pogosto uporabljajo.

Priporočeni članki

To je vodnik za metode Kernel. Tukaj razpravljamo o uvodu, potrebi, delu in vrstah jedrskih metod z ustrezno enačbo. Če želite izvedeti več, lahko preberete tudi druge naše predlagane članke -

  1. Algoritmi za rudarjenje podatkov
  2. K- Pomeni algoritem grozda
  3. Algoritem Brute Force
  4. Algoritem drevesne odločitve
  5. Metode jedrca v strojnem učenju
  6. Drevo odločanja v strojnem učenju

Kategorija: