Uvod v stroj z omejeno uporabo Boltzmanna

Omejeni stroj Boltzmann je metoda, ki lahko samodejno poišče vzorce v podatkih z rekonstrukcijo našega vnosa. Geoff Hinton je ustanovitelj globokega učenja. RBM je površinsko dvoslojno omrežje, v katerem je prva vidna, naslednja pa skrita plast. Vsakemu vozlišču v vidni plasti je pridruženo vsako posamezno vozlišče v skriti plasti. Omejeni stroj Boltzmann velja za omejenega, ker dve vozli v isti plasti ne tvorita povezave. RBM je numerični ekvivalent dvosmernega prevajalca. Na poti naprej RBM sprejme vhod in ga pretvori v niz številk, ki kodira vhod. Pri povratni poti to vzame kot rezultat in obdela ta niz vhodov in jih prevede vzvratno, da tvori vstavljene vhode. Super usposobljena mreža bo lahko ta povratni prehod opravila z veliko resničnostjo. V dveh korakih imata teža in vrednosti zelo pomembno vlogo. Omogočajo, da RBM dekodira medsebojne povezave med vhodi in tudi pomaga, da se samodejno odloči, katere vhodne vrednosti so najpomembnejše pri odkrivanju pravilnih izhodov.

Delo z omejenim strojem Boltzmann

Vsako posamezno vidno vozlišče prejme nizko raven od vozlišča v naboru podatkov. Na prvem vozlišču nevidne plasti se X tvori z maso proizvoda in se doda pristransko. Rezultat tega procesa se napaja z aktiviranjem, ki proizvaja moč danega vhodnega signala ali izhoda vozlišča.

V naslednjem postopku bi se na enem skritem vozlišču pridružilo več vhodov. Vsak X je združen s posamezno težo, dodajanje izdelka je vpet v vrednosti in rezultat se ponovno sproži z aktivacijo, da dobimo izhod vozlišča. Na vsakem nevidnem vozlišču je vsak vhod X združen s posamezno težo W. Vhod X ima tukaj tri uteži, kar skupaj tvori dvanajst. Teža, ustvarjena med plastjo, postane niz, kjer so vrstice točne na vhodna vozlišča in stolpci so izpolnjeni za izhodna vozlišča.

Vsako nevidno vozlišče dobi štiri odzive, pomnožene z njihovo težo. Dodajanje tega učinka se spet doda vrednosti. Ta deluje kot katalizator, da se zgodi neki postopek aktivacije, rezultat pa se spet napaja v algoritmu aktivacije, ki ustvari vsak izhod za vsak posamezen nevidni vhod.

Prvi model, ki je izpeljan tukaj, je energetsko zasnovan model. Ta model povezuje skalarno energijo z vsako konfiguracijo spremenljivke. Ta model definira porazdelitev verjetnosti z energijsko funkcijo na naslednji način,

(1)

Tu je Z normativni faktor. Je funkcija particije v smislu fizičnih sistemov

V tej energijski funkciji sledi logistična regresija, da bo prvi korak določil log. verjetnost, naslednja pa bo funkcijo izgube opredelila kot negativno.

s stohastičnim gradientom, kje so parametri,

energetsko zasnovan model s skrito enoto je opredeljen kot 'h'

Opazovani del označimo kot "x"

Iz enačbe (1) je enačba proste energije F (x) definirana na naslednji način

(2)

(3)

Negativni gradient ima naslednjo obliko,

(4)

Zgornja enačba ima dve obliki, pozitivno in negativno obliko. Izraz pozitiven in negativen ni predstavljen z znaki enačb. Prikažejo učinek gostote verjetnosti. Prvi del prikazuje verjetnost zmanjšanja ustrezne proste energije. Drugi del prikazuje zmanjšano verjetnost ustvarjanja vzorcev. Potem se gradient določi na naslednji način,

(5)

Tu je N negativni delci. V tem energijsko utemeljenem modelu je gradient težko analitično prepoznati, saj vključuje izračun

V tem modelu EBM imamo linearno opazovanje, ki ne more natančno prikazati podatkov. Torej, v naslednjem modelu Omejeni Boltzmannov stroj ima Skrita plast večjo natančnost in preprečevanje izgube podatkov. Energetska funkcija RBM je opredeljena kot

(6)

Tukaj je W teža, ki povezuje vidne in skrite plasti. b je zamaknjen vidni sloj.c je odmik skrite plasti. s pretvorbo v brezplačno energijo,

V RBM so enote vidne in skrite plasti popolnoma neodvisne, kar lahko zapišemo na naslednji način,

Iz enačb 6 in 2 je verjetna različica funkcije aktivacije nevrona oz.

(7)

(8)

Nadalje je poenostavljeno v

(9)

Združitev enačb 5 in 9,

(10)

Vzorčenje v omejenem boltzmannovem stroju

Gibbs vzorčenje sklepa N naključnih spremenljivk se opravi z zaporedjem N pod-korakov vzorčenja obrazca kje

vsebuje druge naključne spremenljivke v razen.

V RBM je S nabor vidnih in skritih enot. Oba dela sta neodvisna, ki lahko izvajata ali blokirata vzorčenje Gibbsa. Tu vidna enota izvaja vzorčenje in skrivnim enotam daje fiksno vrednost, hkrati pa skrite enote z vzorčenjem zagotavljajo fiksne vrednosti vidni enoti

tukaj, je nabor vseh skritih enot. Primer je naključno izbran, da je 1 (proti 0) z verjetnostjo, in podobno, je naključno izbran, da je 1 (proti 0) z verjetnostjo

Kontrastna razhajanja

Uporablja se kot katalizator za pospešitev postopka vzorčenja
Ker pričakujemo, da bo res, pričakujemo vrednost porazdelitve blizu P, tako da tvori konvergenco do končne porazdelitve P

Toda nasprotna razhajanja ne čakajo, da se veriga zbliži. Vzorec dobimo šele po Gibbovem postopku, zato smo tu postavili k = 1, kjer deluje presenetljivo dobro.

Trajna kontrastivna razhajanja

To je še ena metoda za vzorčenje vzorca približevanja. Vztrajno stanje pri vsaki metodi vzorčenja pridobiva nove vzorce s preprosto spremembo parametrov K.

Sloji stroja z omejeno uporabo Boltzmanna

Omejeni Boltzmannov stroj ima dva sloja, plitva nevronska omrežja, ki se združijo in tvorijo blok globoko prepričanih mrež. Prva plast je vidna plast, druga plast pa skrita plast. Vsaka enota se nanaša na nevronski krog, imenovan vozlišče. Vozlišča iz skrite plasti so povezana z vozli iz vidne plasti. Toda dve vozli iste plasti nista povezani. Tu se izraz Restricted nanaša na nobeno slojevito komunikacijo. Vsako vozlišče obdeluje vhod in se stohastično odloči, ali bo vhod posredoval ali ne.

Primeri

Pomembna vloga obročnega mehanizma je porazdelitev verjetnosti. Jeziki so po svojih črkah in zvokih edinstveni. Verjetnostna porazdelitev pisma je lahko visoka ali nizka. V angleščini so široko uporabljene črke T, E in A. Toda na islandskem sta običajni črki A in N. Ne moremo poskušati rekonstruirati Islandca s težo, ki temelji na angleščini. Privedla bo do razhajanj.

Naslednji primer so slike. Verjetnostna porazdelitev vrednosti njihove piksle se razlikuje za vsako vrsto slike. Lahko pomislimo, da obstajata dve sliki slona in psa za vhodna vozlišča, sprednji prehod RBM bo sprožil vprašanje, kot bi moral ustvariti močno vozlišče pikslov za slonsko vozlišče ali pasje vozlišče ?. Potem bo prehod nazaj ustvaril vprašanja, kot je za slona, ​​kako naj pričakujem razporeditev pik? Nato bodo s skupno verjetnostjo in aktivacijo, ki jo proizvajajo vozlišča, zgradili mrežo s skupnim sovpadanjem kot velika ušesa, siva nelinearna cev, disketična ušesa, guba je slon. Zato je RBM proces poglobljenega učenja in vizualizacije, ki tvorita dve glavni pristranskosti in delujeta na njihov smisel za aktiviranje in obnovo.

Prednosti stroja z omejeno uporabo Boltzmanna

  • Omejeni Boltzmannov stroj je uporabljen algoritem, ki se uporablja za razvrščanje, regresijo, modeliranje tem, sodelovalno filtriranje in učenje funkcij.
  • Omejeni Boltzmannov stroj se uporablja za neoblikovanje slik, rekonstrukcijsko rekonstrukcijo slike pri načrtovanju min in tudi za prepoznavanje ciljev Radar.
  • RBM lahko reši težavo z neuravnoteženimi podatki po SMOTE postopku
  • RBM poiščejo manjkajoče vrednosti z Gibbovim vzorčenjem, ki se uporablja za pokrivanje neznanih vrednosti
  • RBM premaga problem hrupnih nalepk zaradi nepopravljenih podatkov etiket in njegovih napak pri obnovi
  • Problematične nestrukturirane podatke odpravi s pomočjo ekstraktorja funkcij, ki pretvori surove podatke v skrite enote.

Zaključek

Globoko učenje je zelo močno, kar je umetnost reševanja zapletenih problemov, je še vedno prostor za izboljšave in ga je zapleteno izvesti. Brezplačne spremenljivke je treba skrbno konfigurirati. Zamisli za nevronsko mrežo so bile že prej težke, danes pa je globoko učenje podlaga strojnega učenja in umetne inteligence. Tako RBM daje pogled na ogromne algoritme za globoko učenje. Ukvarja se z osnovno kompozicijsko enoto, ki je postopoma prerasla v številne priljubljene arhitekture in se široko uporabljala v številnih obsežnih industrijah.

Priporočeni članek

To je vodnik za omejeni stroj Boltzmann. Tukaj razpravljamo o njegovem delovanju, vzorčenju, prednostih in plasteh omejenega stroja Boltzmann. Obiščite lahko tudi druge naše predlagane članke, če želite izvedeti več _

  1. Algoritmi strojnega učenja
  2. Arhitektura strojnega učenja
  3. Vrste strojnega učenja
  4. Orodja za strojno učenje
  5. Izvajanje nevronskih mrež

Kategorija: