Uvod v klasifikacijo nevronske mreže

Nevronske mreže so najučinkovitejši način (da, prav ste prebrali) za reševanje problemov v resničnem svetu v umetni inteligenci. Trenutno je tudi eno od zelo obsežno raziskanih področij računalništva, medtem ko bi med branjem tega članka razvili novo obliko Nevronske mreže. Obstaja na stotine nevronskih mrež za reševanje težav, značilnih za različne domene. Tukaj vas bomo vodili po različnih vrstah osnovnih nevronskih mrež v vrstnem redu vse večje zapletenosti.

Različne vrste osnov pri razvrščanju nevronskih mrež

1. Plitka nevronska omrežja (kolaborativno filtriranje)

Nevronske mreže so sestavljene iz skupin Perceptrona, ki simulirajo nevronsko strukturo človeških možganov. Plitke nevronske mreže imajo en sam skriti sloj perceptrona. Eden od pogostih primerov plitvih nevronskih mrež je kolaborativno filtriranje. Skrita plast perceptrona bi bila usposobljena za predstavljanje podobnosti med entitetami, da bi ustvarili priporočila. Priporočilni sistem v Netflixu, Amazonu, YouTubu itd. Uporablja različico kolaborativnega filtriranja, da priporoči njihove izdelke glede na zanimanje uporabnikov.

2. Večplastni receptor (globoke nevronske mreže)

Nevronske mreže z več kot enim skritim slojem se imenujejo globoke nevronske mreže. Opozorilo o spojlerju! Vsa naslednja nevronska omrežja so oblika globoke nevronske mreže, ki je bila prepletena / izboljšana za reševanje težav, povezanih z domeno. Na splošno nam pomagajo doseči univerzalnost. Glede na zadostno število skritih plasti nevrona, lahko globoka nevronska mreža približa tj reši kateri koli zapleten problem v resničnem svetu.

Teorem univerzalnega približevanja je jedro globokih nevronskih mrež, ki trenirajo in ustrezajo vsakemu modelu. Vsako različico globoke nevronske mreže razvije popolnoma povezana plast največ združenega produkta množenja matrike, ki je optimiziran z algoritmi za povratno širjenje. Še naprej bomo spoznavali izboljšave, ki so povzročile različne oblike globokih nevronskih mrež.

3. Konvolucijsko nevronsko omrežje (CNN)

CNN-ji so najbolj zrela oblika globokih nevronskih mrež, ki dajejo najbolj natančen, tj. Boljši od človeških rezultatov računalniškega vida. CNN-ji so narejeni iz plasti preobratov, ustvarjenih s pregledovanjem vseh slikovnih pik v naboru podatkov. Ko se podatki približajo plastnim slojem, CNN začne prepoznavati vzorce in s tem prepoznati predmete na slikah. Ti predmeti se veliko uporabljajo v različnih aplikacijah za identifikacijo, klasifikacijo itd. Nedavne prakse, kot je prenos znanja v CNN-jih, so privedle do pomembnih izboljšav v netočnosti modelov. Google Translator in Google Lens sta najsodobnejši primer CNN-jev.

Uporaba CNN-jev je eksponentna, saj se celo uporabljajo pri reševanju težav, ki v prvi vrsti niso povezane z računalniškim vidom. Tu lahko najdete zelo preprosto, a intuitivno razlago CNN-jev.

4. Ponavljajoča se nevronska mreža (RNN)

RNN so zadnja oblika globokih nevronskih mrež za reševanje problemov v NLP. Preprosto povedano, RNN napajajo izhod nekaj skritih plasti nazaj v vhodni sloj, da se združijo in prenesejo približek naslednji ponovitvi (epohi) vhodnega nabora podatkov. Prav tako modelu pomaga pri samostojnem učenju in hitreje popravi napovedi. Takšni modeli so v veliko pomoč pri razumevanju semantike besedila v NLP operacijah. Obstajajo različne različice RNN-jev, kot so dolgotrajni pomnilnik (LSTM), ponavljajoča se enota (GRU) itd. Na spodnjem diagramu se aktiviranje od h1 in h2 napajata z vhodoma x2 in x3.

5. Dolgoročni kratkoročni pomnilnik (LSTM)

LSTM-ji so zasnovani posebej za reševanje težav z gradienti, ki izginjajo z RNN. Izginjanje Gradientov se zgodi z velikimi nevronskimi omrežji, kjer se gradienti izgubnih funkcij ponavadi približajo ničli, zaradi česar se nevronske mreže zaustavijo. LSTM to težavo reši tako, da prepreči funkcije aktiviranja v svojih ponavljajočih se komponentah in tako, da se shranjene vrednosti nemutirajo. Ta majhna sprememba je prinesla velike izboljšave v končnem modelu, kar je povzročilo, da so tehnični velikani v svojih rešitvah prilagodili LSTM. Nad "najbolj preprosto razlago" ilustracije LSTM,

6. Omrežja, ki temeljijo na pozornosti

Pozorni modeli počasi prevzemajo celo nove RNN v praksi. Modeli pozornosti so zasnovani tako, da se osredotočajo na del podskupine informacij, ki jih dobijo, s čimer se odstrani velika količina osnovnih informacij, ki niso potrebne za nalogo. Modeli pozornosti so zgrajeni s kombinacijo mehke in trde pozornosti in prileganja, tako da mehko pozornost širi nazaj. Modeli z več pozornosti, hierarhično zloženi, se imenujejo Transformer. Ti transformatorji so učinkovitejši za vzporedni zagon, tako da ustvarjajo najsodobnejše rezultate s sorazmerno manjšimi podatki in časom za usposabljanje modela. Porazdelitev pozornosti postane zelo močna, kadar se uporablja s CNN / RNN, in lahko ustvari opis besedila na sliko, kot sledi.

Tehnični velikani, kot so Google, Facebook itd., Hitro prilagajajo modele pozornosti za gradnjo svojih rešitev.

7. Generative Adversarial Network (GAN)

Čeprav modeli globokega učenja zagotavljajo najsodobnejše rezultate, jih veliko bolj inteligentni človeški kolegi lahko preslepijo z dodajanjem hrupa resničnim podatkom. GAN so najnovejši razvoj globokega učenja za reševanje takšnih scenarijev. GAN uporabljajo nenadzorovano učenje, kjer so globoke nevronske mreže usposobljene s podatki, ustvarjenimi z modelom AI, in dejanskim naborom podatkov za izboljšanje natančnosti in učinkovitosti modela. Ti nadomestni podatki se večinoma uporabljajo za pretiravanje diskriminatornega modela za oblikovanje optimalnega modela. Tako dobljeni model je boljši približek, kot ga lahko premaga takšen hrup. Raziskovalno zanimanje za GAN je privedlo do bolj zapletenih izvedb, kot so Pogojni GAN (CGAN), Laplacijeva piramida GAN (LAPGAN), Super Resolution GAN (SRGAN) itd.

Zaključek - Razvrstitev nevronske mreže

Globoke nevronske mreže so pritiskale na meje računalnikov. Niso omejeni le na klasifikacijo (CNN, RNN) ali napovedi (Collaborative Filtering), ampak celo na generiranje podatkov (GAN). Ti podatki se lahko razlikujejo od čudovite oblike umetnosti do spornih globinskih ponaredkov, vendar vsak dan z nalogo vsak dan presegajo ljudi. Zato bi morali razmisliti tudi o etiki in vplivih AI, medtem ko si močno prizadevamo za izgradnjo učinkovitega modela nevronske mreže. Čas za lepo infografiko o nevronskih omrežjih.

Priporočeni članki

To je vodnik za klasifikacijo nevronske mreže. Tu smo razpravljali o različnih vrstah osnovnih nevronskih mrež. Obiščite lahko tudi naše članke, če želite izvedeti več -

  1. Kaj so nevronske mreže?
  2. Algoritmi nevronske mreže
  3. Orodja za omrežno skeniranje
  4. Ponavljajoče se nevronske mreže (RNN)
  5. Najboljših 6 primerjav med CNN in RNN

Kategorija: