Uvod v ansambelske metode v strojnem učenju

V tem članku bomo videli oris ansambelskih metod v strojnem učenju. Ansambelno učenje je kombinacija različnih tehnik strojnega učenja v napovedni model za izboljšanje napovedovanja. Ansambelno učenje se pridobiva za zmanjšanje odstopanja v napovednih podatkih. Ta vrsta učenja naj bi zmanjšala pristranskost modela. Ansambelno učenje je sistem z več modeli, v katerem so različni klasifikatorji ali tehnike strateško združeni, da bi z boljše natančnosti razvrstili ali napovedali statistiko iz zapletenega problema. Cilj takega učenja je zmanjšati verjetnost slabe izbire modela. Imenuje zaupanje v odločitev modela. Zamisel o izbiri optimalnih lastnosti se je uresničila v ansambelskem učenju.

Vrste ansambelskih metod v strojnem učenju

Metode ansambla pomagajo ustvariti več modelov in jih nato kombinirati, da dosežejo boljše rezultate, nekatere metode ansambla so razvrščene v naslednje skupine:

1. Sekvenčne metode

V tovrstni metodi ansambla obstajajo zaporedno generirani osnovni učenci, v katerih je odvisnost od podatkov. Vsi drugi podatki v osnovnem učencu so odvisni od predhodnih podatkov. Torej se predhodni napačno označeni podatki prilagodijo glede na njegovo težo, da se izboljša učinkovitost celotnega sistema.

Primer : Povečanje

2. Vzporedna metoda

Pri tovrstni metodi Ensemble se osnovni učenec generira v vzporednem zaporedju, v katerem odvisnosti od podatkov ni. Vsi podatki v osnovnem učencu se ustvarijo neodvisno.

Primer : Zlaganje

3. Homogeni ansambel

Tak način ansambla je kombinacija istih vrst klasifikatorjev. Toda nabor podatkov je za vsakega klasifikatorja drugačen. Tako bo kombinirani model natančneje deloval po seštevanju rezultatov iz vsakega modela. Ta vrsta ansambelske metode deluje z velikim številom podatkovnih nizov. Pri homogeni metodi je metoda izbire lastnosti enaka za različne podatke o treningu. Računalniško je drago.

Primer: Priljubljene metode, kot so pakiranje in pospeševanje, spadajo v homogen ansambel.

4. Heterogeni ansambel

Tak način ansambla je kombinacija različnih vrst klasifikatorjev ali modelov strojnega učenja, v katerih je vsak razvrščevalec gradil na istih podatkih. Takšna metoda deluje za majhne naloge podatkov. Pri heterogeni je metoda izbire funkcij za iste podatke o treningu različna. Skupni rezultat te metode ansambla se izvede s povprečjem vseh rezultatov vsakega kombiniranega modela.

Primer : Zlaganje

Tehnična klasifikacija ansambelskih metod

Spodaj je tehnična klasifikacija Ansambelskih metod:

1. Torbe

Ta metoda ansambla združuje dva modela strojnega učenja, tj. Zagonsko kopiranje in združevanje v en sam model ansambla. Cilj metode pakiranja je zmanjšati veliko varianco modela. Odločitvena drevesa imajo različno in majhno pristranskost. Velik nabor podatkov je (recimo 1000 vzorcev) podvzorčen (recimo 10 podvzorcev vsebuje 100 vzorcev podatkov). Vsaka drevesa več odločitev so zgrajena na vsakem poduzornem podatku o usposabljanju. Medtem ko se podtikajo vzorčni podatki o različnih drevesih odločanja, se skrbi za prekomerno prilagajanje podatkov o usposabljanju za vsako odločilno drevo. Za učinkovitost modela je vsako posamezno drevo odločanja poglobljeno, ki vsebuje podatke o vadbilih iz podvzorčkov. Rezultati vsakega drevesa odločitev so združeni, da bi razumeli končno napoved. Variacija zbirnih podatkov se zmanjšuje. Natančnost napovedovanja modela pri metodi pakiranja je odvisna od števila uporabljenih dreves odločitev. Različni podvzorčki vzorčnih podatkov so izbrani naključno z nadomestkom. Rezultat vsakega drevesa ima visoko korelacijo.

2. Povečanje

Pospeševalni ansambel združuje tudi različne iste vrste klasifikatorja. Povečanje je ena od zaporednih metod ansambla, pri kateri vsak model ali klasifikator deluje na podlagi funkcij, ki jih bo uporabil naslednji model. Na ta način spodbujevalna metoda iz povprečnih uteži oblikuje močnejši model učenca iz šibkih učnih modelov. Z drugimi besedami, močnejši usposobljeni model je odvisen od številnih šibko usposobljenih modelov. Šibek učenec ali model, ki je usposobljen za obrabo, je tisti, ki je zelo malo povezan z resnično klasifikacijo. Toda naslednji šibki učenec je nekoliko bolj povezan z resnično klasifikacijo. Kombinacija tako različnih šibkih učencev daje močnega učenca, kar je dobro povezano z resnično klasifikacijo.

3. Zlaganje

Ta metoda kombinira tudi več klasifikacij ali regresijskih tehnik z uporabo meta-klasifikatorja ali meta-modela. Modeli na nižjih ravneh se usposabljajo s celotnim naborom podatkov o usposabljanju, nato pa se kombinirani model usposablja z rezultati nižjih modelov. Za razliko od spodbujevalnih je vsak model nižje stopnje opravljen v vzporednem treningu. Napoved iz modelov nižje ravni se uporablja kot vhod za naslednji model kot nabor podatkov in tvori sklad, v katerem je zgornja plast modela bolj usposobljena kot spodnja plast modela. Model zgornjega sloja ima dobro natančnost predvidevanja in so ga zgradili na podlagi modelov nižje stopnje. Količina se povečuje, dokler se najboljše napoved ne izvede z minimalno napako. Napoved kombiniranega modela ali meta-modela temelji na napovedi različnih šibkih modelov ali modelov nižje plasti. Osredotoča se na izdelavo manj pristranskih modelov.

4. Naključni gozd

Naključni gozd se nekoliko razlikuje od smeti, saj uporablja globoka drevesa, ki so nameščena na vzorcih prtljažnika. Rezultat vsake trese je kombiniran, da se zmanjša odstopanje. Medtem ko vsako drevo raste, namesto da bi na podlagi opazovanja v naboru podatkov generirali vzorec zagonske črpalke, vzamemo tudi nabor podatkov na podlagi funkcij in uporabimo le naključno podmnožico takega vzorca za izdelavo drevesa. Z drugimi besedami, vzorčenje nabora podatkov poteka na podlagi funkcij, ki zmanjšujejo povezanost različnih izhodnih podatkov. Naključni gozd je dober za odločitev o manjkajočih podatkih. Naključni gozd pomeni naključno izbiro podskupine vzorca, ki zmanjšuje možnosti pridobivanja povezanih napovednih vrednosti. Vsako drevo ima drugačno strukturo. Naključni gozd povzroči rahlo povečanje pristranskosti gozda, vendar se zaradi povprečenja vseh manj povezanih napovedi za različna drevesa rezultirajoča odstopanje zmanjšuje in daje na splošno boljše rezultate.

Zaključek

Multi-modelni pristop ansambla realizirajo modeli globokega učenja, v katerih so kompleksni podatki preučeni in obdelani s tako različnimi kombinacijami klasifikatorja, da bi dobili boljše napovedi ali razvrstitev. Napovedovanje vsakega modela pri ansambelskem učenju mora biti bolj neusklajeno. Tako bo pristranskost in variabilnost modela čim manjša. Model bo učinkovitejši in napoveduje izhod pod minimalno napako. Ansambel je nadzorovan algoritem učenja, saj je model predhodno usposobljen z naborom podatkov, da lahko napoveduje. Pri učenju ansambla mora biti število klasifikatorjev sestavnih delov enako kot oznake razredov, da se doseže visoka natančnost.

Priporočeni članki

To je vodnik za Ansambelske metode v strojnem učenju. Tukaj razpravljamo o pomembnih vrstah ansambelskih metod v strojnem učenju skupaj s tehnično klasifikacijo. Če želite izvedeti več, lahko preberete tudi druge naše predlagane članke -

  1. Uvod v ansambelske tehnike
  2. Strojno učenje življenjskega cikla s prednostmi
  3. Algoritmi strojnega učenja
  4. Najboljših 24 vprašanj o strojnem učenju

Kategorija: