Uvod v polinomsko regresijo

Regresija je opredeljena kot metoda za iskanje razmerja med neodvisnimi in odvisnimi spremenljivkami za napovedovanje rezultata. Prvi polinomski regresijski model je leta 1815 uporabil Gergonne. Uporablja se za iskanje najbolj primerne črte z regresijsko črto za napovedovanje rezultatov. Obstaja veliko vrst regresijskih tehnik, polinomna regresija je ena izmed njih. Preden to razumete, je priporočljivo pravilno poznavanje linearne regresije, tako da boste lahko med njimi zlahka zaznali razlike.

Zakaj polinomna regresija?

  • To je ena izmed regresijskih tehnik, ki jo profesionalci uporabljajo za napovedovanje izida. Opredeljen je kot razmerje med neodvisnimi in odvisnimi spremenljivkami, kadar je odvisna spremenljivka povezana z neodvisno spremenljivko, ki ima n-to stopnjo. Ne zahteva, da je razmerje med odvisnimi in neodvisnimi spremenljivkami linearno, tako da če je premica krivulja, potem ima lahko katerikoli polinomni izraz.
  • Glavna razlika med linearno in polinomsko regresijo je v tem, da linearna regresija zahteva, da so odvisne in neodvisne spremenljivke linearno povezane, medtem ko se to lahko bolje prilega črti, če v enačbo vključimo kakšno višjo stopnjo neodvisnemu izrazu spremenljivke. Enačba polinomske regresije z n-to stopnjo lahko zapišemo kot:

Y = b0 + a1x + a2x 2 + a3x 3 +…. anx n

  • Če dodamo višje stopnje, kot je kvadratna, potem črto spremeni v krivuljo, ki bolje ustreza podatkom. Na splošno se uporablja, kadar so točke v naboru podatkov raztresene in linearni model ne more jasno opisati rezultata. Vedno moramo paziti na prekomerno opremljanje in premalo pri tem, ko upoštevamo te stopnje enačbe.
  • Bolje je upoštevati stopnjo, ki prehaja skozi vse podatkovne točke, včasih pa lahko višja stopnja, kot je 10 ali 20, preide skozi vse podatkovne točke in zmanjša napako, hkrati pa zajame tudi hrup podatkov, ki ustreza modelu in izogniti se je mogoče z dodajanjem več vzorcev v nabor podatkov o vadbi. Torej, vedno je priporočljivo izbrati optimalno stopnjo, ki ustreza modelu.

Pri določanju stopnje enačbe se uporabljata dve tehniki:

  • Izbira naprej: To je metoda povečanja stopnje, dokler ni dovolj pomembna za opredelitev modela.
  • Izbira nazaj: To je metoda zmanjšanja stopnje, dokler ni dovolj pomembna za opredelitev modela.

Postopek za uporabo polinomske regresije

Poiščite spodnje korake ali postopek za uporabo polinomne regresije na katerem koli naboru podatkov:

1. korak: Uvoz ustreznega nabora podatkov na katero koli platformo (R ali Python) in namestite potrebne pakete, potrebne za uporabo modela.

2. korak: Nabor podatkov razdelite na naloge za usposabljanje in testiranje, tako da lahko algoritem uporabimo nabor podatkov o vadbi in ga preizkusimo s pomočjo nabora podatkov za testiranje.

3. korak: Uporabite raziskovalne metode analize podatkov, da preučite ozadje podatkov, kot so povprečje, srednja vrednost, način, prvi kvartil, drugi kvartil itd.

4. korak: Uporabite algoritem linearne regresije na nabor podatkov in preučite model.

5. korak: Uporabite algoritem polinomske regresije na nabor podatkov in preučite model za primerjavo rezultatov bodisi RMSE bodisi R kvadrat med linearno regresijo in polinomno regresijo.

6. korak: Vizualizirajte in predvidite rezultate linearne in polinomne regresije in ugotovite, kateri model napoveduje nabor podatkov z boljšimi rezultati.

Uporaba polinomskih regresij

  • Uporablja se v mnogih eksperimentalnih postopkih za ustvarjanje rezultata s to enačbo.
  • Omogoča odlično definirano razmerje med neodvisnimi in odvisnimi spremenljivkami.
  • Uporablja se za proučevanje izotopov usedlin.
  • Uporablja se za proučevanje porasta različnih bolezni znotraj katere koli populacije.
  • Uporablja se za proučevanje nastajanja katere koli sinteze.

Značilnosti polinomne regresije

  • Gre za vrsto nelinearne regresijske metode, ki nam pove razmerje med neodvisno in odvisno spremenljivko, kadar je odvisna spremenljivka povezana z neodvisno spremenljivko n-te stopnje.
  • Najprimernejša črta se določi glede na stopnjo regresijske enačbe polinoma.
  • Na model, ki izhaja iz polinomske regresije, vplivajo odpuščaji, zato je vedno bolje obdelati odpuščevalce, preden algoritem nanesemo na nabor podatkov.
  • Polinomska funkcija () se pretvori v značilnost matrice, odvisno od stopnje enačbe.
  • Narava krivulje je mogoče preučiti ali vizualizirati s pomočjo preprostega diagrama raztresenosti, ki vam bo omogočil boljšo predstavo o linearnosti razmerja med spremenljivkami in se o tem odločil.

Zaključek

Polinomna regresija se uporablja v mnogih organizacijah, kadar ugotovijo nelinearno povezavo med neodvisnimi in odvisnimi spremenljivkami. Je ena izmed težjih regresijskih tehnik v primerjavi z drugimi regresijskimi metodami, zato vam bo poglobljeno znanje o pristopu in algoritmu pomagalo doseči boljše rezultate.

Priporočeni članki

To je vodnik za polinomsko regresijo. Tukaj razpravljamo o lastnostih in uporabih polinomske regresije. Obiščite lahko tudi druge naše predlagane članke, če želite izvedeti več -

  1. Algoritem SVM
  2. Metode jedrca
  3. LINEST Excel funkcija
  4. Algoritmi strojnega učenja
  5. Linearna regresija proti logistični regresiji | Najboljše razlike

Kategorija: