Uvod v multivariatno regresijo
- Izraz v multivariatnem pomeni model z več kot eno spremenljivko
- Multivariatna regresija je del multivariatne statistike.
- Multivariatna regresija je tehnika, ki se uporablja za oceno posameznega regresijskega modela, če obstaja več kot ena spremenljivka izida.
- V multivariatni regresiji se pogosto uporablja algoritem strojnega učenja, ki je algoritem nadzorovanega učenja.
Zakaj posamezni regresijski model ne bo deloval?
- Kot je znano, se regresijska analiza uporablja predvsem za raziskovanje odnosa med odvisno in neodvisno spremenljivko.
- V resničnem svetu je veliko situacij, ko na številne neodvisne spremenljivke vplivajo druge spremenljivke, zato se moramo premakniti na različne možnosti kot en sam regresijski model, ki lahko sprejme samo eno neodvisno spremenljivko.
Kaj je multivariatna regresija?
- Multivariatna regresija pomaga uporabiti za merjenje kota več kot ene neodvisne spremenljivke in več kot ene odvisne spremenljivke. Ugotavlja razmerje med spremenljivkami (linearno sorodne).
- Nekdaj je napovedoval vedenje spremenljivke izida in povezavo spremenljivk napovedovalca ter kako se spreminjajo prediktorjeve spremenljivke.
- Uporablja se lahko na številnih praktičnih področjih, kot so politika, ekonomija, medicina, raziskovalna dela in številna različna podjetja.
- Multivariatna regresija je preprost podaljšek multiple regresije.
- Večkratna regresija se uporablja za napovedovanje in izmenjavo vrednosti ene spremenljivke na podlagi skupne vrednosti več kot ene vrednosti spremenljivk napovedovalca.
- Najprej bomo vzeli primer za razumevanje uporabe multivariatne regresije, nato pa bomo iskali rešitev tega vprašanja.
Primeri multivariatne regresije
- Če je podjetje za e-trgovino zbralo podatke svojih strank, kot so starost, zgodovina nakupa stranke, spol in podjetje, želijo najti razmerje med temi različnimi odvisnimi in neodvisnimi spremenljivkami.
- Telovadni trener je zbral podatke svoje stranke, ki prihajajo v njegovo telovadnico in želijo opazovati nekatere odjemalčeve stvari, ki so zdravje, prehranjevalne navade (katere vrste izdelek porabi vsak teden), teža stranke. Ta želi najti razmerje med temi spremenljivkami.
Kot ste videli v zgornjih dveh primerih, da je v obeh situacijah več spremenljivk, nekatere so odvisne, nekatere pa neodvisne, zato enotna regresija ni dovolj za analizo tovrstnih podatkov.
Tu je multivariatna regresija, ki pride v sliko.
1. Izbira funkcij -
Izbor lastnosti igra najpomembnejšo vlogo pri multivariatni regresiji.
Iskanje funkcije, ki je potrebna za iskanje, katera spremenljivka je odvisna od te funkcije.
2. Normaliziranje funkcij -
Za boljšo analizo je treba spremeniti značilnosti, da jih dosežemo v določenem območju. Prav tako lahko spremenimo vrednost vsake funkcije.
3. Izberite funkcijo izgube in hipotezo -
Funkcija izgube izračuna izgubo, ko hipoteza napove napačno vrednost.
In hipoteza pomeni predvideno vrednost spremenljivke lastnosti.
4. Nastavite parametre hipoteze -
Nastavite parameter hipoteze, ki lahko zmanjša izgubo in lahko napove.
5. Zmanjšajte funkcijo izgube-
Zmanjšanje izgube z uporabo nekaterih algoritmov za zmanjševanje izgub in uporaba preko nabora podatkov, kar lahko pomaga pri prilagajanju parametrov hipoteze. Ko je izguba zmanjšana, jo lahko uporabimo za napovedovanje.
Obstaja veliko algoritmov, ki se lahko uporabljajo za zmanjšanje izgube, kot je nagib naklona.
6. Preizkusite funkcijo hipoteze -
Preverite funkcijo hipoteze, kako pravilno napoveduje vrednosti, preizkusite jo na testnih podatkih.
Koraki za sledenje arhivske multivariatne regresije
1) Uvozite potrebne skupne knjižnice, kot so numpy, pande
2) Preberite nabor podatkov s pomočjo knjižnice pand
3) Kot smo že razložili, moramo za boljše rezultate normalizirati podatke. Zakaj normalizacija, ker ima vsaka funkcija različen razpon vrednosti.
4) Ustvarite model, ki lahko arhivira regresijo, če uporabljate linearno regresijsko enačbo
Y = mx + c
V katerem je x dan vhod, m je nagnjena črta, c je konstantna, y je izhodna spremenljivka.
5) Trenirajte model s pomočjo hiperparametra. Razumejte, da je hiperparameter nastavljen glede na model. Kot na primer stopnja učenja, epohe, iteracije.
6) Kot je razloženo zgoraj, kako ima hipoteza pomembno vlogo v analizi, preverja hipotezo in meri funkcijo izgube / stroškov.
7) Funkcija izguba / strošek nam bo pomagala izmeriti, koliko je vrednost hipoteze resnična in natančna.
8) Zmanjšanje funkcije izgube / stroškov bo modelu pomagalo izboljšati napoved.
9) Enačbo izgube lahko določimo kot vsoto razlike v kvadratu med predvideno vrednostjo in dejansko vrednostjo, deljeno s dvakratno velikostjo nabora podatkov.
10) Da bi zmanjšali funkcijo izguba / strošek, uporabimo gradientno spuščanje, se začne z naključno vrednostjo in ugotovi točko, ko je njihova funkcija izgube najmanj.
Če sledimo zgoraj navedenemu, lahko izvedemo multivariatno regresijo
Prednosti multivariatne regresije
- Multivariatna tehnika omogoča iskanje razmerja med spremenljivkami ali značilnostmi
- Pomaga najti povezavo med neodvisnimi in odvisnimi spremenljivkami.
Dis Prednosti multivariatne regresije
- Multivariatne tehnike so malo zapleten in matematični izračun na visoki ravni
- Izhodka multivariatnega regresijskega modela ni enostavno razložiti, včasih tudi zato, ker nekateri rezultati izgube in napak niso enaki.
- Tega ni mogoče uporabiti za majhen nabor podatkov, ker so rezultati pri večjih naborih podatkov bolj enostavni.
Zaključek - Multivarijantna regresija
- Glavni namen uporabe multivariatne regresije je, če imate na voljo več kot eno spremenljivko in v tem primeru ena linearna regresija ne bo delovala.
- V resničnem svetu je več spremenljivk ali funkcij, kadar se uporabi več spremenljivk / funkcij, se uporablja multivariatna regresija.
Priporočeni članki
To je vodnik za multivariatno regresijo. Tukaj razpravljamo o Uvodu, Primerih multivariatne regresije, skupaj s prednostmi in prednostmi Dis. Če želite izvedeti več, lahko preberete tudi druge naše predlagane članke -
- Regresijska formula
- Data Science Course v Londonu
- Operaterji SAS
- Tehnike znanosti o podatkih
- Spremenljivke v JavaScript
- Najpomembnejše razlike med regresijo in klasifikacijo