Uvod v Scatterplot in R

  • R je odprtokodni programski jezik, ki se uporablja za statistiko podatkov in analizo podatkov. Z naraščajočo priljubljenostjo podatkovne znanosti je R pridobila tudi priljubljenost. Uporabljajo ga predvsem statistiki podatkov in rudarji podatkov za pridobivanje dragocenih informacij iz podatkov. R je interpretiran jezik in ima vmesnik ukazne vrstice, vendar je na voljo veliko grafičnih uporabniških vmesnikov za olajšanje delovnih mest razvijalca. R ponuja veliko različnih knjižnic za izvajanje statistike in grafičnih tehnik. R ponuja statično grafiko; uporabniku omogoča izdelavo večplastnega grafa. Tako izdeluje grafe kakovosti objav in zagotavlja boljšo zastopanost informacij.
  • R ponuja ogromen nabor knjižnic za grafično implementacijo, najbolj priljubljen pa je "ggplot2". GGPlot2 je izvedba "Gramatike grafike", zaradi česar je izdelava zapletenih grafov preprosta. Ponuja programski vmesnik za določanje spremenljivk, njihovega položaja, barve grafa, vrst grafa in drugih lastnosti vizualizacije. Omogoča vam grajenje grafov korak za korakom, kar vam omogoča, da ustvarite sloje za veliko prožnost in kakovost objave.
  • Ena takih vrst grafov je Scatterplot v R. Scatterplot v R, ki se imenuje tudi razpredelnica, ki je vrsta grafa, ki prikazuje korelacijo med dvema spremenljivkama. Podatkovne točke prikazuje v obliki pik. Lahko se vleče med neprekinjeno neodvisno spremenljivko in drugo spremenljivko, ki je odvisna od prejšnje spremenljivke ali dveh neprekinjenih neodvisnih spremenljivk. Korelacija je lahko pozitivna, negativna ali nična. Če je naklon grafa od spodnje leve do zgornje desne, je korelacija pozitivna. Če je naklon od zgornje leve do spodnje desne, je korelacija negativna ali z drugimi besedami povečanje vrednosti ene spremenljivke zmanjša vrednost druge spremenljivke.

Sintaksa: V R-jih za grafe obstaja veliko paketov, zato obstaja veliko funkcij za ustvarjanje Scatterplota v R. Najbolj osnovna in preprosta funkcija je

ploskvi (x, y)

kje

x označuje vodoravno os ali neodvisno neprekinjeno spremenljivko.

y označuje navpično os ali odvisno spremenljivko.

Obstaja veliko drugih parametrov za risanje funkcije, da je graf enostavno razumeti.

Spodaj je nekaj z definicijo:

  • glavni: v graf doda naslov
  • xlab: dodajte oznako na os x
  • ylab: doda osi y nalepko
  • xlim: določa obseg osi x
  • ylim: določa območje osi y
  • pch: označuje obliko točk v plotni ploskvi
  • cex: označuje velikost točk
  • col: določa barvo točk

S paketom ggplot2 lahko ustvarite tudi Scatterplot v R. Za to moramo najprej namestiti in naložiti paket ggplot2. Ko dodate paket trenutni seji spodaj, lahko s pomočjo ukaza ustvarite Scatterplot v R.

ggplot (nabor podatkov, aes (x, y, barva, oblika)) + geom_poin () + labs (x, y, naslov)

kje

  • nabor podatkov je nabor podatkov, za katerega je treba ustvariti razpršilec.
  • aes () je estetsko preslikavo v grafu. Opisuje, kako so spremenljivke preslikane na grafu.
  • x je vodoravna os ali neodvisna neprekinjena spremenljivka.
  • y je navpična os ali odvisna spremenljivka.
  • barva je dodati barvo točkam, ki temeljijo na razvrščanju spremenljivk.
  • oblika se uporablja za določitev oblike na podlagi spremenljivk združevanja.
  • znak + pomeni, da se ukaz nadaljuje.
  • geom_point () je funkcija za raztresenost ploskve.
  • labs (x, y, title): v graf dodajte x label, y label in title.

Ustvari Scatterplot In R

Če želite ustvariti Scatterplot v R, moramo najprej naložiti nabor podatkov. Tu uporabljamo nabor podatkov (mtcars), ki jih ponuja R. Najprej naloži nabor podatkov v trenutno sejo z uporabo spodaj ukaza

podatki (šarenice)

Ko se nabor podatkov naloži, si oglejte podatke, da dobite osnovno razumevanje vrste podatkov in stolpcev v njem s spodnjim ukazom.

iris

Po osnovnem razumevanju podatkov omogočimo ustvarjanje preprostega razpršilnika s pomočjo funkcije črta

zaplet (iris $ Sepal.Length, iris $ Sepal.Width, xlim = c (4.0, 9.0), ylim = c (2.0, 5.0))

Dodajanje nalepk, da bo graf berljiv

ploskve (iris $ Sepal.Length, iris $ Sepal.Width, xlim = c (4, 0, 9, 0), ylim = c (2, 0, 4, 0), xlab = "Dolžina Sepal", ylab = "Širina sepala", glavna = "Širina vs dolžina ")

Dodajte še nekaj parametrov, da naredite graf bolj privlačen

ploskve (iris $ Sepal.Length, iris $ Sepal.Width, xlim = c (4, 0, 9, 0), ylim = c (2, 0, 4, 0), xlab = "Dolžina Sepal", ylab = "Širina sepala", glavna = "Širina vs dolžina ", pch = 8, cex = 1, 5, col = 6)

Poleg teh 2-D ploskev lahko v R. ustvarite tudi matrične in 3-D ploskve.

Matrice za raztresenost

Kadar imamo v naboru podatkov več kot dve spremenljivki in želimo najti korelacijo vsake spremenljivke z vsemi drugimi spremenljivkami, potem uporabimo matrico rasipanja. Najosnovnejši in najpreprostejši ukaz za matrico scatterplot je:

pari (~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, podatki = šarenica, glavni = ”Matrica Scatterplot”)

Zgornji graf prikazuje korelacijo med težo, mpg, dsp in cilindrom.

Scatterplot 3D

Včasih tridimenzionalni graf bolje razume podatke. Za ta R ponuja več paketov, eden od njih je "scatterplot3d". Spodaj so ukazi za namestitev "scatterplot3d" v delovni prostor R in ga naloži v trenutni seji

install.packages ("scatterplot3d")

knjižnica (scatterplot3d)

Po nalaganju knjižnice bo izvedba spodnjih ukazov ustvarila 3-D razpršilec.

priloga (šarenica)

scatterplot3d (Sepal.Length, Sepal.Width, Petal.Length, main = "3D Scatterplot")

Poleg tega obstaja še veliko drugih načinov za ustvarjanje tridimenzionalnega. Uporabniki lahko dodajo tudi podrobnosti, kot so barva, naslovi za boljši grafikon. Uporabnik lahko ustvari tudi interaktivni 3D-razpršilec s pomočjo funkcije "plot3D (x, y, z)", ki jo ponuja paket "rgl". Ta funkcija ustvarja vrteči se 3D razpršilec, ki ga je mogoče zasukati z miško. Tako dobimo popoln pregled korelacije med spremenljivkami.

Zaključek

R je eden najbolj znanih jezikov za izvajanje grafičnih tehnik, ki jih uporabljajo podatkovni znanstveniki. Ponuja široko paleto paketov in knjižnic za grafiko in boljše razumevanje podatkov. "Gglpot2", "ggvis", "rgl", "plot3d", "rešetka", "animacija", "gganimate", "kairo" so nekateri od paketov, ki jih ponuja R.

Načrt z razpršitvijo je najpreprostejši način za boljše razumevanje podatkov. S pomočjo te vizualizacije lahko uporabnik spozna, kako so spremenljivke povezane med seboj, kako bo sprememba vrednosti ene spremenljivke spremenila vrednost drugih spremenljivk itd. Nagib grafikona pove o pozitivnem in negativnem razmerju med spremenljivkami.

Priporočeni članki

To je vodnik za Scatterplot v R. Tukaj razpravljamo o uvodu, matrikah raztresenosti, raztresenosti 3D, kako ustvariti raztresenost? skupaj z ustreznimi primeri. Če želite izvedeti več, lahko preberete tudi druge naše predlagane članke -

  1. Kaj je GraphQL
  2. Scrum Framework
  3. R Intervju Vprašanja
  4. Uvod v binomno porazdelitev v R

Kategorija: