Uvod v histogram v R

V tem članku bomo začeli z osnovnim histogramom pri izvajanju R in prilagajanju. Histogram ima pomembno vlogo pri analizi podatkov za vizualizacijo podatkov. R programiranje je posebno okolje za statistično računalništvo in osnove za podatkovne vede. V R programiranju so nabori podatkov in funkcij združeni v obliki paketov. Večina programov za vizualno analitiko uporablja histograme in širino koša je privzeta. Omogočajo hitro razumevanje podatkov, ki je glavna vloga o podatkih. Tu bomo izdelali histogram z ukazi R.

Kaj je histogram?

Histogram je slikovna predstavitev porazdelitve nabora podatkov, s katero bi zlahka analizirali, kateri dejavnik ima večjo količino podatkov in najmanj podatkov. Z drugimi besedami, histogram omogoča izvajanje kumulativnih frekvenčnih grafov v osi x in osi y. Pravzaprav histogrami zajemajo tako združene kot nerazvrščene podatke. Za združene podatke se histogram oblikuje z upoštevanjem meja razreda, medtem ko je za nerazvrščene podatke potrebno oblikovati združeno frekvenčno porazdelitev. Pomagajo učinkovito analizirati obseg in lokacijo podatkov. Med distribucijo podatkov se uporablja neka skupna struktura histogramov, kot so običajni, nagnjeni, klifi.

Za razliko od vrstice, histogram grafikona nima vrzeli med črticami, palice pa so poimenovane kot smetnjaki, s katerimi so podatki predstavljeni v enakih intervalih. Histogram Vzame neprekinjeno spremenljivko in se razdeli na intervale, potrebno je izbrati pravilno širino posode. Glavna razlika med črtnim grafikonom in histogramom je v tem, da prvi uporabijo nominalne nabore podatkov za risanje, medtem ko histogram nariše neprekinjene naloge podatkov. R uporablja funkcijo hist () za ustvarjanje histogramov. Ta funkcija hist () uporablja vektor vrednosti za risanje histograma. Histogram obsega obseg zveznih vrednosti osi x, črta osi y pogostih vrednosti podatkov v osi x s palicami višin.

Sintaksa:

Skladnja za ustvarjanje histograma je

hist (v, main, xlab, xlim, ylim, breaks, col, border)
where v – vector with numeric values
main – denotes title of the chart
col – sets color
border -sets border color to the bar
xlab - description of x-axis
xlim - denotes to specify range of values on x-axis
ylim – specifies range values on y-axis
break – specifies the width of each bar.

Ustvarjanje histograma v R

Namenski histogram za analizo zahteva nekaj vgrajenega nabora podatkov za uvoz v R. R, njegove knjižnice pa imajo različne grafične pakete in funkcije. Tu uporabljamo nabor podatkov swiss in Air Passengers. Za izračun histograma za določeno vrednost podatkov vrednosti hist () se uporablja skupaj z znakom $ za izbiro določenega stolpca podatkov iz nabora podatkov za ustvarjanje histograma.

Naslednji primer izračuna histogram vrednosti podatkov v stolpcu Pregled baze podatkov z imenom Swiss.

Primer 1: Ustvarimo preprost histogram

Koda:

hist (swiss $Examination)

Izhod:

Hist je ustvarjen za podatkovni stolp s pregledom stolpcev. to preprosto nariše smetnjak s frekvenco in osi x.

Primer 2: Histogram z več argumenti

Za boljše razumevanje histogramov moramo funkciji hist dodati več argumentov za optimizacijo vizualizacije grafikona. Funkciji se dodajo oznake x in y v obseg vrednosti xlim in ylim argumentom.

Primer:

hist (Air Passengers, xlim=c (150, 600), ylim=c (0, 35))
In the above example x limit varies from 150 to 600 and Y – 0 to 35.
// Adding breaks
hist (AirPassengers,
main="Histogram with more Arg",
xlab="Name List",
border="Green",
col="Orange",
xlim=c (100, 600),
ylim=c(0, 40),
breaks=5)

Izhod:

Zgornja koda nariše histogram za vrednosti iz nabora podatkov Air Passengers, z naslovom "Histogram za več arg", oznako osi x kot "Imenik", z zeleno obrobo in rumeno barvo do vrstic, tako da omeji polje vrednost od 100 do 600, vrednosti, ki so na osi y natisnjene za 2, širina smetnjaka pa 5.

Dodajanje dveh različnih barv v bar

hist (swiss$Examination, col=c ("violet”, "Chocolate2"), xlab="Examination”, las =1, main=" color histogram")

Izhod:

Dodajanje več črt na histogram

hist (swiss$Education, breaks=40, col="violet", xlab="Education", main=" Extra bar histogram")

Izhod:

Primer 3: Histogram v R Vrne vrednost

Air <- AirPassengers
hist (Air)
h <- hist (Air)
h
$breaks

Izhod:

Primer 4: Uporaba argumenta Break za spremembo širine koša

Če želite med širino imeti več prelomnih točk, je bolje uporabiti vrednost v c () funkciji.

hist (AirPassengers, breaks=c (100, seq (200, 700, 150)))

Izhod:

Zgornji graf upošteva širino vrstice skozi vrednosti zaporedja.

Primer 5: Izvedba krivulje normalne porazdelitve v histogramu

Za podatkovne vrednosti bomo uporabili nabor podatkov "swiss" za risanje grafa. Tu se za prikaz razdelilne vrstice uporablja funkcijska krivulja ().

Koda:

curve (dnorm(x, mean=mean(swiss$Education), sd=sd(swiss$Education)), add=TRUE, col="red")

Izhod:

Primer 6: Porazdelitev verjetnosti načrtovanja

hist (AirPassengers,
main="Histogram ",
xlab="Passengers",
border="Yellow",
col="pink",
xlim=c(100, 600),
las=2,
breaks=6,
prob = TRUE)

Ustvarjanje ploskev gostote v histogramu v R

Razdelitev spremenljivke se ustvari s funkcijsko gostoto (). Spodaj je primer z mtcars nabora podatkov. Ploske gostote pomagajo pri porazdelitvi oblike.

density () // this function returns the density of the data
library(ggplot2)
d <- density (mtcars $qsec)
plot (d, main=" Density of Miles Per second")
polygon (d, col="orange",>

Izhod:

Using Line () function
hist (swiss$Examination, freq = FALSE, col=c ("violet”, "Chocolate2"),
xlab="Examination”, las =1, main=" Line Histogram")
lines(density(swiss$Examination), lwd = 4, col = "red")

Naslednji histogram v R prikazuje višino kot pregled na osi x, gostota pa je narisana na osi y.

Izhod:

Zaključek

To je vse o histogramu in natančno je histogram najlažji način za razumevanje podatkov. Kot smo videli s histogramom, lahko narišemo enojne, več grafikonov z uporabo širine zabojnika, korekcije osi, spreminjanja barv itd. Histogram pomaga pri prikazu različnih oblik podatkov. Nazadnje smo videli, kako histogram omogoča analizo naborov podatkov in vmesne točke kot oznake razreda. Histogram pomaga pri spreminjanju intervalov, da ustvari boljši opis podatkov in deluje, zlasti s številčnimi podatki. histogrami so v analizi bolj prednostni zaradi njihove prednosti prikazovanja velikega niza podatkov. Glede na izhodne podatke smo lahko vizualno skenirali podatke in preprosto podali nekatere predpostavke.

Priporočeni članki

To je vodnik o histogramu v R. Tu smo razpravljali o konceptu, sintaksi in kako ustvariti histogram v R s primeri. Če želite izvedeti več, si oglejte tudi naslednje članke -

  1. Primeri histograma
  2. Poklicna pot v R programiranju
  3. Ganttova karta v Tableauu
  4. Poklic v računalniškem programiranju
  5. Kako ustvariti linijski graf v R?

Kategorija: