Pregled R podatkovnega okvira

Podatkovni okviri so seznam vektorjev z enako dolžino. Razlika med matrico in podatkovnimi okviri je v tem, da podatkovni okviri sprejemajo različne vrste podatkov. (Znak, številka itd.) V tej temi bomo spoznali R Data Frame.

Prednosti uporabe podatkovnih okvirjev

  • Razdeljeno zbiranje podatkov in organizirano.
  • Ima boljše optimizacije v primerjavi z relacijsko bazo podatkov.
  • Hrani raznolike podatke, ki so raznoliki.

Ustvarjanje podatkovnega okvira v R

Ustvarjamo podatkovni okvir. Spodaj je primer za prijavo okvira podatkov.

Data_frame <- data.frame (variable 1, variable 2, variable n…)

V zgornjem primeru nismo definirali spremenljivk. Poglejmo zdaj, kako vrednosti dodelimo spremenljivkam in jih shranimo v podatkovni okvir.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)

Izhod:

Število alfa Booleans

1 2 x TRUE

2 3 y TRUE

3 4 z FALSE

Struktura podatkovnega okvira

Ko želimo poznati strukturo določenega podatkovnega okvira. Lahko uporabimo spodnjo funkcijo.

Zvezda ()

str(Data_frame)

Izhod:

Številka: številka 2 3 4

alfa: faktor w / 3 ravni "x", "y", "z": 1 2 3

Booleans: logi TRUE TRUE FALSE

Pridobivanje specifičnih podatkov iz podatkovnega okvira

1. Uporaba imena stolpca

Iz podatkovnega okvira lahko izvlečemo določen niz podatkov.

Iz zgornjega primera izvzamemo samo prvi stolpec iz podatkovnega okvira, ki je število.

Data_ frame <- data. Frame(Number)

Izhod:

Številka

1 2

2 3

3 4

2. Uporaba vrstic

Podatke lahko izvlečemo iz vrstic tako kot v spodnjem primeru.

Denimo, da želimo natisniti samo dve vrstici stolpca Število.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)

Izhod:

Število alfa Booleans

1 2 x TRUE

2 3 y TRUE

3 4 z FALSE

------------

Število alfa Booleans

1 2 x TRUE

2 3 y TRUE

Lahko opazimo razliko v prvem in drugem izhodu.

3. Tiskanje določenih vrstic in stolpcev

Natisnemo lahko tudi določene vrstice in stolpce.

V spodnjem primeru natisnemo 1. in 2. vrstico, stolpce

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)

Izhod:

Število alfa Booleans

1 2 x TRUE

2 3 y TRUE

3 4 z FALSE

-------------

Številka alfa

1 2 x

2 3 y

4. Dodajanje novega stolpca v podatkovni okvir

V podatkovni okvir lahko dodamo še en stolpec skupaj z vrednostmi.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)

Izhod:

Število alfa Booleans razred

1 2 x TRUE A

2 3 y TRUE B

3 4 z FALSE C

5. Dodajanje vrstice v podatkovni okvir

S funkcijo rbind dodamo novo vrstico v obstoječi podatkovni okvir.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)

Izhod:

Število alfa Booleans razred

1 2 x TRUE A

2 3 y TRUE B

3 4 z FALSE C

4 5 x FALSE D

6. Združitev obeh podatkovnih okvirov

Prav tako lahko kombiniramo dva podatkovna okvira za izdelavo enega izhoda.

Za združitev dveh podatkovnih okvirov moramo imeti isti stolpec za podatkovne okvire.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)

Izhod:

Število alfa Booleans
1 2 x TRUE
2 3 y TRUE
3 4 z FALSE
-------------––
Število alfa Booleans
1 4 x TRUE
2 5 y TRUE
3 6 z FALSE

-------------––

Število alfa Booleans
1 2 x TRUE
2 3 y TRUE
3 4 z FALSE
4 4 x TRUE
5 5 y TRUE
6 6 z ZAVOR

Pregledovanje podatkovnih okvirjev

Spodaj so različni načini vpogleda v podatkovni okvir in informacije o podatkovnem okviru tako kot zgoraj navedena funkcija zvezd.

1. Names - Navede imena spremenljivk v podatkovnem okviru

Sintaksa : names(data frame name)

Primer

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)

izhod : (1) "Številka" "alfa" "Booleans"

2. Povzetek - podaja statistiko podatkovnega okvira.

Sintaksa: summary(data frame name)

Primer

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)

Izhod:

Število alfa Booleans
Min. : 2, 0 x: 1 Način: logičen
1. Qu.:2.5 y: 1 FALSE: 1
Mediana: 3, 0 z: 1 TRUE: 2
Srednja vrednost: 3, 0 NA: 0
3. kvant ..5
Najv. : 4.0

3. Head - poda podatke za prvih nekaj vrstic.

Sintaksa: Head( name of the data frame)

Primer

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)

Izhod:

Število alfa Booleans
1 2 x TRUE
2 3 y TRUE
3 4 z FALSE
4 5 A TRUE
5 6 b ZAVOR
6 7 c ZAVOR

4. Tail - Natisne zadnjih nekaj vrstic v podatkovni okvir.

Sintaksa: tail( name of the data frame)

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)

Izhod:

Število alfa Booleans
5 6 b ZAVOR
6 7 c ZAVOR
7 8 d ZAVOR
8 9 f ZAVOR
9 10 g ZAVOR
10 11 j LAŽNO

Zaključek

Podatkovni okviri so pomemben koncept v R programiranju. Pri ustvarjanju naborov podatkov, ki jih je mogoče enostavno spreminjati in dostopati do njih, je preprosto, vendar zmogljivo. Tako kot do matrike je do podatkovnih nizov mogoče dostopati prek imen vrstic in stolpcev, pri čemer je enostavno dodajanje in odstranjevanje podatkov.

Priporočeni članki

To je vodnik za R Data Frame. Tukaj razpravljamo o Ustvarjanju podatkovnega okvira v R s strukturo in pridobivanju določenih podatkov iz podatkovnega okvira. Za več informacij si lahko ogledate tudi naslednje članke -

  1. Vrste podatkov na C
  2. Podatkovna kariera
  3. Tehnologije velikih podatkov
  4. Podatkovna platforma za znanost
  5. Java Booleans

Kategorija: