Uvod v R Pakete

Paket je zbirka funkcij in nabora podatkov. Paketi pomagajo povečati funkcionalnost programskega jezika. Če želimo shraniti in obdelovati zbirke podatkov (tj. SQL, kot so funkcionalnosti z uporabo podatkovnih okvirjev), lahko v R. paketu uporabimo paket dplyr in paketi tudi dokumentacijo o uporabi funkcij in naborov podatkov v določenem paketu.

Kje najdemo pakete?

Paketi so na voljo na internetu prek različnih virov. Vendar pa obstajajo določena zaupanja vredna skladišča, iz katerih lahko naložimo pakete.

Tu sta dve pomembni repozitoriji, ki sta na voljo na spletu.

  • CRAN (Celovito arhivsko omrežje R): To je uradna R skupnost z mrežo FTP in spletnih strežnikov, ki vsebuje najnovejšo kodo in dokumentacijo R. Preden objavite svoje pakete na spletu, gre skozi vrsto testov, ki se držijo CRAN-ove politike .
  • GitHub: GitHub je še eno znano skladišče, vendar ni specifično za R.Spletna skupnost lahko svoje pakete deli z drugimi ljudmi, zato se uporablja za nadzor različic. GitHub je odprtokodni in nima nobenega postopka pregleda.

Seznam uporabnih R paketov

R obstaja več paketov, ki jih je mogoče prenesti s CRAN ali GitHub. Spodaj so paketi, ki jih je mogoče uporabiti za posebne namene.

1. Nalaganje podatkov iz zunanjih virov

  • Haven: R bere in piše podatke iz SAS-a.
  • DBI: T vzpostaviti komunikacijo med relacijsko bazo podatkov in R.
  • RSQlite: Uporablja se za branje podatkov iz relacijskih baz podatkov.

2. Manipulacija podatkov

  • Dplyr: Uporablja se za obdelavo podatkov, kot je podnastavitev, omogoča bližnjice do dostopa do podatkov in ustvarja sql poizvedbe.
  • Tidyr - Uporablja se za pretvorbo podatkov v drobne formate.
  • stringr - manipuliranje nizov in izrazov znakov.
  • mazanje - za delo s podatki in časom.

3. Vizualizacija podatkov

  • Rgl: Delo na 3D vizualizacijah.
  • ggvis: Za ustvarjanje in gradnjo gramatike grafike.
  • googlevis: Uporaba orodij za vizualizacijo google v R.

4. Spletni paketi

  1. XML: branje in pisanje dokumentov XML v R.
  2. Httpr: Delajte s povezavami http.
  3. Jsonlite: Za branje podatkovnih tabel json.

Pridobitev R paketov

Razpoložljive pakete, ki so v R, lahko preverimo s spodnjo kodo.

  • available.packages (): V omrežju CRAN je na voljo približno 5200 paketov.

CRAN ima poglede naloge, ki združujejo pakete v določeno temo.

Namestitev R paketov

Pakete lahko namestimo neposredno prek IDE ali prek ukazov. Za namestitev paketov uporabimo spodnjo funkcijo in določimo ime paketa.

Sintaksa:

install.packages()

Koda:

install.packages(“ggplot2”)

Zgornja koda namesti paket ggplot2 in njegove odvisne pakete, če obstajajo.

Hkrati lahko namestimo več paketov, tako da pod vektorjem znakov določimo imena paketov.

Sintaksa:

install.packages(c(“package 1”, ”package 2”, ”package 3”))

Koda:

install.packages(c(“ggplot2”, ”slidify”, ”deplyr”))

Namestitev s programom R Studio

Prednost uporabe R studia je, da je GUI (Graphical User interface). Izberemo lahko pakete za namestitev in vir tega.

Lahko gremo na orodja -> Namestite pakete.

Nalaganje R paketov

Po namestitvi paketa R jih moramo naložiti v R, da začnemo uporabljati nameščene pakete.

Spodnjo funkcijo uporabljamo za nalaganje paketov.

Sintaksa:

library(package name)

Opomba: V paketu ni treba navesti imena paketa.

Koda:

library(ggplot2)

Obstajajo določeni paketi, ki pri nalaganju prikažejo sporočila. Nekateri od njih, ne. Podrobnosti knjižnice, ki je nameščena, lahko vidimo s pomočjo spodnje kode.

Koda:

library(ggplot2)
search()

Izhod:

"Paket: rešetka" "paket: ggplot2" "paket: madelides"

"Paket: knitr" "paket: slidify" "orodja: rstudio"

Ustvarjanje lastnega paketa

Preden bomo ustvarili svoj paket. Spodaj bi morali imeti v mislih spodnji kontrolni seznam, preden nadaljujemo z izdelavo paketa.

  • Organiziranje kode je ena najpomembnejših stvari med pisanjem kode v paketu. Polovico časa izgubimo pri iskanju lokacije kode, namesto da bi jo izboljšali. Vse datoteke shranite v enostavno dostopno mapo.
  • Če dokumentirate kodo, boste lažje razumeli namen kode. Ko kode ne pregledamo pogosto, pozabimo, zakaj smo jo napisali na določen način. Ljudem lahko pomaga tudi, da bolje razumejo vašo kodo, če jih delite z njimi.
  • Skupna raba skriptov po e-pošti je postala arhaična. Preprost način je, da svojo kodo naložite in distribuirate na GitHub. Mogoče boste dobili povratne informacije, ki vam bodo pomagale izboljšati kodo.

Če želite ustvariti svoj paket, moramo namestiti paket devtools.

Koda:

install.packages("devtools")

Za pomoč pri dokumentaciji lahko uporabimo spodnji paket.

Koda:

install.packages("roxygen2")

Po namestitvi paketa devtools. Lahko ustvarite svoj paket.

Koda:

devtools::create ("packagename")

Namesto imena "paketa" lahko navedete želeno ime. Zdaj lahko v ta paket dodate svoje funkcije.

Ustvarite lahko isto ime datoteke kot ime funkcije.

Sintaksa:

Devtools:create(“firstpackage”)

Distribucijski paket

Svoj paket lahko distribuirate na github z uporabo paketa devtools.

Spodnjo kodo uporabljamo za distribucijo našega paketa na github.

Koda:

devtools::install_github("yourusername/firstpackage")

Lahko navedete uporabniško ime in ime paketa github, ki ste ga ustvarili zgoraj.

Tu so potrebne datoteke za paket

  • Funkcije
  • Dokumentacija
  • Podatki

Ko imamo vse zgornje datoteke, jih je dobro objaviti v skladišču.

Priporočeni članki

To je vodnik za R Pakete. Tukaj razpravljamo o seznamu uporabnih R paketov, namestitvi paketov s programom R studio in ustvarjanju lastnega paketa itd. Če želite izvedeti več, si oglejte tudi naslednje članke -

  1. Kaj je programski jezik R?
  2. Poklic v R programiranju
  3. R Programiranje proti Pythonu
  4. MySQL vs SQLite
  5. Seznam R paketov

Kategorija: