Uvod v orodja za vizualizacijo podatkov:

Vizualizacija podatkov je ključna za razumevanje izida katere koli rešitve ne glede na domeno. Prinaša več statističnih sklepov od razumevanja podatkov, raziskovanja različnih vzorcev med podatki in bolj do rezultata razumevanja modela. Orodja za vizualizacijo podatkov so eno glavnih področij, kjer lahko vsaka oseba stopi v temeljno razumevanje odnosov. Dandanes se širše uporablja na poslovnih srečanjih, zainteresirane strani pa omogočajo lažje prepoznavanje osnovne vrednosti izdelka.

Kaj so orodja za vizualizacijo podatkov?

Obstajajo številna orodja za vizualizacijo podatkov, kot so Tableau, QlikView, FusionCharts, HighCharts, Datawrapper, Ploty, D3.js itd. Čeprav obstajajo humungous orodja za vizualizacijo podatkov, ki se uporabljajo v vsakodnevnem življenju pri vizualizaciji podatkov, eno najbolj priljubljenih orodij za risanje podatkov je matplot.pyplot.

Razlogi, zakaj se Matplotlib iz orodij za vizualizacijo podatkov najbolj uporablja -

  1. Matplotlib je ena najpomembnejših knjižničnih načrtov v pythonu.
  2. Celoten modul za risanje je navdihnjen z orodji za risanje, ki so na voljo v MATLAB.
  3. Glavni razlog je, da veliko ljudi prihaja s področij matematike, fizike, astronomije in statistike, veliko inženirjev in raziskovalcev pa je navajenih na MATLAB.
  4. MATLAB je priljubljeno znanstveno računalniško orodje, zlasti za znanstveno računalništvo. Ko so ljudje, ki začenjajo knjižnico za načrtovanje strojnega učenja / podatkovne znanosti / umetno inteligenco, Python, navdihnili MATLAB in zgradili knjižnico z imenom matplotlib
  • matplotlib.pyplot -

matplotlib.pyplot se pogosto uporablja pri ustvarjanju figur s površino, črtanjem linij, ploskve pa lahko naredimo na privlačen način.

Pojdimo neposredno na zelo preproste primere -

uvoz matplotlib.pyplot kot plt

plt.plot ((2, 4, 6, 4))

Zgoraj je seznam, plt.plot bo narisal te seznamske elemente osi Y, ki je indeksiran na 0, 1, 2, 3 kot njihova ustrezna X-os.

plt.ylabel ("Številke")

plt.xlabel ('Indeksi')

Če pogledamo zgornji dve vrstici kode, na njej označimo os Y in X. (tj. poimenovanje obeh osi.)

plt.title ('MyPlot')

Zgornja vrstica kode bo dala naslov ploskve. Naslov nam pove, za kaj gre zaplet.

plt.show ()

Obstaja ena težava z zgornjo ploskvijo (posnetek zaslona 1), če ste opazili, ne vidimo strukture, podobne mreži. Mreža vam pomaga, da veliko lažje preberete vrednosti iz grafikona. Zdaj pa poglejmo, kako priti do mreže.

plt.plot ((1, 2, 3, 4), (1, 4, 9, 16))

Poglejte zgornjo vrstico kode, namesto da bi dali en niz, imamo dva seznama, ki postaneta naša X in Y. Tu lahko opazite, da če je naša vrednost osi x 2, je ustrezna vrednost osi y enaka 4, tj. Vrednosti osi y so kvadratki vrednosti osi x.

plt.ylabel ('kvadratki')

plt.xlabel ('številke')

plt.grid () # omrežje vklopljeno

V trenutku, ko to daste, bo narisan načrt z vdelano mrežo, kot je prikazano na posnetku 2

plt.show ()

Zdaj namesto črte ploskve oblikujemo drugačno ploskev z drugačnim primerom.

plt.plot ((1, 2, 3, 4), (1, 4, 9, 16), 'ro')

Vsak par X, Y ima pridruženi parameter, kot sta barva in oblika, ki ji lahko dodamo s pomočjo funkcionalnosti argumenta para ključnih besed python.

V tem primeru 'ro' označuje r - rdečo barvo in pike v obliki kroga (kot je prikazano na posnetku 3).

plt.grid ()

plt.show ()

Recimo, da matplot lib deluje samo s seznamom, potem ga ne moremo široko uporabljati pri obdelavi številk. Lahko uporabimo paket NumPy. Prav tako se vse notranje pretvori kot NumPy matrika

Poglejmo nekoliko zaplet:

uvozi numpy kot np

t = np.arange (0, 5, 0, 2)

Zgornja vrstica ustvarja vrednosti od 0 do 5 z intervalom 0, 2.

plt.plot (t, t ** 2, 'b–', oznaka = '2') # 'rs', 'g ^')

plt.plot (t, t ** 2.2, 'rs', oznaka = '2.2 ′)

plt.plot (t, t ** 2, 5, 'g ^', oznaka = '2, 5' ')

V zgornjih vrsticah kode 'b - -' označuje modre črtice, 'rs' označuje rdeče kvadratke, 'g ^' označuje zelene trikotnike (glej posnetek 4)

plt.grid ()

plt.legend ()

Zgornji vrstici kode dodajo legende, ki temeljijo na spletni nalepki. Legende naredijo zaplet izjemno berljiv.

plt.show ()

Poglejmo še nekaj lastnosti. Če želimo, da je širina vrstice večja, potem lahko to naredi preprost parameter, imenovan linewidth.

x = (1, 2, 3, 4)

y = (1, 4, 9, 16)

plt.plot (x, y, širina vrstice = 5, 0)

plt.show ()

Na voljo je veliko drugih različnih parametrov, ki jih lahko imate v dokumentaciji funkcije ploskve v matplotlib.pyplot (https://matplotlib.org/api/pyplot_api.html).

Druga zanimivost so nastavljene lastnosti.

x1 = (1, 2, 3, 4) y1 = (1, 4, 9, 16)

Vrednosti Y1 so kvadratne od vrednosti X1

x2 = (1, 2, 3, 4) y2 = (2, 4, 6, 8)

Vrednosti Y2 so le dvakrat od vrednosti X2

vrstice = plt.plot (x1, y1, x2, y2)

Z uporabo zgornje vrstice lahko te vrednosti narišemo v eno vrstico. Tukaj se zgodi, da bo narisal X1 proti Y1 in X2 proti Y2 in jih shranjujemo v spremenljivko, imenovano vrstice. Prav tako lahko spremenimo lastnosti teh vrstic z uporabo argumentov ključne besede.

plt.setp (vrstice (0), barva = 'r', širina vrstice = 2, 0)

Tukaj se nastavitev imenuje kot nastavljene lastnosti, argumenti (0), ki ustrezajo X1, Y1, barva in širina vrstice so argumenti. Zgornja vrstica kode je napisana s pomočjo argumentov ključne besede (glej posnetek zaslona 6).

plt.setp (vrstice (1), 'color', 'g', 'linewidth', 2.0)

Zgornja vrstica kode predstavlja sintakso matlab.

Tukaj vrstice (1) ustrezajo X2, Y2. Imamo tudi dva para argumentov 'color', 'g' in 'linewidth', '2.0' (glej posnetek 6).

Na vsak način bomo lahko narisali črto.

  • Prvi način je izvorni način uporabe v pythonu.
  • Drugi način najraje uporabljajo ljudje iz rodu MATLAB.

plt.grid ()

put.show ()

Zaključek - Orodja za vizualizacijo podatkov

V tej objavi orodij za vizualizacijo podatkov smo odkrili uvod za vizualizacijo podatkov v Pythonu. Če smo natančnejši, smo videli

  • Kako grafikovati podatke s črtami črt
  • Kako povzeti razmerje med spremenljivkami z razpredelnimi ploskvami

Priporočeni članki

To je vodnik za orodja za vizualizacijo podatkov. Tu smo preučili osnovne koncepte in orodja vizualizacije podatkov z njihovimi primeri. Če želite izvedeti več, si oglejte tudi naslednje članke -

  1. Vizualizacija podatkov v primerjavi z analitiko podatkov
  2. Data Scientist vs Data Mining
  3. Programska oprema Big Data Analytics
  4. .Vprašanja glede intervjuja o skladiščenju
  5. Matplotlib In Python
  6. Razpršeni parceli v Matlabu

Kategorija: