Kako namestiti Apache

Preden bi vnesli, kako namestiti del Apache, bi najprej imeli splošen pregled Apache in kako se uporablja v podatkovni znanosti.

Kaj je zdravilo Apache?

Spletni strežnik Apache je strežnik HTTP, ki obiskovalcem, ki pridejo na vaš strežnik, predstavi spletna mesta. Če želite namestiti spletno mesto za podjetje ali organizacijo, bi najverjetneje za to uporabili Apache.

Tam so še drugi strežniki HTTP, kot je IIS, vendar je Apache standard, ki ga večina ljudi uporablja, ne glede na to, ali so v Linuxu, Windows ali Macu. Apache je privzeto, kamor hodi večina ljudi, ker je dobro znan, zelo zanesljiv in brezplačen.

Vendar pa morate pri Apacheu zavedati eno, da je to, če gre za strežnik HTTP, tako da, če to namestite v Linux ali Windows ali Mac, bi vse, kar bi lahko storili, to, da obiskovalcem, ki prihajajo na vaš strežnik, predstavite statična spletna mesta. Če torej kodirate spletno mesto HTML brez drugih programskih jezikov razen JavaScript, ga lahko uporabite le s strežnikom Apache. Vse svoje oznake lahko priključite na strežnik Apache in jih predstavite svojim obiskovalcem.

Kako je Apache uporabljal v Data Science?

Data Science je najbolj povpraševano študijsko področje v sodobnem svetu. Data Scientist velja za najbolj seksi delo v 21. stoletju s strokovnjaki iz različnih strok, ki se želi učiti in postati Data Scientist. Apache igra ključno vlogo pri vsakem ljubitelju podatkovnih znanosti, saj potrebujejo dovolj znanja o ekosistemu Apache Hadoop.

Ekosistem Apache Hadoop

Prva stvar je, da Ekosistem Hadoop ni eno orodje. To ni programski jezik ali en sam okvir. Gre za skupino orodij, ki jih različna podjetja na različnih področjih uporabljajo za več nalog. Spodaj bomo preučili vsako orodje: -

  • Apache HDFS (Hadoop Distributed File System) je Hadoopova shranjevalna enota, ki lahko shrani strukturirane, polstrukturirane in nestrukturirane podatke. HDFS ima metapodatke, ki vzdržujejo datoteko dnevnika o shranjenih podatkih. Ima dve komponenti - NameNode in DataNode.
  • Apache Preja je pogajalec virov, ki izvaja vse postopke obdelave, kot so naloge načrtovanja, dodeljevanje virov itd. Ima dve storitvi - Prvi je upravitelj virov, ki načrtuje aplikacije, ki se izvajajo na vrhu preje. Drugi je Node Manager, ki spremlja uporabo virov .
  • Apache Map Reduce je komponenta za obdelavo podatkov podjetja Hadoop, ki obdeluje velike naloge podatkov z uporabo porazdeljenih in vzporednih izračunov, ki temeljijo na funkcijah Map, Sort and Shuffle in Reduce. Funkcija Zemljevid filtrira podatke, nato razvrsti in premešča, na koncu Zmanjša funkcijo, združi in povzame rezultat.
  • Prašič Apache se uporablja večinoma v ETL. Ima dva dela - Pig Latin in Pig Runtime. Pig latinščina je jezik, ki se uporablja za obdelavo podatkov s poizvedbo, medtem ko je čas izvajanja prašičev okolje izvajanja. Ena vrstica Pig Latin je skoraj enaka 100 vrsticam kode za zmanjšanje zemljevida. Proces vključuje najprej nalaganje podatkov in nato združitev, razvrščanje, filtriranje in shranjevanje v HDFS.
  • Apache Hive uporablja poizvedbo v obliki SQL za analizo podatkov v porazdeljenem okolju. Ima dve komponenti - ukazno vrstico Hive in strežnik JDBC / ODBC, uporabljeni jezik pa se imenuje HiveQL.
  • Apache Mahout je knjižnica strojnega učenja, napisana na Javi in ​​se uporablja za ustvarjanje aplikacij za strojno učenje, kot so grozdenje, klasifikacija ali regresija. Ima različne algoritme, vgrajene za različne primere uporabe.
  • Apache HBase je baza podatkov NoSQL, napisana na Javi, ki teče čez Hadoop. Zgrajena je na Googlovem BigTableu in je sposobna obdelovati vse vrste podatkov.
  • Apache Sqoop je orodje za zaužitje podatkov, ki se uporablja za skupno strukturiran prenos podatkov med RDBMS in Hadoop.
  • Apache Flume je še eno orodje za zaužitje podatkov, ki se uporablja za polstrukturiran in nestrukturiran prenos podatkov med Hadoopom in drugimi viri podatkov.
  • ZooKeeper je koordinator, ki zagotavlja usklajevanje med različnimi orodji v ekosistemu Hadoop.
  • Apache Ambari je vodja grozdov, ki zagotavlja, upravlja s skupinami Hadoop in spremlja tudi njihovo zdravje in stanje.
  • Apache Tez je novo orodje v ekosistemu Hadoop, ki pospešuje obdelavo Hadoopovih poizvedb.
  • Apache Presto je odprtokodni mehanizem za poizvedbe SQL, ki omogoča poizvedbo po platformi.
  • Apache HCatalog je sistem upravljanja metapodatkov in tabel za Hadoop, ki omogoča interoperabilnost v vseh orodjih za obdelavo podatkov. Uporabnikom tudi pomaga izbrati najboljša orodja za svoje okolje.
  • Apache Spark je najbolj razširjen in priljubljen okvir med Data Scientist. Gre za visokohitrostni računalniški sistem, ki optimizira uporabo virov v primeru številnih iterativnih nalog. Omogoča fleksibilnost tako za paketno obdelavo kot za analizo podatkov v realnem času.

Spodaj so koraki za namestitev Apache

Do zdaj smo izvedeli o Apacheju in kako je koristno za vse, ki se želijo naučiti Data Science ali Big Data Analytics. Zdaj se bomo potapljali in namestili apache na okna na podlagi spodnjih korakov.

  • Pojdite na https://httpd.apache.org/ in v razdelku Apache httpd 2.4.38 Sproščeno kliknite povezavo za prenos.

  • Odprlo vas bo naslednjo stran in nato kliknite Datoteke za Microsoft Windows.

  • Kliknite na Apache Lounge.

  • Na vaš operacijski sistem Windows lahko prenesete 32-bitno ali 64-bitno datoteko zip. Tu bomo prenesli 64-bitno različico. Za prenos kliknite ustrezno povezavo .zip.

  • Zdaj potrebuje C ++ Redistributable Visual Studio 2017. Torej ga bomo prenesli iz ustrezne 32-bitne ali 64-bitne povezave

  • Po prenosu obeh datotek gremo najprej na mesto prenosa in najprej namestimo C ++ Redistributable Visual Studio 2017. Dvokliknite datoteko .exe.

  • Potrdite »Strinjam se« in kliknite Namestitev.

  • Namestitev Apache je v teku.

  • Ko je popoln, boste dobili takšno sporočilo. Za zaključek namestitve kliknite Zapri.

  • Zdaj pojdite v mapo, v katero naložite zip datoteko Apache. Z desno miškino tipko kliknite in izberite izvleček tukaj.

  • Zdaj bomo ustvarili mapo Apache24. Kopirajte to mapo na pogon C in nato bomo dodali pot do spremenljivk sistemskega okolja.

Pojdite na Lastnosti sistema -> jeziček Napredno -> Spodaj kliknite gumb spremenljivke okolja.

  • V spremenljivkah poiščite Pot in kliknite Uredi.

  • Kliknite Brskaj -> Pojdi na mapo C pogon Apache24 -> Izberi mapo s kovčki -> Kliknite V redu.

  • Apache bomo namestili kot storitev Windows. Zaženite ukazni poziv kot skrbnik. Vnesite httpd –k namestite in pritisnite Enter.

  • Preverili bomo storitev namestitve Apache. Kliknite ikono sistema Windows in vnesite storitve. Kliknite aplikacijo Storitve in poiščite storitev z imenom Apache24.

  • Če želite zagnati strežnik Apache, z desno miškino tipko kliknite in kliknite start. Status se spremeni v „Teče“.

  • Preizkusimo lahko z brskalnikom. Odprite brskalnik in se pomaknite do http: // localhost in pritisnite enter. Sporočilo, ki navaja, da "deluje!" se bo pojavil za potrditev uspešne namestitve Apache.

Priporočeni članki

To je vodnik o tem, kako namestiti Apache. Tu smo razpravljali o navodilih in različnih korakih za namestitev Apache. Če želite izvedeti več, si oglejte tudi naslednji članek -

  1. Vprašanja za intervju Apache
  2. Apache Spark proti Apache Flink
  3. Apache Hadoop proti Apache Spark
  4. Apache Kafka proti Flume
  5. Kafka proti Kinesis | Najboljše razlike

Kategorija: