Kako namestiti NLTK?

Naslednji članek Namestitev NLTK ponuja oris za namestitev NLTK. NLTK je skupek knjižnic za obdelavo naravnega jezika. To je platforma za gradnjo programov Python za obdelavo naravnega jezika. NLTK je napisan v programskem jeziku Python. Razvila sta jo Steven Bird in Edward Loper. Podpira raziskave in poučevanje na NLP ali na tesno povezanih področjih, vključno s kognitivno znanostjo, empiričnim jezikoslovjem, iskanjem informacij, umetno inteligenco in strojnim učenjem. NLTK ponuja enostaven vmesnik za uporabo.

NLTK (Navodilo za naravni jezik)

  • Naravna obdelava jezika (NLP) je del umetne inteligence, ki obdeluje jezik, ki ga govorijo ljudje. Tako pomaga ljudem pri interakciji z računalniki, čeprav nimajo znanja, kako ga uporabljati. S pomočjo NLP-ja morajo ljudje samo narekovati ukaz računalnikom. Z močjo strojnega učenja postaja obdelava naravnega jezika priljubljena in lažja za izvedbo. V bistvu je tehnika interakcije z ljudmi in izvajanja dejanj na glasovne ukaze.
  • To omogoča, da naprave lahko uporablja celo novinec, ki nima znanja o tehnologiji. Toda izvajanje obdelave naravnega jezika ni enostavno, saj jezik, ki ga govorijo ljudje, nima dokončne strukture. Je dvoumen in je odvisen od kontekstnih besed, ki imajo lahko drugačen pomen.
  • NLTK ima več kot 50 korpusnih in leksikalnih virov, kot so WordNet, Poročilo o težavah Corpus, Penn Treebank Corpus itd. Priložen je tudi vodnik, ki razlaga koncepte jezikovne obdelave z orodjarnimi in programskimi osnovami Pythona, kar ljudem olajša ki nimajo poglobljenega znanja o programiranju. Ima široko paleto paketov, zaradi česar je eden močnih orodij za NLP. Nekateri od teh paketov so tokenizacija, lematizacija, izraščanje, razčlenjevanje, število znakov, ločila, število besed.

Namestite NLTK za Windows

Spodaj so navodila za namestitev NLTK v Windows. Te temeljijo na predpostavki, da Python ni nameščen v sistemu. NLTK zahteva Python verzije 2.7, 3.5 in novejše.

1. korak: Prenesite najnovejšo različico Pythona za Windows s spodnje povezave

https://www.python.org/downloads/

2. korak: Kliknite na preneseni .exe, da ga zaženete.

3. korak: Izberite prilagoditev namestitve.

4. korak: Preverite vse funkcije, zlasti "pip", saj pomaga namestiti NLTK in kliknite Naprej.

5. korak: Na naslednjem zaslonu izberite napredne možnosti, izberite pot in kliknite na namestitev.

6. korak: Ko je namestitev uspešna blizu okna.

7. korak: Kopirajte pot mape Skripti, da namestite NLTK v isto mapo.

NLTK je mogoče enostavno namestiti s pomočjo namestitvenega programa "pip". Prav tako moramo namestiti "numpy".

Korak 8: Če želite namestiti NLTK, odprite ukazni poziv in vnesite spodnji ukaz.

Prepričajte se, da je namestitev uspešna.

Po uspešni namestitvi je zdaj čas, da uporabite NLTK za obdelavo naravnega jezika.

9. korak: Odprite Python Shell in vnesite spodaj ukaz.

Če je uvožen brez napake, to pomeni, da je NLTK pravilno nameščen.

Namestite NLTK za Mac / Linux

Za razliko od sistema Windows, Linux sistemi prihajajo z nameščenim Python-om. Za namestitev NLTK v Linux / Mac se uporablja namestitveni program Python's Pip. Če želite namestiti pips ali ga posodobiti, vtipkajte spodaj ukaze v ukaznem pozivu.

Za namestitev pythona v Linuxu uporabite spodnje ukaze.

1. korak: Za posodobitev indeksa paketa uporabite spodnji ukaz.

2. korak : Za namestitev Pythona v sistem Linux uporabite spodaj.

Korak 3: Vnesite spodnji ukaz, da namestite "pip" za Python 3.

4. korak: Ko je program „Pip“ uspešno nameščen, za namestitev NLTK uporabite naslednje ukaze.

NLTK nabor podatkov

NLTK ima na voljo veliko podatkovnih nizov za obdelavo naravnega jezika, na primer WordNet, WikiCorpus, Gutenberg, Mnenje leksikon, Tweebank itd. Ti nabori podatkov se imenujejo korporacije. V bistvu nabor podatkov NLTK vsebuje nabor datotek ali dokumentov. Vsaka datoteka / dokument vsebuje zbirko besed, črk ali besedila v enem jeziku. Tako so korpusi predvsem knjižnice za razumevanje / učenje jezika. Ima slovnična pravila in strukturo jezika.

Ko uspešno namestite NLTK, ga lahko uvozite in tudi prenesete njegove korpuse z naslednjim ukazom.

Naložnik NLTK odpre okno za prenos podatkovnih nizov. Velikost nabora podatkov je velika, zato bo potreben čas. Če želite preveriti, ali so nabori podatkov pravilno nameščeni, poskusite uvoziti nabor podatkov in ga uporabiti.

Predelava NLTK

Obstaja 5 glavnih procesov obdelave naravnega jezika. To so koraki pri obdelavi katerega koli besedila.

  1. Zaznavanje EOS-a : Zaznavanje konca govora razbije besedilo v zbirko smiselnih stavkov. Dolgo besedilo deli na dele, ki imajo določen pomen.
  2. Tokenizacija : ta korak razdeli stavke v žetone. Žetoni ne vsebujejo samo besed, ampak vključujejo bele prostore, prelome stavkov.
  3. Označevanje POS : POS pomeni govor govora. Tu so informacije dodeljene žetonu. Te informacije kažejo na to, za katero vrsto govora gre tako zatego, glagol, pridevnik, samostalnik itd.
  4. Chunking : Chunking pomeni zbiranje besedila na podlagi oznak.
  5. Ekstrakcija: Ekstrakcija je stalni postopek preiskovanja koščkov in označevanja poimenovanih entitet, kot so ljudje, lokacije, organizacije itd.

Zaključek:

NLTK se uporablja za klasifikacijo besedila, podpisovanje slik, prepoznavanje govora, odgovore na vprašanja, jezikovno modeliranje, povzemanje dokumentov in številne druge operacije. Obstaja veliko drugih orodij za obdelavo naravnega jezika. Toda NLTK ima široko paleto knjižnic, zaradi česar je eno izmed močnih orodij za obdelavo naravnega jezika. Je bolj natančen kot katero koli drugo orodje, vendar je zaradi velikega števila knjižnic nekoliko počasen. Torej, vse je odvisno od uporabnikovih zahtev. Če želi uporabnik hitrost, potem lahko raje tudi druga orodja, vendar bo moral potem ogrožati natančnost vsebine. Če pa je natančnost prednostna naloga, potem vsekakor velja za NLTK.

Priporočeni članki:

To je vodnik za namestitev NLTK. Tukaj razpravljamo o osnovnem konceptu in različnih korakih za namestitev NLTK v Windows in Linux \ Mac. Če želite izvedeti več, si oglejte tudi naslednje članke -

  1. Namestite Kubernetes nadzorno ploščo
  2. Kako namestiti JDK
  3. Namestite Docker
  4. Kako namestiti Magento?
  5. Magento različice | Značilnosti Magento različic