Apache čuvar slonova u Indiji i strojno učenje

Pregled: Sa tako mnogo razvojnih okvira oko, postaje važno da bismo trebali biti u mogućnosti da razmjeru našu aplikaciju u bilo kojem trenutku vremena. Stroj tehnike kao što klastera i kategorizaciji učenje su postali popularni u ovom kontekstu. Apache čuvar slonova u Indiji je okvir koji nam pomaže postići skalabilnost.

In this document, Ja ću govoriti o Apache čuvar slonova u Indiji i njegove važnosti.

Uvođenje: Apache čuvar slonova u Indiji je open source projekt od Apache Software Foundation ili ASF koji ima primarni cilj stvaranje algoritma strojnog učenja. Predstavljen je grupa programera iz projekta Apache Lucene, Apache čuvar slonova u Indiji ima za cilj -

  • Graditi i podržavaju zajednicu korisnika ili suradnika, tako da je pristup izvornom kodu za okvir nije ograničena na malu skupinu programere.
  • Usredotočite se na praktičnim problemima, nego nevidljivim ili nedokazane pitanja.
  • Osigurati odgovarajuću dokumentaciju.

Značajke Apache čuvar slonova u Indiji:

Apache čuvar slonova u Indiji dolazi s nizom mogućnosti i funkcionalnosti posebno kada govorimo o Grupiranje i Collaborative filtriranje. Najvažnije značajke navedene su kao pod -

  • Okus Kolaborativni filtriranje - Ukus je open source projekt suradničke filtriranje. To je dio čuvar slonova u Indiji okvira koji osigurava algoritama strojnog učenja na ljestvici do naše aplikacije. Okus se koristi za osobne preporuke. Ovih dana, kada smo otvorili web stranicu nalazimo dosta preporukama koje se odnose na web stranice koje se pregledavaju. Slijedeća slika prikazuje arhitekturu dijagram ukus -
Taste Architecture diagram

Okus Arhitektura dijagram

Figure 1: Okus Arhitektura dijagram

  • Karta smanjiti omogućili implementacije - Nekoliko karta smanjuju omogućen grupirani implementacije podržava čuvar slonova u Indiji. Ovo uključuje K-srednja, nejasan, baldahin
  • Distribuirana Navie Bayes i besplatnog Navie Bayes - Apache čuvar slonova u Indiji ima primjenu i za Navie Bayes i besplatne Bayes. Radi jednostavnosti Navie Bayes su upućeni kao Bayes i besplatne su upućeni kao CBayes. Bayes se koriste u klasifikaciji tekstom, dok su CBayes su produžetak Bayes koji se koristi u slučaju 'skupova podataka'.
  • Ona podržava Matrix i drugih srodnih vektorske knjižnice.

Postavljanje Apache čuvar slonova u Indiji:

Postavljanje Apache čuvar slonova u Indiji je vrlo jednostavna i može se obavljati u sljedećim koracima -

  • Step 1 - Za postavljanje Apache čuvar slonova u Indiji, trebamo imati sljedeće instaliran -
    • JDK 1.6 or higher
    • Mrav 1.7 or higher
    • Maven 2.9 ili više - u slučaju želimo graditi iz izvornog koda
  • Step 2 - Raspakirajte datoteku, sample.zip i kopiranje sadržaja na neki folder reći "Apache-čuvar slonova u Indiji-primjeri".
  • Step 3 - Idi u mapu - "Apache-čuvar slonova u Indiji-primjere" i pokrenuti sljedeće -
    • mrav instalaciju

Posljednji korak preuzima Wikipedia datoteke i sastavlja kod.

Preporuka motora:

Preporuka motor je podklasa od sustava za filtriranje informacija koje se mogu predvidjeti ocjena ili korisničke postavke mogu dati na stavku. Čuvar slonova u Indiji pruža alate i tehnike koje su korisne za izgradnju preporuka motora pomoću "Taste 'knjižnica. Korištenje Taste knjižnicu možemo izgraditi brzo i fleksibilno Kolaborativni filtriranje. Okus sastoji se od sljedećih pet osnovnih komponenti koje rade s korisnicima, stavke i postavke -

  • Model podataka - To se koristi kao sustav za korisnike za pohranu, predmeti i također sklonosti.
  • Korisnik Sličnost - To je sučelje se koristi za definiranje sličnost između dva korisnika.
  • Stavka Sličnost - Sučelje koje se koristi za definiranje sličnost između dva predmeta.
  • preporuke - Sučelje koji se koristi za davanje preporuka.
  • Korisnik četvrti - Sučelje koji se koristi za računanje i izračunati susjedstvo korisnika iste kategorije koje se mogu koristiti od strane preporučitelji.

Korištenjem ovih komponenti i njihove implementacije, možemo izgraditi složenu sustav preporuka. Ova preporuka motor se može koristiti u oba realnom vremenu preporukama i offline preporuke. Real Time preporuke mogu nositi korisnicima i do nekoliko tisuća, dok su offline preporuke mogu nositi korisnicima u mnogo većim računati.

Grupiranje:

Čuvar slonova u Indiji podržava mnoge clustering mehanizme. Ovi algoritmi su napisane na karti smanjila. Svaki od tih algoritama ima svoj vlastiti skup ciljeva i kriterija. Važne one su navedene kao pod -

  • Nadstrešnica - To je najviše brz klastera algoritam se koristi za stvaranje početne sjemena za druge klastera algoritama.
  • k – Sredstva ili Fuzzy k – sredstva - Ovaj algoritam stvara k klastera na temelju udaljenosti predmeta od centra prethodne iteracije.
  • Srednja - Shift - Ovaj algoritam ne zahtijeva bilo prije informacije o broju klastera. To može proizvesti proizvoljan klaster koji može biti povećan ili smanjen po naše potrebe.
  • Dirichletov - Ovaj algoritam stvara nakupine dobiva miješanjem jednog ili više modela cluster. Tako smo dobili prednost da odaberete najbolju moguću jedan od brojnih klastera.

Od gore navedenih četiri algoritmima popisu, najčešće korištena je k - znači algoritam. Bilo da je bilo klastera algoritam, moramo slijediti ove korake -

  • Pripremite ulaz. If required, pretvoriti tekst u numeričkom reprezentacije.
  • Izvrši algoritam po svom izboru pomoću bilo koje od Hadoop spremne programe dostupne u čuvar slonova u Indiji.
  • Pravilno procijeniti rezultate.
  • Ponoviti korake ako je potrebno.

kategorizacije sadržaja:

Apache čuvar slonova u Indiji podržava sljedeće dva pristupa za kategorizirati ili klasificirati sadržaj. To su uglavnom na temelju Bayesova statistika -

  • Prvi pristup je ravno naprijed Karta smanjuju omogućen Navie Bayes klasifikatora. Klasifikatori ove kategorije se zna da se brzo i točno unatoč tome što je pretpostavka da su podaci potpuno neovisan. Ove klasifikatori razbiti kada je veličina podataka ide gore ili podataka postaje ovisni. Navie Bayes klasifikatora je proces u dva dijela koji vodi evidenciju o značajkama ili jednostavno riječi koje su povezane s dokumentom. Ovaj korak je poznat kao trening koji stvara model gleda na primjerima već klasificirane sadržaj. Drugi korak, poznat kao klasifikaciji, koristi model koji je stvoren za vrijeme treninga i sadržaj novog, nevidljivi dokument. Stoga, kako bi se pokrenuti čuvar slonova u Indiji je klasifikator, prvo moramo trenirati model, a zatim koristiti model za klasifikaciju novih sadržaja.
  • Drugi pristup, koji je također poznat kao komplementarne naivne Bayes, pokušava ispraviti neke od problema s naivne Bayes pristupu i dalje održava na jednostavnost i brzinu koju nudi Navie Bayes.

Pokretanje Navie Bayes klasifikatora:

Navie Bayes Klaserski zahtijeva izvršavanje sljedećih mrav ciljeve kako bi se izvršiti -

  • mrav priprema-dokumente - Ovaj priprema set dokumenata koji su potrebni za trening.
  • mrav pripremu pokusa dokumente - Ovaj priprema set dokumenata koji su potrebni za testiranje.
  • mrav vlak - Nakon što su podaci za obuku i ispitivanja postaviti, moramo pokrenuti TrainClassifier klase pomoću cilj - "mrav vlak".
  • mrav Test - Nakon navedenih ciljeva su uspješno izvršena, moramo pokrenuti ovaj cilj koji uzima se uzorak ulaznih dokumenata i pokušava ih klasificirati na temelju modela koji se stvorio tijekom treninga.

Summary: U ovom članku smo vidjeli da je Apache čuvar slonova u Indiji je naširoko koristi za klasifikaciju tekstom pomoću algoritama strojnog učenja. Tehnologija i dalje raste, a može se koristiti za različite vrste razvoj aplikacija. Neka nam rezimirati našu raspravu u obliku slijedeće metaka -

  • Apache čuvar slonova u Indiji je open source projekt od Apache uvedena od strane grupe developera iz projekta Apache Lucene. Primarni cilj ovog projekta je stvoriti algoritam koji može čitati jezik stroja.
  • Apache čuvar slonova u Indiji ima sljedeće važne značajke -
    • Okus Kolaborativni filtriranje.
    • MapReduce omogućen implementacije.
    • Provedba i za Distributed Navie Bayes i besplatne Navie Bayes.
    • Podržava matricu i drugih srodnih vektora na temelju knjižnice.
============================================= ============================================== Buy best TechAlpine Books on Amazon
============================================== ---------------------------------------------------------------- electrician ct chestnutelectric
error

Enjoy this blog? Please spread the word :)

Follow by Email
LinkedIn
LinkedIn
Share