Kiel povas vin administras grandan volumon de datumo uzanta Apache Cassandra NoSQL datumaro?

Superrigardo: Apache Cassandra estas unu el la plej populara kaj scalable turnira fonto NoSQL datumaro. Cassandra estas ideala datumaro por administranta grandegan volumon de unstructured, Semi-strukturita kaj strukturita datumon trans multoblaj datumaj centroj kaj la nuba medio. Cassandra liveras altan scalability kaj havebleco trans multaj komercaĵaj serviloj sen kompromisanta elfaron. Kun ĉi tiu modelo estas ne ununura punkto de malsukceso, Kaj ĝi provizas potencan datuman modelon por maksimuma fleksebleco kaj rapida responda tempo. Linia scalability kaj misfaro tolerant ladaĵejo aŭ nuba infrastrukturo faras perfektan kombinaĵon por ajna kritika datumo.

Enkonduko: Interrilataj datumaroj estas tre bonaj en solvanta certan tipon de datuma tenado problemoj. Sed kiel la fokuso estas malsama por RDBMS, Ĝi kreas problemon kiam grimpanta supre por granda volumo de datumo. Tiel, Ni devas trovi vojon akiri liverita de la aliĝas. Tio ĉi rezultos en de-normaliganta la datumon. Tio ĉi gvidos daŭrigi multoblajn kopiojn de datumo kaj ankaŭ kaŭzi grandegan difekton al la desegno, Ambaŭ en la datumaro kaj en la apliko. En ĉi tiuj kondiĉaj solvoj provizita de NoSQL ŝajnas esti malpli radikala kaj malpli timiga ol ni eble pensis. La desegna celo de NoSQL datumaro devas kompreni klare antaŭ ol efektiviganta ĝin en ajna apliko.

Desegnaj celoj de Cassandra NoSQL datumaro: La desegnaj celoj de NoSQL datumaro estas tute malsama de interrilata datumaro. Do la elekto uzi NoSQL DB aŭ RDBMS ankaŭ dependas al la tipo de apliko kaj ĝia postulo. Kiel ni scias ke ACIDA transakcio provizas fortan konsistencan modelon por ĉiuj araneaĵaj aplikoj evoluigita kaj desegnis tradicie. Sed kiam ni pensas pri scalability, Ĝi venas ĉe kosto kaj konfliktoj kelkaj de la reguloj sekvita en RDMBSa desegno. Do antaŭeniganta haveblecon super konsistenco estas unu el la kernaj desegnaj faktoroj por NoSQL datumaroj. Oftaj desegnaj celoj sekvita de Cassandra estas deklarita sub.

  • Alta elfaro
  • Horizontala scalability
  • Simpleco
  • Schema fleksebleco

Cassandra arkitekturo administri grandan datuman volumon: Kiel ni ĉiuj scias ke NoSQL datumaroj estas distribuita sur nombro de komercaĵaj nodoj. Cassandra estas ankaŭ distribuita sur nombro de nodoj kaj ĝi sekvas ‘masterless’ Arkitekturo. ‘Masterless’ Arkitektura rimedo, Ĉiuj nodoj estas samaj kaj estas ne ununura nodo kiu kontrolas aliajn nodojn. Cassandra aŭtomate distribuas datumon trans ĉiuj la komercaĵaj nodoj kiu formas la ‘ringo’ Sciita kiel datumara grapolo. Kiel la datumo estas aŭtomate kaj transparently partitioned sur la grapolo, Ellaborantoj ne devas fari ion ajn programmatically. Alia grava ĉefaĵo de Cassandra arkitekturo estas ĝia subteno por je-konstruita kaj customizable reproduktado. La superflua datumo estas entenita trans multoblaj nodoj en la Cassandra ringo. Sekve se estas ajna malsukceso en ajna nodo, La sama datumo estas reprenita de aliaj nodoj reproduktis datumon. La reproduktado povas esti formita en la sekvantaj vojoj.

  • Trans unu datuma centro
  • Trans multoblaj datumaj centroj
  • Trans multobla nuba infrastrukturo

Alia arkitektura ĉefaĵo estas la subteno por linia scalability. Ĝi signifas la kapaciton aŭ scalability povas esti pliigita de nura aldonanta novajn nodojn. Ekzemple, Se 2 Nodoj povas pritrakti 1000 Transakcioj/sec, Tiam 4 Nodoj subtenos 2000 Transakcioj/sec kaj tiel plu. Sekvanta bildon montras la linian scalability de Cassandra ringo.

Cassandra Ring

Cassandra Ringo

Aliranta grandan volumon de datumo: La unua afero kiu venas en menso estas la havebleco de malsamaj klientaj bibliotekoj kiam evoluiganta datumaron veturita aplikon. Por RDBMSaj produktoj la haveblaj bibliotekoj estas rekta avanulo. Ekzemple, JDBC estas la norma datumara alira API por Java bazitaj aplikoj. Normale estas ununura JDBCa ŝofora vendisto por aparta tipo de datumara produkto. Aliflanke, Cassandra havas proksimume naŭ malsamajn klientojn por Java aplika evoluado. Kaj la plej grava afero estas tio, Ĉi tiuj klientoj provizas malsamajn gustojn por administranta la datumon. Kelkaj estas provizantaj objekton interrilata mapado APIs, Kelkaj estas proponantaj CQL bazita subtenon kaj multaj pli. Do la fleksebleco por aliranta la NoSQL DB estas alia grava avantaĝo por aplika evoluado. La ellaborantoj povas elekti la tipon de aliro laŭ ilia postulo.

Granda volumo de datumo en Cassandra povas esti alirita kaj administrita de APIs kiu sekvas RPCan stilon. Samtempe, Cassandra ankaŭ provizas bazan demandan lingvon subteno vokis CQL kiu estas simila al SQL al iu etendo. Sed la aplika ellaboranto devas havi solidan scion pri la tenada motoro kaj ĝia funkcio.

Normaj uzaj kazoj por Cassandra NoSQL DB: Kiel ni jam diskutis ke la normaj uzaj kazoj por Cassandra estas malsama de tradiciaj RDBMSaj aplikoj. Sekvanta estas kelkaj normaj uzaj kazoj.

  • Aplikoj pritraktanta tre granda datuma volumo
  • Aplikoj de alta scalability kaj havebleco
  • Aplikoj kun alta fidindeca postulo por datuma tenado
  • Dinamika datuma modelo kiu estas atendita ŝanĝi grave super tempo
  • Disdonado super malsama datacenters

Elŝutanta kaj Instalanta Cassandra: Nun lasita nin diskuti pri la deŝuto kaj instalaĵa parto de Cassandra NoSQL DB. la deŝuto kaj instalaĵo prenos iun tempon.

Apache Cassandra povas esti elŝutita de http://cassandra.apache.org . La binara disdonado estas nomita kiel Apache-cassandra-<VERSIO>-Ujo.Asfalto.Gz. Plej facila vojo instali Cassandra estas menciita en la sekvantaj paŝoj sub –

  • Elŝuti la binaran disdonadon de la supra retejo
  • Unzip tio ĉi uzanta iun regulan ZIPAN ilon
  • Unufoje unzipped, Vi devus akiri la sekvantajn adresarojn –
    • Ujo – tio ĉi enhavas la executables kuri Cassandra kaj la komandan linian fasadan klienton.
    • Conf – tio ĉi enhavas dosierojn uzita formi Cassandra
    • Fasado – Fasado estas difinita uzanta la Ŝparkasan sintakson kaj provizas facilan vojon produkti klientojn. Se vi deziras vidi ĉiujn de la operacioj ke Cassandra subtenoj, Malfermi ĉi tiun dosieron de uzanta regulan tekstan redaktoron. La dosiero havos ĉiujn Cassandra subtenas klientojn por Java, C , PHP, Ruby, Kaj Python, Perl, Kaj C # Tra ĉi tiu fasado.
    • Lib – Tio ĉi enhavas la eksteran kiu estas postulita efektivigi Cassandra.
    • Javadoc – Tio ĉi enhavas la dokumentaron en html formato por Cassandra.

Komenci la Cassandra NoSQL servilo: Bonvolu sekvi instruojn sub komenci la Cassandra servilo.

Komenci la Cassandra servilo sur ajna OS kiel linux aŭ fenestroj, Unue vi devas malfermi komandan akurata aŭ morta fenestro. Nun iri al la <Cassandra-adresaro>/Ujo Kie vi malpakis Cassandra, Kaj kuri la sekvantan komandon komenci la Cassandra servilo. Se la instalaĵo estis pura, Ni vidus kelkajn ŝtipajn komunikaĵojn tiel:

Enlistiganta 1: Komencanta Cassandra servilo

@Utpalb@cassandraserver$ Ujo/cassandra -f

INFO 13:23:22,367 DiskAccessMode ‘aŭtomobilo’ Determinita esti norma, IndexAccessMode estas norma

INFO 13:23:22,475 Couldn’t eltrovas ajna schema difinoj en loka tenado.

INFO 13:23:22,476 Trovita tablan datumon en datumaj adresaroj. Konsideri uzanta JMX voki org.Apache.Cassandra.Servo.StorageService.LoadSchemaFromYaml().

INFO 13:23:22,497 Cassandra versio: 0.7.0-Beta1

INFO 13:23:22,497 Ŝparkasa API versio: 10.0.0

INFO 13:23:22,498 Savita Token ne fondi. Uzanta qFABQw5XJMvs47lg

INFO 13:23:22,498 Savita ClusterName ne fondi. Uzanta Testan Grapolon

INFO 13:23:22,502 Kreanta novan commitlog segmento /var/lib/cassandra/commitlog/CommitLog-1282508602502.Ŝtipo

INFO 13:23:22,507 Ŝaltanta en freŝa Memtable por LocationInfo ĉe CommitLogContext(

Registri=’/var/lib/cassandra/commitlog/CommitLog-1282508602502.Ŝtipo’, Poziciigi=276)

INFO 13:23:22,510 Enqueuing flulavas de Memtable-LocationInfo@29857804(178 Bytes, 4 Operacioj)

INFO 13:23:22,511 Skribanta Memtable-LocationInfo@29857804(178 Bytes, 4 Operacioj)

INFO 13:23:22,691 Kompletigis flulavanta /var/lib/cassandra/datuma/sistemo/LocationInfo-e-1-Datumo.Db

INFO 13:23:22,701 Komencanta supre servilan klaĉon

INFO 13:23:22,750 Liganta ŝparkasan servon al localhost/127.0.0.1:9160

INFO 13:23:22,752 Uzanta TFramedTransport kun max kadra grandeco de 15728640 Bytes.

INFO 13:23:22,753 Aŭskultanta por ŝparkasaj klientoj…

INFO 13:23:22,792 Mx4j successfuly ŝarĝis HttpAdaptor versio 3.0.2 Komencita sur haveno 8081

La -f elekto uzis ĉi tie diras Cassandra resti en la foreground anstataŭ kuranta kiel fona procezo. Tio ĉi helpas nin, Por ke ĉiuj de la servilaj ŝtipoj presos al normo ekstere kaj vi povas vidi ilin en via morta fenestro, Kiu estas utila por elprovado.

Resuma:

Lasi nin konkludi nian diskuton en la formo sekvi kuglojn –

  • Apache Cassandra estas scalable NoSQL bazita datumaron
  • Ĝi povas esti elŝutita kaj instalita de la Apache retejo
  • Cassandra estas ideala datumaro por administranta grandajn kvantojn de strukturita, Semi-strukturita, Kaj unstructured datumo trans multoblaj datumaj centroj kaj la nubo.
  • Cassandra subtenas linian scalability kaj alta elfaro trans multoblaj komercaĵaj serviloj kun neniu ununura punkto de malsukceso, Kaj provizas potencan dinamikan datuman modelon desegnita por maksimuma fleksebleco kaj rapida responda tempo.
Etikedita sur:
============================================= ============================================== Buy best TechAlpine Books on Amazon
============================================== ---------------------------------------------------------------- electrician ct chestnutelectric
error

Enjoy this blog? Please spread the word :)

Follow by Email
LinkedIn
LinkedIn
Share