Tutorial sa HBase: Panimula ng HBase at Pag-aaral ng Kaso sa Facebook



Ipinakikilala sa iyo ng HBase tutorial blog na ito kung ano ang HBase at mga tampok nito. Saklaw din nito ang pag-aaral ng kaso sa Facebook Messenger upang maunawaan ang mga pakinabang ng HBase.

Tulad ng nabanggit namin sa aming blog, ang HBase ay isang mahalagang bahagi ng aming Hadoop ecosystem. Kaya ngayon, nais kong dalhin ka sa tutorial ng HBase, kung saan ipapakilala kita sa Apache HBase, at pagkatapos, dadaan kami sa case-study sa Facebook Messenger. Tatalakayin namin ang mga sumusunod na paksa sa HBase tutorial blog na ito:

Apache HBase Tutorial: Kasaysayan

Magsimula tayo sa kasaysayan ng HBase at malaman kung paano umunlad ang HBase sa loob ng isang panahon.





Kasaysayan ng HBase - Tutorial sa HBase - Edureka

  • Ang Apache HBase ay na-modelo pagkatapos ng Google's BigTable, na ginagamit upang mangolekta ng data at maghatid ng kahilingan para sa iba't ibang mga serbisyo ng Google tulad ng Maps, Pananalapi, Lupa atbp.
  • Ang Apache HBase ay nagsimula bilang isang proyekto ng kumpanya ng Powerset para sa Likas na Paghahanap sa Wika, na humahawak ng napakalaking at kalat-kalat na mga hanay ng data.
  • Ang Apache HBase ay unang inilabas noong Pebrero 2007. Pagkaraan ng Enero 2008, ang HBase ay naging isang sub proyekto ng Apache Hadoop.
  • Noong 2010, ang HBase ay naging nangungunang antas ng proyekto ng Apache.

HBase Tutorial | Mga Database ng NoSQL | Edureka



Matapos malaman ang tungkol sa kasaysayan ng Apache HBase, gusto mong malaman kung ano ang Apache HBase? Lumipat tayo nang malayo at tingnan.

Apache HBase Tutorial: Panimula sa HBase

Ang HBase ay isang bukas na mapagkukunan, multidimensional, ipinamamahagi, nasusukat at a Database ng NoSQL nakasulat sa Java. Tumatakbo ang HBase sa tuktok ng HDFS (Hadoop Ipinamahagi File System) at nagbibigay BigTable tulad ng mga kakayahan sa Hadoop. Ito ay dinisenyo upang magbigay ng isang mapagparaya paraan ng pag-iimbak ng malaking koleksyon ng mga kalat-kalat na mga hanay ng data.

Dahil, nakakamit ng HBase ang mataas na throughput at mababang latency sa pamamagitan ng pagbibigay ng mas mabilis na Basahin / Isulat ang Pag-access sa malaking mga hanay ng data. Samakatuwid, ang HBase ay ang pagpipilian para sa mga application na nangangailangan ng mabilis at random na pag-access sa malaking halaga ng data.



Nagbibigay ito ng compression, in-memory operations at Bloom filters (istraktura ng data na nagsasabi kung mayroong isang halaga sa isang set o hindi) upang matupad ang kinakailangan ng mabilis at random na read-magsusulat.

Unawain natin ito sa pamamagitan ng isang halimbawa: Ang isang jet engine ay bumubuo ng iba't ibang mga uri ng data mula sa iba't ibang mga sensor tulad ng pressure sensor, temperatura sensor, speed sensor, atbp na nagsasaad ng kalusugan ng engine. Napaka kapaki-pakinabang upang maunawaan ang mga problema at katayuan ng paglipad. Ang Patuloy na Mga Operasyon ng Engine ay bumubuo ng 500 GB data bawat flight at mayroong 300 libong mga flight bawat araw na tinatayang. Kaya, ang Engine Analytics na inilapat sa naturang data sa malapit na real time ay maaaring magamit upang maagap na ma-diagnose ang mga problema at mabawasan ang hindi planadong downtime. Nangangailangan ito ng isang ipinamamahagi na kapaligiran upang mag-imbak ng maraming data mabilis na random na nagbasa at sumusulat para sa pagproseso ng real time. Dito, dumating ang HBase para sa pagsagip. Pag-uusapan ko ang tungkol sa HBase Basahin at Isulat nang detalyado sa aking susunod na blog sa Arkitektura ng HBase .

Tulad ng alam natin, ang HBase ay isang database ng NoSQL. Kaya, bago maunawaan ang higit pa tungkol sa HBase, hinayaan muna nating talakayin ang tungkol sa mga database ng NoSQL at mga uri nito.

Apache HBase Tutorial: NoSQL Databases

Nangangahulugan ang NoSQL Hindi lamang SQL . Ang mga database ng NoSQL ay na-modelo sa isang paraan na maaari itong kumatawan sa data bukod sa mga tabular na format, mga unkile na mga pamamagitang database. Gumagamit ito ng iba't ibang mga format upang kumatawan sa data sa mga database at sa gayon, mayroong iba't ibang mga uri ng mga database ng NoSQL batay sa kanilang format ng representasyon. Karamihan sa mga database ng NoSQL ay gumagamit ng kakayahang magamit at bilis ng higit sa pagkakapare-pareho. Ngayon, magpatuloy tayo at unawain ang tungkol sa iba't ibang mga uri ng mga database ng NoSQL at ang kanilang mga format ng representasyon.

remote na paraan ng pagtawag sa java

Mga tindahan na Key-Value:

Ito ay isang database na walang schema na naglalaman ng mga susi at halaga. Ang bawat key, ay tumuturo sa isang halaga na kung saan ay isang hanay ng mga byte, ay maaaring isang string, BLOB, XML, atbp. Hal. Ang Lamborghini ay isang susi at maaaring magturo sa isang halagang Gallardo, Aventador, Murciélago, Reventón, Diablo, Huracán, Veneno, Centenario atbp.

Mga database ng key-Value store: Aerospike, Couchbase, Dynamo, FairCom c-treeACE, FoundationDB, HyperDex, MemcacheDB, MUMPS, Oracle NoSQL Database, OrientDB, Redis, Riak, Berkeley DB.

Use-case

Mahusay na pinangangasiwaan ng mga tindahan ng key-size ang laki at mahusay sa pagproseso ng isang pare-pareho na stream ng read / magsulat ng mga operasyon na may mababang latency. Ginagawa silang perpekto para saKagustuhan ng gumagamit at mga tindahan ng profile,Mga rekomendasyon ng produkto pinakabagong item na tiningnan sa isang website ng tingi para sa paghimok ng mga rekomendasyon sa produkto ng customer sa hinaharap,Ang paghahatid ng ad sa mga pamimili sa pamimili ng customer ay nagreresulta sa mga na-ad na ad, kupon, atbp para sa bawat customer nang real-time.

Nauugnay sa Dokumento :

Sinusundan nito ang parehong key pares ng halaga, ngunit ito ay semi nakabalangkas tulad ng XML, JSON, BSON. Ang mga istrukturang ito ay isinasaalang-alang bilang mga dokumento.

Mga database na Batay sa Dokumento: Apache CouchDB, Clusterpoint, Couchbase, DocumentDB, HyperDex, IBM Domino, MarkLogic, MongoDB, OrientDB, Qizx, RethinkDB.

Use-Case

Tulad ng sinusuportahan ng dokumento na may kakayahang umangkop na iskema, mabilis na basahin ang pagsulat at pagkahati na ginagawang angkop para sa paglikha ng mga database ng gumagamit sa iba't ibang mga serbisyo tulad ng kaba, e-commerce website atbp

Oriented sa haligi:

Sa database na ito, ang data ay nakaimbak sa cell na naka-grupo sa haligi kaysa sa mga hilera. Ang mga haligi ay lohikal na napangkat sa mga pamilya ng haligi na maaaring malikha sa panahon ng kahulugan ng schema o sa runtime.

Ang mga uri ng mga database na ito ay nag-iimbak ng lahat ng mga cell na naaayon sa isang haligi bilang tuluy-tuloy na pagpasok ng disk, kaya't ginagawang mas mabilis ang pag-access at paghahanap.

Mga Database na Batay sa Column: HBase, Accumulo, Cassandra, Druid, Vertica.

Use-Case

Sinusuportahan nito ang malaking imbakan at pinapayagan ang mas mabilis na basahin ang pag-access ng sulat dito. Ginagawa nitong angkop ang mga database ng oriented sa haligi para sa pag-iimbak ng mga pag-uugali ng customer sa website ng e-commerce, mga sistemang pampinansyal tulad ng Google Finance at data ng stock market, Google map atbp.

Oriented sa grap:

Ito ay isang perpektong kakayahang umangkop na graphic na representasyon, ginamit hindi katulad ng SQL. Ang mga uri ng database ay madaling malutas ang mga problema sa kakayahang sumukat dahil naglalaman ito ng mga gilid at node na maaaring mapalawak alinsunod sa mga kinakailangan.

Mga base sa database na grap: AllegroGraph, ArangoDB, InfiniteGraph, Apache Giraph, MarkLogic, Neo4J, OrientDB, Virtuoso, Stardog.

Use-case

Karaniwang ginagamit ito sa Pagtuklas ng pandaraya, mga engine ng rekomendasyon sa real-time (sa karamihan ng mga kaso ng e-commerce), pamamahala ng data ng Master (MDM), pagpapatakbo ng Network at IT, pamamahala ng pagkakakilanlan at pag-access (IAM), atbp.

Ang HBase at Cassandra ay ang dalawang tanyag na mga database ng oriented sa haligi. Kaya, ngayon na pinag-uusapan ito sa isang mas mataas na antas, ihambing natin at maunawaan ang pagkakaiba sa arkitektura at nagtatrabaho sa pagitan ng HBase at Cassandra.

Tutorial sa HBase: HBase VS Cassandra

  • Ang HBase ay na-modelo sa BigTable (Google) habang ang Cassandra ay batay sa DynamoDB (Amazon) na paunang binuo ng Facebook.
  • Pinakikinabangan ng HBase ang imprastraktura ng Hadoop (HDFS, ZooKeeper) habang hiwalay na umunlad ang Cassandra ngunit maaari mong pagsamahin ang Hadoop at Cassandra ayon sa iyong mga pangangailangan.
  • Ang HBase ay may maraming mga bahagi na magkakasamang nakikipag-usap tulad ng HBase HMaster, ZooKeeper, NameNode, Region Severs. Habang ang Cassandra ay isang solong uri ng node, kung saan ang lahat ng mga node ay pantay at nagsasagawa ng lahat ng mga pagpapaandar. Ang anumang node ay maaaring maging coordinator na tinanggal nito ang Single Point ng kabiguan.
  • Ang HBase ay na-optimize para sa nabasa at sinusuportahan ang mga solong pagsulat, na hahantong sa mahigpit na pagkakapare-pareho. Sinusuportahan ng HBase ang mga pag-scan na batay sa Saklaw, na ginagawang mas mabilis ang proseso ng pag-scan. Sapagkat sinusuportahan ni Cassandra ang solong bumabasa ng hilera na nagpapanatili ng panghuli na pagkakapare-pareho.
  • Hindi sinusuportahan ni Cassandra ang mga pag-scan sa hanay na batay sa saklaw, na nagpapabagal sa proseso ng pag-scan kumpara sa HBase.
  • Sinusuportahan ng HBase ang order ng pagkahati, kung saan ang mga hilera ng isang Pamilya ng Haligi ay nakaimbak sa pagkakasunod-sunod ng RowKey, samantalang sa Casandra ay nag-order ng paghati ay isang hamon. Dahil sa pagkahati ng RowKey ang proseso ng pag-scan ay mas mabilis sa HBase kumpara sa Cassandra.
  • Hindi sinusuportahan ng HBase ang pagbabasa ng pagbalanse ng load, isang Rehiyon Server ang naghahatid ng hiniling na basahin at ang mga replika ay ginagamit lamang sa kaso ng pagkabigo. Habang sinusuportahan ni Cassandra ang pagbabasa ng pagbalanse ng load at maaaring basahin ang parehong data mula sa iba't ibang mga node. Maaari nitong ikompromiso ang pagkakapare-pareho.
  • Sa CAP (Pagkakapare-pareho, Pagkakaroon at Paghiwalay -Tolerance) ang teorama na HBase ay nagpapanatili ng Pagkakapare-pareho at kakayahang magamit habang ang Cassandra ay nakatuon sa Pagkakaroon at Paghiwalay -Tolerance.


Ngayon gumawa tayo ng isang malalim na pagsisid at unawain ang mga tampok ng Apache HBase na ginagawang tanyag nito.

Apache HBase Tutorial: Mga Tampok ng HBase

  • Basahin at isulat ng Atomic: Sa antas ng hilera, nagbibigay ang HBase ng pagbabasa at pagsusulat ng atom. Maaari itong ipaliwanag bilang, sa panahon ng isang proseso ng pagbasa o pagsulat, ang lahat ng iba pang mga proseso ay pinipigilan mula sa pagsasagawa ng anumang operasyon ng pagbasa o pagsulat.
  • Pare-pareho na nagbabasa at sumusulat: Nagbibigay ang HBase ng pare-parehong pagbabasa at pagsusulat dahil sa tampok sa itaas.
  • Linear at modular scalability: Habang ang mga hanay ng data ay ipinamamahagi sa HDFS, sa gayon ito ay linearly nasusukat sa iba't ibang mga node, pati na rin ang modular na nasusukat, dahil nahahati ito sa iba't ibang mga node.
  • Awtomatiko at mai-configure na sharding ng mga talahanayan: Ang mga talahanayan ng HBase ay ipinamamahagi sa mga kumpol at ang mga kumpol na ito ay ipinamamahagi sa mga rehiyon. Nahahati ang mga rehiyon at kumpol na ito, at muling ipinamamahagi habang lumalaki ang data.
  • Madaling gamitin ang Java API para sa pag-access ng client: Nagbibigay ito ng madaling gamitin na Java API para sa programmatic access.
  • Thrift gateway at isang REST-ful na mga serbisyo sa Web: Sinusuportahan din nito ang Thrift at REST API para sa mga front-end na hindi Java.
  • I-block ang Mga Filter ng Cache at Bloom: Sinusuportahan ng HBase ang isang Block Cache at Bloom Filter para sa pag-optimize ng mataas na dami ng query.
  • Awtomatikong suporta sa kabiguan: Ang HBase na may HDFS ay nagbibigay ng WAL (Sumulat sa Unahan Mag-log) sa mga kumpol na nagbibigay ng awtomatikong suporta sa pagkabigo.
  • Pinagsunod-sunod na mga rowkey: Tulad ng paghahanap ay tapos na sa saklaw ng mga hilera, ang HBase ay nag-iimbak ng mga rowkey sa isang pagkakasunud-sunod ng leksikograpiko. Gamit ang mga pinagsunod-sunod na rowkeys at timestamp, makakabuo kami ng na-optimize na kahilingan.

Sumusulong ngayon sa tutorial na ito ng HBase, hayaan mong sabihin ko sa iyo kung ano ang mga case ng paggamit at mga sitwasyon kung saan maaaring magamit ang HBase at pagkatapos, ihahambing ko ang HDFS at HBase.

Nais kong iguhit ang iyong pansin patungo sa mga sitwasyon kung saan ang HBase ay ang pinakaangkop.

Tutorial sa HBase: Kung saan maaari nating gamitin ang HBase?

  • Dapat nating gamitin ang HBase kung saan mayroon kaming malalaking mga hanay ng data (milyon-milyon o bilyun-bilyon o mga hilera at haligi) at nangangailangan kami ng mabilis, random at real time, basahin at isulat ang pag-access sa data.
  • Ang mga hanay ng data ay ipinamamahagi sa iba't ibang mga kumpol at kailangan namin ng mataas na kakayahang sumukat upang mahawakan ang data.
  • Ang data ay natipon mula sa iba't ibang mga mapagkukunan ng data at ito ay alinman sa semi istrakturang o hindi istrakturang data o isang kombinasyon ng lahat. Madali itong mapangasiwaan ng HBase.
  • Nais mong iimbak ang data na nakatuon sa haligi.
  • Mayroon kang maraming mga bersyon ng mga hanay ng data at kailangan mong iimbak ang lahat ng mga ito.

Bago ako tumalon sa pag-aaral ng kaso ng messenger sa Facebook,hayaan mong sabihin ko sa iyo kung ano ang mga pagkakaiba sa pagitan ng HBase at HDFS.

Tutorial sa HBase: HBase VS HDFS

Ang HDFS ay isang nakabatay sa Java na nakabahaging file system na nagpapahintulot sa iyo na mag-imbak ng malaking data sa maraming mga node sa isang Hadoop cluster. Kaya, ang HDFS ay isang napapailalim na sistema ng pag-iimbak para sa pagtatago ng data sa ibinahaging kapaligiran. Ang HDFS ay isang file system, samantalang ang HBase ay isang database (katulad ng NTFS at MySQL).

Tulad ng Pareho ng HDFS at HBase na nag-iimbak ng anumang uri ng data (hal. Nakabalangkas, semi-nakabalangkas at hindi nakaayos) sa isang ipinamamahagi na kapaligiran upang tingnan natin ang mga pagkakaiba sa pagitan ng HDFS file system at HBase, isang database ng NoSQL.

  • Nagbibigay ang HBase ng mababang pag-access ng latency sa maliit na halaga ng data sa loob ng malalaking hanay ng data habang nagbibigay ang HDFS ng mataas na pagpapatakbo ng latency.
  • Sinusuportahan ng HBase ang random na pagbabasa at pagsulat habang sinusuportahan ng HDFS ang WORM (Sumulat ng isang beses Basahin Maraming o Maramihang beses).
  • Ang HDFS ay karaniwang o pangunahing na-access sa pamamagitan ng mga trabaho sa MapReduce habang ang HBase ay na-access sa pamamagitan ng mga shell command, Java API, REST, Avro o Thrift API.

Nag-iimbak ang HDFS ng malalaking mga hanay ng data sa isang ipinamamahagi na kapaligiran at ginagamit ang pagproseso ng batch sa data na iyon. Hal. makakatulong ito sa isang website ng e-commerce upang mag-imbak ng milyun-milyong data ng customer sa isang ipinamigay na kapaligiran na lumago sa loob ng mahabang panahon (maaaring 4-5 taon o higit pa). Pagkatapos ay pinapakinabangan nito ang pagproseso ng batch sa data na iyon at pag-aralan ang pag-uugali, pattern, mga kinakailangan sa customer. Pagkatapos ay maaaring malaman ng kumpanya kung anong uri ng produkto, pagbili ng customer sa kung aling mga buwan. Nakakatulong ito upang maiimbak ang nai-archive na data at isagawa ang pagproseso ng batch dito.

Habang ang HBase ay nag-iimbak ng data sa isang oriented na haligi na paraan kung saan ang bawat haligi ay naimbak nang magkasama upang, ang pagbabasa ay nagiging mas mabilis na paggamit ng pagproseso ng real time. Hal. sa isang katulad na kapaligiran sa e-commerce, nag-iimbak ito ng milyun-milyong data ng produkto. Kaya't kung naghahanap ka para sa isang produkto sa milyun-milyong mga produkto, na-optimize nito ang proseso ng paghiling at paghahanap, na gumagawa agad ng resulta (o masasabi mo sa real time). Ang detalyado Paliwanag ng arkitektura ng HBase , Magtatakip ako sa aking susunod na blog.

Tulad ng alam namin na ang HBase ay ipinamahagi sa HDFS, kaya ang isang kumbinasyon ng pareho ay nagbibigay sa amin ng isang mahusay na pagkakataon na gamitin ang mga benepisyo ng pareho, sa isang pinasadyang solusyon, tulad ng makikita natin sa ibaba ng pag-aaral ng kaso ng messenger sa Facebook.

Tutorial sa HBase: Pag-aaral ng Kaso sa Facebook Messenger

Platform sa Pagmemensahe ng Facebook inilipat mula sa Apache Cassandra patungong HBase noong Nobyembre 2010.

Pinagsasama ng Facebook Messenger ang Mga Mensahe, email, chat at SMS sa isang real-time na pag-uusap. Sinusubukan ng Facebook na bumuo ng isang nasusukat at matatag na imprastraktura upang hawakan ang hanay ng mga serbisyong ito.

Sa oras na iyon ang pamamahala ng imprastraktura ng mensahe ay humawak ng higit sa 350 milyong mga gumagamit na nagpapadala ng higit sa 15 bilyong mga mensahe ng tao bawat buwan bawat buwan. Sinusuportahan ng serbisyo sa chat ang higit sa 300 milyong mga gumagamit na nagpapadala ng higit sa 120 bilyong mga mensahe bawat buwan.

Sa pamamagitan ng pagsubaybay sa paggamit, nalaman nila na, lumitaw ang dalawang pangkalahatang mga pattern ng data:

  • Isang maikling hanay ng temporal na data na may posibilidad na maging pabagu-bago
  • Isang lumalaking hanay ng data na bihirang ma-access

Nais ng Facebook na makahanap ng isang solusyon sa pag-iimbak para sa dalawang mga pattern ng paggamit at nagsimula silang mag-imbestiga upang makahanap ng kapalit ng mayroon nang imprastraktura ng Mga Mensahe.

Mas maaga sa 2008, gumamit sila ng open-source database, ibig sabihin, Cassandra, na kung saan ay isang tindahan ng key-value na magkakasunod-sunod na nasa produksyon na naghahatid ng trapiko para sa Paghahanap sa Inbox. Ang kanilang mga koponan ay may mahusay na kaalaman sa paggamit at pamamahala ng isang MySQL database, kaya ang paglipat ng alinman sa mga teknolohiya ay isang seryosong pag-aalala para sa kanila.

Gumugol sila ng ilang linggo sa pagsubok ng iba't ibang mga balangkas, upang suriin ang mga kumpol ng MySQL, Apache Cassandra, Apache HBase at iba pang mga system. Sa huli ay pinili nila ang HBase.

Tulad ng pagkabigo ng MySQL na hawakan nang mahusay ang malalaking mga hanay ng data, habang lumaki ang mga index at set ng data, naghirap ang pagganap. Natagpuan nila na hindi kayang hawakan ni Cassandra ang mahirap na pattern upang mapagkasundo ang kanilang bagong imprastraktura ng Mga Mensahe.

Ang mga pangunahing problema ay:

  • Ang pag-iimbak ng malalaking hanay ng patuloy na lumalagong data mula sa iba't ibang mga serbisyo sa Facebook.
  • Nangangailangan ng Database na maaaring magamit nang mataas dito.
  • Mataas na pagganap na kinakailangan upang maghatid ng milyun-milyong mga kahilingan.
  • Pagpapanatili ng pagkakapare-pareho sa pag-iimbak at pagganap.

Larawan: Mga hamon na kinakaharap ng messenger ng Facebook

Para sa lahat ng mga problemang ito, ang Facebook ay nakagawa ng isang solusyon ibig sabihin, HBase. Pinagtibay ng Facebook ang HBase para sa paghahatid ng Facebook messenger, chat, email, atbp. Dahil sa iba't ibang mga tampok.

Ang HBase ay may napakahusay na kakayahang sukatin at pagganap para sa workload na ito na may isang mas simpleng modelo ng pagkakapare-pareho kaysa kay Cassandra. Habang natagpuan nila ang HBase na pinakaangkop sa mga tuntunin ng kanilang mga kinakailangan tulad ng auto load balancing at failover, suporta sa compression, maraming shard bawat server, atbp.

Ang HDFS, na kung saan ay ang napapailalim na file system na ginamit ng HBase na nagbigay din sa kanila ng maraming mga kinakailangang tampok tulad ng end-to-end na mga tseke, pagtitiklop at awtomatikong pag-balancing sa pag-load.

Larawan: HBase bilang isang solusyon sa Facebook messenger

Habang pinagtibay nila ang HBase, nakatuon din sila sa paggawa ng mga resulta pabalik sa HBase mismo at nagsimulang magtrabaho nang malapit sa pamayanan ng Apache.

Dahil ang mga mensahe ay tumatanggap ng data mula sa iba't ibang mga mapagkukunan tulad ng SMS, chat at email, nagsulat sila ng isang server ng application upang hawakan ang lahat ng paggawa ng desisyon para sa mensahe ng isang gumagamit. Nakikipag-interface ito sa malaking bilang ng iba pang mga serbisyo. Ang mga kalakip ay nakaimbak sa isang Haystack (na gumagana sa HBase). Sumulat din sila ng isang serbisyo sa pagtuklas ng gumagamit sa tuktok ng Apache ZooKeeper na nakikipag-usap sa iba pang mga serbisyo sa imprastraktura para sa mga relasyon ng kaibigan, pagpapatunay sa email account, mga desisyon sa paghahatid at mga desisyon sa privacy.

Ang koponan ng Facebook ay gumugol ng maraming oras na nagkukumpirma na ang bawat isa sa mga serbisyong ito ay matatag, maaasahan at nagbibigay ng mahusay na pagganap upang mahawakan ang isang real-time na sistema ng pagmemensahe.

Inaasahan kong ang HBase tutorial blog na ito ay nagbibigay-kaalaman at nagustuhan mo ito. Sa blog na ito, nalaman mo ang mga pangunahing kaalaman sa HBase at mga tampok nito.Sa susunod kong blog ng , Ipapaliwanag ko ang arkitektura ng HBase at pagtatrabaho ng HBase na nagpapasikat sa mabilis at random na pagbasa / pagsulat.

Ngayon na naintindihan mo ang mga pangunahing kaalaman ng HBase, tingnan ang ni Edureka, isang pinagkakatiwalaang kumpanya sa pag-aaral sa online na may isang network na higit sa 250,000 nasiyahan na mga nag-aaral na kumalat sa buong mundo. Ang kurso sa Edureka Big Data Hadoop Certification Training ay tumutulong sa mga nag-aaral na maging dalubhasa sa HDFS, Yarn, MapReduce, Pig, Hive, HBase, Oozie, Flume at Sqoop na gumagamit ng mga kaso ng paggamit ng real-time sa Retail, Social Media, Aviation, Turismo, Pananalapi domain.

May tanong ba sa amin? Mangyaring banggitin ito sa seksyon ng mga komento at babalikan ka namin.