Paano Patakbuhin ang Mga Script ng Hive?



Ito ay isang tutorial sa kung paano patakbuhin ang Hive Script. Ang pagpapatakbo ng script na ito ay magbabawas ng oras at pagsisikap na inilalagay namin sa pagsusulat at manu-manong pagpapatupad ng bawat utos.

Ang pagiging isang Data Warehousing package na itinayo sa tuktok ng Hadoop, ang Apache Hive ay lalong ginagamit para sa pagtatasa ng data, pagmimina ng data at hinuhulaan na pagmomodelo. Naghahanap ang mga samahan ng mga propesyonal na may matatag na pagpigil . Sa post na ito, tingnan natin kung paano patakbuhin ang Hive Scripts. Sa pangkalahatan, ginagamit namin ang mga script upang magpatupad ng isang hanay ng mga pahayag nang sabay-sabay. Ang mga Hive Script ay ginagamit nang halos pareho sa parehong paraan. Bawasan nito ang oras at pagsisikap na inilalagay namin sa pagsusulat at manu-manong pagpapatupad ng bawat utos.

Ang mga Hive Script ay suportado sa mga bersyon ng Hive 0.10.0 at mas mataas. Tulad ng naka-install na bersyon ng Hive 0.90 sa CDH3, hindi namin mapapatakbo ang Hive Scripts sa CDH3. Maaari mong subukan ang mga hakbang sa ibaba sa CDH4 dahil mayroon itong naka-install na bersyon ng Hive 0.10.0 sa kanila. May kamalayan ka ba kung paano lumikha ng isang Hive script? Kung hindi, mag-click upang makakuha ng karagdagang paglilinaw.





Master-Hive-Now

Ngayon, tingnan natin kung paano isulat ang mga script sa Hive at patakbuhin ang mga ito sa CDH4:



Hakbang 1: Pagsulat ng isang iskrip ng Hive.

Upang isulat ang Hive Script ang file ay dapat na nai-save gamit ang .sql extension. Magbukas ng isang terminal sa iyong pamamahagi ng Cloudera CDH4 at ibigay ang sumusunod na utos upang lumikha ng isang Hive Script.
Utos: sudo gedit sample.sql

Sa pagpapatupad ng utos sa itaas, bubuksan nito ang file na may listahan ng lahat ng mga utos ng Hive na kailangang maipatupad.



Sa script na ito, isang talahanayan ang lilikha, ilalarawan at ang data ay mai-load at makuha mula sa talahanayan.

1. Paglikha ng Talahanayan sa Hive:

ano ang isang pamamaraang tostring sa java

Utos: lumikha ng produkto ng talahanayan (productid: int, productname: string, presyo: float, kategorya: string) na mga hilera na format ng mga hilera na natapos ng ‘,’

Dito, ang produkto ay ang pangalan ng talahanayan at {productid, productname, presyo, kategorya} ang mga haligi ng talahanayan na ito.

Ang mga patlang na tinapos ng ',' ay nagpapahiwatig na ang mga haligi sa input file ay pinaghihiwalay ng simbolong ','.

Bilang default ang mga tala sa input file ay pinaghihiwalay ng isang bagong linya.

2. Paglalarawan ng Talahanayan:

Utos: ilarawan ang produkto

3. Nilo-load ang Data sa Talahanayan.

Upang mai-load muna ang data sa talahanayan kailangan muna naming lumikha ng isang file ng pag-input na naglalaman ng mga talaan na kailangang ipasok sa talahanayan.

Lumikha tayo ng isang file ng pag-input.

Utos: sudo gedit input.txt

I-edit ang mga nilalaman sa file tulad ng ipinakita sa figure.

4. Kinukuha ang Data:

Upang makuha ang data, ginagamit ang piling utos.

Utos: Piliin ang * mula sa produkto

Ang utos sa itaas ay ginagamit upang makuha ang halaga ng lahat ng mga haligi na naroroon sa talahanayan. Ang script ay dapat na tulad ng ipinapakita sa larawan sa ibaba.

Ngayon, tapos na kami sa pagsusulat ng script ng Hive. Ang file sample.sql ay maaari nang mai-save.

Hakbang 2: Pagpapatakbo ng Hive Script

Ang sumusunod ay ang utos na patakbuhin ang Hive script:

Utos: hive –f /home/cloudera/sample.sql

ano pojo class sa java

Habang ipinapatupad ang script, siguraduhin na ang buong landas ng lokasyon ng file ng Script ay naroroon.

Maaari naming makita na ang lahat ng mga utos ay matagumpay na naisagawa.

Ito ang paraan ng pagpapatakbo at pagpapatupad ng mga script ng Hive sa CDH4.

Ang pugad ay isang kritikal na bahagi ng Hadoop at ang iyong kadalubhasaan sa Hive ay maaaring mapunta sa iyo ng pinakamataas na pagbabayad na mga trabaho sa Hadoop! Ang Edureka ay may isang espesyal na na-curate na kurso na Hadoop na tumutulong sa iyo na makabisado ng mga konsepto tulad ng MapReduce, Yarn, Pig, Hive, HBase, Oozie, Flume at Sqoop. Mag-click sa pindutan sa ibaba upang makapagsimula.

May tanong ba sa amin? Mangyaring banggitin ang mga ito sa seksyon ng mga komento at babalikan ka namin.

Mga Kaugnay na Post:

Mga Utos ng Pugad

Mga Modelo ng Data ng Hive