Bakit ka Dapat Maghalo Kung Maaari Ka Na Bang Sumali sa Tableau?



Paghahalo ng Data sa Tableau - isang pamamaraan na ginamit kapag may kaugnay na data sa maraming mapagkukunan ng data, na nais mong pag-aralan nang magkasama sa isang solong pagtingin.

Sa isang mundo na bumubuo at kumonsumo ng 2.5 quintillion bytes ng data, sa isang araw, ang mga organisasyon ay dapat na maghanap ng mga bagong pamamaraan upang mabago at pagsamahin ang data upang makamit ang pinakamainam na kahusayan. Ang isang ganoong pamamaraan ng pagsasama-sama ng data ay Paghahalo ng Data sa Tableau .

Ngayon, dahil nagsisilbi ito ng isang mahalagang layunin sa siklo ng data ng anumang naibigay na samahan, gumagawa ito para sa isang napaka-mahalagang module sa karamihan . Sa blog na ito, tatalakayin namin ang mga sumusunod na konsepto:





Bakit mo kailangan ng Data Blending sa Tableau?

Ipagpalagay, ikaw ay isang Talahanayan ng developer na may transactional na data na nakaimbak sa Salesforce at data ng quota na nakaimbak sa Access. Ang data na nais mong pagsamahin ay nakaimbak sa iba't ibang mga database, at ang granularity ng data na nakunan sa bawat talahanayan ay naiiba sa dalawang mapagkukunan ng data, kaya ang paghahalo ng data ay ang pinakamahusay na paraan upang pagsamahin ang data na ito.

Ang paghahalo ng data ay kapaki-pakinabang sa ilalim ng mga sumusunod na kundisyon:



  1. Nais mong pagsamahin ang data mula sa iba't ibang mga database na hindi suportado ng mga pagsali sa cross-database.

    Ang mga pagsali sa cross-database ay hindi sumusuporta sa mga koneksyon sa mga cube (halimbawa, Oracle Essbase) o sa ilang mga koneksyon na i-extract lamang (halimbawa, Google Analytics). Sa kasong ito, i-set up ang mga indibidwal na mapagkukunan ng data para sa data na nais mong pag-aralan, at pagkatapos ay gamitin ang paghahalo ng data upang pagsamahin ang mga mapagkukunan ng data sa isang solong sheet.

  2. Ang data ay nasa iba't ibang antas ng detalye.

    Minsan ang isang hanay ng data ay nakakakuha ng data gamit ang iba`t mga antas ng detalye ibig sabihin, mas malaki o mas maliit na granularity kaysa sa iba pang hanay ng data.

    Halimbawa, ipagpalagay na pinag-aaralan mo ang transactional data at data ng quota. Maaaring makuha ng data ng transaksyonal ang lahat ng mga transaksyon. Gayunpaman, ang data ng quota ay maaaring pagsamahin ang mga transaksyon sa antas ng isang-kapat. Dahil ang mga halagang transactional ay nakuha sa iba't ibang mga antas ng detalye sa bawat hanay ng data, dapat mong gamitin ang paghahalo ng data upang pagsamahin ang data.



Ano ang Data Blending sa Tableau?

Ang Data Blending ay isang napakalakas na tampok sa Lupon . Ginagamit ito kapag may nauugnay na data sa maraming mga mapagkukunan ng data, na nais mong pag-aralan nang magkasama sa isang solong view. Ito ay isang pamamaraan para sa pagsasama ng data na nagdaragdag ng isang talahanayan ng data mula sa isang mapagkukunan ng data sa mga haligi ng data mula sa isa pang mapagkukunan ng data.

Karaniwan, gumagamit ka ng mga pagsali upang maisagawa ang ganitong uri ng pagsasama-sama ng data, ngunit may mga oras, nakasalalay sa mga kadahilanan tulad ng uri ng data at granularity nito, kapag mas mahusay na gumamit ng paghahalo ng data.

Paano ito Naiiba Mula sa Pagsali sa Data?

Ang paghahalo ng data ay tumutulad sa isang tradisyunal na kaliwang pagsali. Ang pangunahing pagkakaiba sa pagitan ng dalawa ay kailan ang pagsali ay ginaganap na patungkol sa pagsasama-sama.

Kaliwa sumali

Kapag gumamit ka ng kaliwang sumali upang pagsamahin ang data, isang query ang ipapadala sa database kung saan isinasagawa ang pagsali. Ang paggamit ng isang left join ay nagbabalik ng lahat ng mga hilera mula sa kaliwang talahanayan at anumang mga hilera mula sa kanang talahanayan na may katumbas na tugma ng hilera sa kaliwang talahanayan. Ang mga resulta ng pagsali ay ibabalik pabalik at pinagsama-sama ng Tableau.

Halimbawa, ipagpalagay na mayroon kang mga sumusunod na talahanayan. Kung ang mga karaniwang haligi ay User ID , isang kaliwang pagsali ang kukuha ng lahat ng data mula sa kaliwang talahanayan, pati na rin ang lahat ng data mula sa kanang talahanayan dahil ang bawat hilera ay may katumbas na tugma sa hilera sa kaliwang talahanayan.

Pagsali sa Data - Paghahalo ng Data sa Tableau - EdurekaPaghahalo ng Data

Kapag gumamit ka ng paghahalo ng data upang pagsamahin ang data, isang query ang ipapadala sa database para sa bawat mapagkukunan ng data na ginagamit sa sheet. Ang mga resulta ng mga query, kasama ang pinagsama-samang data, ay naibalik at pinagsama ng Tableau. Ginagamit ng view ang lahat ng mga hilera mula sa pangunahing mapagkukunan ng data, ang kaliwang talahanayan, at ang pinagsamang mga hilera mula sa pangalawang mapagkukunan ng data, ang kanang mesa, batay sa sukat ng mga patlang ng pag-uugnay.

Maaari mong baguhin ang patlang ng pag-link o magdagdag ng higit pang mga patlang ng pag-link upang isama ang magkakaiba o karagdagang mga hilera ng data mula sa pangalawang mapagkukunan ng data sa timpla, binabago ang pinagsamang mga halaga.

Halimbawa, ipagpalagay na mayroon kang mga sumusunod na talahanayan. Kung ang mga patlang ng pag-uugnay ay User ID sa parehong mga talahanayan na pinaghalo ang iyong data ay tumatagal ng lahat ng data mula sa kaliwang talahanayan, at dinagdagan ang kaliwang talahanayan ng data mula sa kanang mesa. Sa kasong ito, hindi lahat ng mga halaga ay maaaring maging bahagi ng nagresultang talahanayan dahil sa mga sumusunod:

  • Ang isang hilera sa kaliwang talahanayan ay walang kaukulang tugma sa hilera sa kanang mesa, tulad ng ipinahiwatig ng null na halaga.
  • Mayroong maraming mga kaukulang halaga sa mga hilera sa kanang mesa, tulad ng ipinahiwatig ng asterisk (*).

Ipagpalagay na mayroon kang parehong mga talahanayan tulad ng nasa itaas, ngunit ang pangalawang mapagkukunan ng data ay naglalaman ng isang bagong patlang na tinawag Mga Layunin . Muli, kung ang pag-uugnay na patlang ay User ID , ang paghahalo ng iyong data ay tumatagal ng lahat ng data mula sa kaliwang talahanayan, at dinagdagan ito ng data mula sa kanang mesa. Sa kasong ito, nakikita mo ang parehong null na halaga at mga asterisk sa nakaraang halimbawa bilang karagdagan sa mga sumusunod:

  • Dahil ang Mga Layunin ang patlang ay isang panukala, nakikita mo ang mga halagang haligi para saMga Layuninpinagsama-sama ang patlang bago ang data sa kanang talahanayan ay isinasama sa data sa kaliwang talahanayan.
  • Tulad ng naunang halimbawa, ang isang hilera sa kaliwang talahanayan ay walang kaukulang hilera para sa Mga Layunin patlang, tulad ng ipinahiwatig ng pangalawang null na halaga.

Kailan magpapalit ng Sumali para sa Pinaghalong

1. Kailangan ng paglilinis ang data.

Kung ang iyong mga talahanayan ay hindi tugma sa bawat isa nang tama pagkatapos ng isang pagsali, i-set up ang mga mapagkukunan ng data para sa bawat talahanayan, gumawa ng anumang kinakailangang pagpapasadya (iyon ay, palitan ang pangalan ng mga haligi, baguhin ang mga uri ng data ng haligi, lumikha ng mga pangkat, gumamit ng mga kalkulasyon, atbp.), At pagkatapos ay gumamit ng data blending upang pagsamahin ang data.

2. Ang pagsali ay sanhi ng duplicate na data.

Ang duplicate na data pagkatapos ng isang pagsali ay isang sintomas ng data sa iba't ibang mga antas ng detalye. Kung napansin mo ang duplicate na data, sa halip na lumikha ng isang sumali, gumamit ng paghahalo ng data upang maghalo sa isang karaniwang sukat sa halip.

3. Marami kang data.

Karaniwang sumasama ay inirerekumenda para sa pagsasama-sama ng data mula sa parehong database. Ang mga pagsali ay pinangangasiwaan ng database, na nagbibigay-daan sa mga pagsali na magamit ang ilang mga katutubong kakayahan ng database. Gayunpaman, kung nagtatrabaho ka sa malalaking hanay ng data, ang mga pagsali ay maaaring maglagay ng isang pilay sa database at makabuluhang makakaapekto sa pagganap. Sa kasong ito, maaaring makatulong ang paghalo ng data. Dahil ang mga humahawak sa Tableau na pinagsasama ang data pagkatapos ng data ay pinagsama-sama, mayroong mas kaunting data upang pagsamahin. Kapag may mas kaunting data upang pagsamahin, sa pangkalahatan, nagpapabuti ng pagganap.

Paghahalo ng iyong Data sa Tableau

Maaari mong gamitin ang paghahalo ng data kapag mayroon kang data sa magkakahiwalay na mapagkukunan ng data na nais mong pag-aralan nang magkasama sa isang solong sheet. Ang tableau ay may dalawang nakapaloob na mapagkukunan ng data na pinangalanan Sample-superstore at Sample na kadena ng kape.mdb na gagamitin upang ilarawan ang data blending.

Hakbang 1: Kumonekta sa iyong data at i-set up ang mga mapagkukunan ng data

  • Kumonekta sa isang hanay ng data at i-set up ang pinagmulan ng data sa pahina ng mapagkukunan ng data. Isang inbuilt na mapagkukunan ng data Sample na kadena ng kape.mdb ,na isang MS Access database file, ay gagamitin upang ilarawan ang data blending.
  • Pumunta sa Data > Bagong mapagkukunan ng data, kumonekta sa ikalawang hanay ng data.Ang halimbawang ito ay gumagamit ng Sample - Superstore pinanggalingan ng Datos. Tinayos ng inahin ang mapagkukunan ng data.
  • Mag-click sa sheet na sheet upang simulang buuin ang iyong pagtingin.

Hakbang 2: Magtalaga ng isang pangunahing mapagkukunan ng data

simpleng pagpapatupad ng hashmap sa java
  • I-drag ang kahit isang patlang mula sa iyong pangunahing mapagkukunan ng data sa view upang italaga ito bilang pangunahing mapagkukunan ng data. Nasa Data pane, i-click ang mapagkukunan ng data na nais mong italaga bilang pangunahing mapagkukunan ng data. Sa halimbawang ito, Sample chain ng kape napili
  • Ipinapakita ng sumusunod na screenshot ang iba't ibang mga talahanayan at sumali na magagamit sa file.

Hakbang 3: Magtalaga ng isang pangalawang mapagkukunan ng data

  • Ang mga patlang na ginamit sa pagtingin mula sa mga mapagkukunan ng data na hindi pangunahing mapagkukunan ng data o mga aktibong link na awtomatikong nagtatalaga ng kasunod na mga mapagkukunan ng data bilang pangalawang mapagkukunan ng data. Sa kasong ito, Sample Superstore.

Hakbang 4: Paghalo ng Data

  • Ngayon ay maaari mong isama ang data mula sa parehong mga mapagkukunan batay sa isang karaniwang sukat ( Estado , sa kasong ito). Tandaan na ang isang maliit na imahe ng link ay lilitaw sa tabi ng dimensyon - Estado. Ipinapahiwatig nito ang karaniwang sukat sa pagitan ng dalawang mapagkukunan ng data.
  • Ipagpalagay na lumikha ka ng isang tsart ng bar sa Ratio ng Kita sa Column Shelf at Estado sa Row Shelf, ipinapakita ng tsart kung paano nag-iiba ang ratio ng kita para sa bawat estado sa parehong superstore at mga coffee chain shop.

Mga limitasyon ng Data Blending sa Tableau

  1. Mayroong ilang mga limitasyon sa paghahalo ng data sa paligid ng mga hindi additive na pinagsasama-sama, tulad ng MEDIAN , at RAWSQLAGG .
  2. Kinokompromiso ng Data Blending ang bilis ng Query sa mataas na Granularity.
  3. Kapag sinubukan mong pag-uri-uriin sa pamamagitan ng isang kinakalkula na patlang na gumagamit ng pinaghalo na data, ang kalkuladong patlang ay hindi nakalista sa drop-down na listahan ng Field ng Pag-uri-uriin ang kahon ng dialogo.
  4. Ang mga mapagkukunan ng data ng Cube ay maaari lamang magamit bilang pangunahing mapagkukunan ng data para sa paghahalo ng data sa Tableau. Hindi sila maaaring magamit bilang pangalawang mapagkukunan ng data.

Inaasahan kong lahat kayo, ngayon, magkaroon ng patas na ideya tungkol sa Paghahalo ng Data sa Tableau mula sa blog na ito Gutom para sa karagdagang kaalaman? Huwag magalala, bibigyan ka ng video na ito ng mas mahusay na pag-unawa sa konsepto.