Arkitektura ng isang Data Warehouse



Itinatampok ng blog na ito ang buong arkitektura ng isang data warehouse

Ano ang isang Data Warehouse?

Ang isang Data Warehouse ay isang sentral na lokasyon kung saan naka-imbak ang pinagsamang data mula sa maraming lokasyon. Ang Data Warehouse ay hindi na-load sa tuwing may isang bagong data na nabuo ngunit maaaring masuri ito ng end-user tuwing kailangan niya ng ilang impormasyon. Mayroong ilang mga timeline na natutukoy ng negosyo kung kailan kailangang ma-load ang Data Warehouse maging sa araw-araw, buwan o minsan sa isang isang-kapat na batayan.





Data Architecture ng Warehouse

Ang magkakaibang mga system ng warehousing ng data ay may magkakaibang istraktura. Ang ilan ay maaaring magkaroon ng isang maliit na bilang ng mga mapagkukunan ng data habang ang ilan ay maaaring malaki.

kung paano gumamit ng isang iterator

Mayroong maraming mga transactional system, mapagkukunan 1 at iba pang mga mapagkukunan tulad ng nabanggit sa imahe. Ang pinagmulan ay maaaring SAP o flat file at samakatuwid, maaaring may isang kumbinasyon ng mga mapagkukunan. Ang ETL (Extract, Transfer, Load) ay ginagamit upang mai-load ang data warehouse sa mga data mart. Ang pagkakaiba sa pagitan ng isang data house at isang data mart ay ang data warehouse ay ginagamit sa lahat ng mga samahan, habang ang data mart ay ginagamit para sa indibidwal na na-customize na pag-uulat.



Halimbawa, maraming mga kagawaran sa isang kumpanya tulad ng departamento ng pananalapi na ibang-iba sa isang departamento sa marketing. Lahat sila ay kumukuha ng data mula sa iba't ibang mga mapagkukunan at kailangan nila ng na-customize na pag-uulat. Pangunahing nag-aalala ang departamento ng pananalapi sa mga istatistika habang ang departamento ng marketing ay nababahala sa mga promosyon. Hindi nangangailangan ang departamento ng marketing ng anumang impormasyon sa pananalapi.

Para sa na-customize na pag-uulat, kinakailangan ang mga subset ng warehouse ng data na tinatawag na data marts. Mayroong dalawang mga diskarte sa paglo-load nito. Una, i-load ang data warehouse at pagkatapos ay i-load ang marts o kabaliktaran. Sa senaryo ng pag-uulat na kung saan ay ang layer ng pag-access ng data, ina-access ng gumagamit ang warehouse ng data at binubuo ang ulat. Ang lahat ng mga tool sa pag-uulat na ito ay inilaan upang gawing mas madali ang front interface para sa consumer dahil ang mga tao sa antas ng paggawa ng desisyon ay hindi nag-aalala sa impormasyong panteknikal. Pangunahin silang nag-aalala sa isang maayos na magagamit na ulat.

Samakatuwid, ang lahat ng mga tool sa pag-uulat na ito ay gumaganap sa front end ngunit sa likurang dulo, bumubuo ang mga ito ng mga query at na-hit ang database at nakukuha ng gumagamit ang ulat sa tamang oras. Ang mga tool sa pag-uulat na ito ay maaaring mag-iskedyul ng mga trabaho upang patakbuhin at makabuo ng mga ulat.



May tanong ba sa amin? Mangyaring banggitin ang mga ito sa seksyon ng mga komento at babalikan ka namin.

Mga Kaugnay na Post: