Prediksyon na Proseso ng Analytics sa Business Analytics na may R



Nagbibigay ang blog ng isang maikling ideya tungkol sa proseso ng Predictive Analytics sa Business Analytics na may R

Karaniwang Proseso ng Pagmomodelo:

Sa isang tipikal na proseso ng pagmomodelo, mahalagang simulan ang pagguhit ng isang teorya. Ang isang RFP (Kahilingan para sa Panukala) ay natanggap at pagkatapos ay iginuhit ang isang Hypothesis.





kung paano lumikha ng isang set
  1. Tukuyin ang Tamang Pinagmulan ng Data - Dito, maaaring magbigay ang customer ng mapagkukunan ng data, kung hindi, kailangan naming maghanap para sa isang mapagkukunan ng data. Dahil sa isang senaryo, kung saan sinusubukan naming suriin kung sino ang mananalo sa halalan, isang pampublikong pagsusuri ng data ay ginagawa kasama ang mga mapagkukunan na may kasamang social media, mga channel ng balita o opinyon sa publiko. Kailangan din nating maunawaan ang dami ng data na kinakailangan upang pag-aralan ang problema. Sa kasong ito, karaniwang naghahanap kami ng mga malalaking sample, dahil ito ay isang kaso ng Eleksyon. Sa kabilang banda, kung ang pagtatasa ay ginagawa sa Pangangalaga sa Kalusugan, mahirap pumunta para sa isang malaking populasyon dahil may posibilidad na hindi makakuha ng sapat na mga tao upang mapatunayan ang teorya. Gayundin, ang kalidad ng data ay napakahalaga.
  2. I-extract ang Data - Halimbawa, kung kukuha kami ng isang sample ng populasyon, maaari naming tingnan ang mga katangian, tulad ng mataas na kita, mababang kita, edad, nagtatrabaho populasyon (offsite / onsite), mga residente, NRI, saklaw ng mga ospital, atbp, upang simulan ang pag-aaral . Dito, maaaring hindi natin kailangan ng maraming mga katangian para sa teorya. Nauunawaan namin na ang mga katangiang, tulad ng mataas at mababang kita ay maaaring hindi ang nag-aambag ng mga kadahilanan sa pagtukoy kung sino ang mananalo sa halalan. Ngunit ang edad ay maaaring gumawa ng isang pagkakaiba dahil magbibigay ito ng isang direktang bilang ng kung gaano karaming mga tao ang magboboto. Maraming beses na maaari naming ibukod ang mga hindi gaanong ginagamit na mga katangian o magsama ng mga katangian na kapaki-pakinabang. Maaari itong magkamali sa parehong kaso. Iyon ang dahilan kung bakit hamon ang analytics.
  3. Masahe ang Data upang magkasya sa Tool - Ito ay dahil hindi lahat ng mga tool ay maaaring tanggapin ang lahat ng data. Ang ilang mga tool ay tumatanggap lamang ng data ng CSV o excel data. Ang kakulangan ng mga tool ay isang hamon.
  4. Patakbuhin ang Pagsusuri - Ang operasyon na ito ay maaaring isagawa gamit ang maraming mga diskarte ng analytics.
  5. Gumawa ng Mga Konklusyon - Ang pagsusuri ay nagbibigay ng mga numero upang maging tumpak. Ngunit nasa sa isang gumagamit na kumuha ng mga konklusyon mula sa mga numerong ito. Halimbawa, kung sinasabi nito na 10% o 20%, dapat nating maunawaan kung ano ang kahulugan nito? Nakakakuha ba ito ng ugnayan sa pagitan ng Katangian A at Katangian B?
  6. Ipatupad ang Mga Resulta - Mahalagang ipatupad ang mga konklusyon upang makita ang mga resulta sa negosyo. Halimbawa, maaari itong mapagpasyahan na 'Ang mga tao ay bumili ng payong sa tag-ulan' na maaaring magresulta sa mas maraming negosyo. Dito, kailangan naming ipatupad ang konklusyon kung saan gumawa kami ng payong, na magagamit sa mga tindahan, ngunit pagkatapos ay maaari itong magkaroon ng mga problema sa pamamahala. Nagbibigay ng resulta ang mga istatistika ng sandali, maaaring maging mali ang pagpapatupad.
  7. Subaybayan ang Pagsulong - Ang huling hakbang dito, ang pagsubaybay ay may mahalagang papel. Maaaring magkamali ang pagsubaybay sapagkat hindi gaanong mga organisasyon ang nais na subaybayan ang pag-usad, at ito ay itinuturing na isang napapabayaang hakbang. Ngunit ang pagsubaybay ay mahalaga dahil maunawaan natin kung ang aming pagsasaliksik at konklusyon ay patungo sa tamang direksyon.

Suriin din ang artikulong ito' Ang ugnayan ay hindi nangangahulugang Causation 'na nagbibigay ng isang pananaw sa kung paano maaaring magkamali ang mga analista. Ang isang mahalagang puntong dapat tandaan sa tsart na ito ay ang Running Analysis ay ang tanging hakbang kung saan mananagot ang makina at higit pa sa hanggang sa isang tao na sa huli ay matutukoy kung paano ginagawa ang pananaliksik.

May tanong ba sa amin? Nabanggit ang mga ito sa seksyon ng mga komento at babalikan ka namin.



Mga Kaugnay na Post: