Mga Diskarte sa Pagmomodelo sa Business Analytics na may R



Nagbibigay ang blog ng isang maikling pagpapakilala ng Mga Diskarte sa Pagmomodelo sa Business Analytics kasama ang R.

Iba't ibang Mga Diskarte sa Pagmomodelo:

Maaari nating hatiin ang anumang problema sa mas maliliit na proseso:





Pag-uuri - ay, kung saan inuri natin ang data. Hal. ang mga sakit sa lahat ng mga sakit ay nagpapakita ng ilang pag-uugali, at maaari pa nating maiuri ito.

Halimbawa: mga sakit na nagbabawas ng kaligtasan sa sakit, mga sakit na nagbibigay ng sakit ng ulo, atbp.



Pag-urong - nagsasangkot ng paghanap ng ugnayan sa pagitan ng maraming mga variable.

Halimbawa: kung paano nauugnay ang timbang ng isang tao sa kanyang taas.

AnomolyPagtuklas - Karaniwan ay isang pagbabagu-bago.



ano ang malaking data hadoop

Halimbawa: Sa kaso ng mataas na boltahe o mababang boltahe.

Ang isa pang halimbawa ay maaaring magsama ng kinokontrol na pag-uugali na nagsasangkot sa pagmamaneho sa kanang bahagi o kaliwang bahagi batay sa bansa. Ang anomoly dito ay isang taong nagmamaneho mula sa kabaligtaran.

Ang isa pang halimbawa ay maaaring panghimasok sa network. Dito, ang isang napatunayan na gumagamit ay nag-log in sa website ng iyong kumpanya, at pagkatapos kung ang isang tao na hindi na nagpapatunay na nag-log in, ito ay isangAn0moly.

Kahalagahan ng Katangian - Karaniwan itong nagbibigay ng maraming mga katangian, tulad ng taas, timbang, temperatura, tibok ng puso. Ang isang puntong dapat tandaan ay ang lahat ng mga katangiang ito ay mahalaga para sa isang gawain.

Halimbawa: Sinusubukan ng isang tao na hulaan, sa anong oras makakarating ang isang tao sa opisina. Ang bawat katangian ay gumaganap ng mahalagang papel ngunit hindi lahat ng mga katangian ay mahalaga.

Mga Panuntunan sa Asosasyon - Sa mas simpleng mga termino, ito ay upang pag-aralan o hulaan ang susunod na pag-uugali, kung saan umiikot ito sa engine ng rekomendasyon.

Halimbawa: Ang isang taong bibili ng tinapay ay maaari ding bumili ng gatas. Kung susuriin namin ang nakaraang mga pag-uugali sa pamimili, lahat ng mga item sa basket ay may kaugnayan. Sa kasong ito, maaaring may posibilidad na ang taong bibili ng tinapay ay bibili din ng gatas.

Pag-cluster - Ito ay isa sa pinakalumang diskarte sa istatistika. Sa katunayan, palaging maaaring mag-modelo ang anumang problema, maging ang pag-uuri o pag-cluster, na nangangahulugang pagpapangkat ng mga katulad na nilalang.

Halimbawa:

1) Kumuha ng isang basket ng mansanas at dalandan, kung saan maaari naming ihiwalay ang mga mansanas mula sa mga dalandan.

2) Ang isang mahalagang kaso ng paggamit para sa clustering ay pangangalaga ng kalusugan. Halos lahat ng mga istatistika at pagsusuri ay nagsimula sa paggamit ng mga kaso ng pangangalagang pangkalusugan. Upang lumalim nang mas malalim, mayroong isang term ng clustering na tinatawag na cohorts (mga taong may magkatulad na sakit), upang mapag-aralan silang hiwalay mula sa mga mayroon nang mga customer. Halimbawa, kung 10 tao ang naghihirap mula sa lagnat at isa pang 10 katao mula sa sakit ng ulo, mahahanap namin kung ano ang karaniwan sa pagitan nila at bumuo ng gamot.

Tampok na Pagkuha - Sa katumpakan ng pagkuha ng tampok, ang bisa at pagkabigo ay lubos na nauugnay. Sa madaling salita, ang pagkuha ng tampok ay maaaring tinatawag na pagkilala sa pattern.

Halimbawa:

Sa paghahanap sa Google, kapag nagpasok ang isang gumagamit ng isang term, nagmumula ito sa mga resulta. Ngayon, isang mahalagang tanong na tatanungin ay paano ito nalaman, aling pahina ang nauugnay at hindi nauugnay sa term? Masasagot ito sa pagkuha ng tampok at pagkilala sa pattern, kung saan nagdaragdag ito ng kilalang mga tampok. Sabihin nating sinabi na isang larawan ang ibinigay, ang ilang mga camera ay nakakakita ng mga mukha, i-highlight ang mukha upang magbigay ng magagandang imahe, na gumagamit din ng pagkilala sa tampok.

Pinangangasiwaang Pag-aaral kumpara sa Hindi suportadong Pag-aaral

sa) Kategoryang Prediksiyon - Kasama sa mga diskarte ang pagbabalik, logistic, neural network at mga puno ng pagpapasya. Ang ilang mga halimbawa ay may kasamang pagtuklas ng pandaraya (kung saan natututo at hinuhulaan ng isang computer ang susunod na pandaraya mula sa nakaraang kasaysayan ng pandaraya). Sa hindi suportadong pag-aaral, hindi maaaring mahulaan ang isang tao sa mga halimbawa dahil walang data sa kasaysayan.

b) Kategoryang Pag-uuri - Pagkuha ng isang halimbawa, kung ang transaksyon ay mapanlinlang o hindi, pumapasok ito sa kategorya ng pag-uuri. Dito, kumukuha kami ng makasaysayang data at inuri ito sa mga puno ng pagpapasya o kung hindi man lang kami kumukuha ng anumang makasaysayang data, pagkatapos ay direktang nagsisimula kami sa data at susubukan naming samantalahin ang mga tampok nang mag-isa. Halimbawa, kung kailangan nating malaman ang mga empleyado, sino ang malamang na umalis sa samahan o malamang na manatili. Kung sakali, ito ay isang bagong samahan, kung saan hindi kami maaaring gumamit ng makasaysayang data, maaari naming palaging gumamit ng clustering para sa pagkuha ng data.

c) Kategoryang Paggalugad - Ito ay isang tuwid na pasulong na pamamaraan, naisip, kung ano ang ibig sabihin ng malaking data. Sa hindi suportadong pag-aaral, tinatawag itong mga sangkap ng prinsipyo at pag-cluster.

d) Kategoryang Affinity - Dito maraming mga elemento ang kasangkot tulad ng cross-sell / up sell, pagsusuri sa basket ng merkado. Sa pagtatasa ng basket, walang pinangangasiwaang pag-aaral dahil walang data sa kasaysayan. Kaya direktang kumukuha kami ng data at makahanap ng mga asosasyon, pagsunud-sunod at pagtatasa ng kadahilanan.

May tanong ba sa amin? Nabanggit ang mga ito sa seksyon ng mga komento at babalikan ka namin.

Mga Kaugnay na Post: