Ano ang Bias-Variance Sa Pag-aaral ng Makina?



Saklaw ng artikulong ito ang konsepto ng bias at pagkakaiba-iba sa pag-aaral ng makina na may isang ugnayan sa pagitan nila na tinutukoy ang mahuhulaan na katumpakan ng modelo.

Sa , ang pagganap ng isang modelo ay batay sa mga hula nito at kung gaano ito kabuo patungo sa hindi nakikita, malayang data. Ang isang paraan upang masukat ang katumpakan ng isang modelo ay sa pamamagitan ng pagpapanatili ng account ng bias at pagkakaiba-iba sa modelo. Sa artikulong ito, malalaman natin kung paano gumaganap ng mahalagang papel ang bias-variance sa pagtukoy ng pagiging tunay ng modelo. Ang mga sumusunod na paksa ay tinalakay sa artikulong ito:

Hindi Mabilis na Error

Anumang modelo sa ay tinatasa batay sa error sa hula sa isang bagong independiyente, hindi nakikitang hanay ng data. Ang error ay walang anuman kundi ang pagkakaiba sa pagitan ng aktwal na output at ang hinulaang output. Upang makalkula ang error, ginagawa namin ang pagbubuod ng hindi maaaring mabawasan at hindi maibawas na error a.k.a bias-variance decomposition.





Ang hindi maibabalik na error ay walang anuman kundi ang mga error na hindi mabawasan kahit anuman ang na ginagamit mo sa modelo. Ito ay sanhi ng hindi pangkaraniwang mga variable na may direktang impluwensya sa variable ng output. Kaya upang gawing mahusay ang iyong modelo, kami ay naiwan sa nababago na error na kailangan namin upang i-optimize sa lahat ng mga gastos.

Ang isang maaaring mabawasan na error ay may dalawang bahagi - Bias at Pagkakaiba-iba , pagkakaroon ng bias at pagkakaiba-iba naiimpluwensyahan ang katumpakan ng modelo sa maraming paraan tulad ng overfitting, underfitting , atbp.Tingnan natin ang bias at pagkakaiba-iba upang maunawaan kung paano haharapin ang maaaring mabawasan na error sa .



Ano ang Bias Sa Pag-aaral ng Makina?

Ang bias ay karaniwang kung gaano namin nahula ang halaga mula sa aktwal na halaga. Sinasabi namin na ang bias ay masyadong mataas kung ang average na mga hula ay malayo sa mga aktwal na halaga.

para saan ang ginagamit sa sas programming

Ang isang mataas na bias ay magiging sanhi ng algorithm na makaligtaan ang isang nangingibabaw na pattern o ugnayan sa pagitan ng mga variable ng pag-input at output. Kapag ang bias ay masyadong mataas, ipinapalagay na ang modelo ay medyo simple at hindi maunawaan ang pagiging kumplikado ng hanay ng data upang matukoy ang ugnayan at sa gayon,na nagiging sanhi ng underfitting.

Pagkakaiba-iba sa Isang Modelong Pag-aaral ng Makina?

Sa isang independyente, hindi nakikitang hanay ng data o isang hanay ng pagpapatunay. Kapag ang isang modelo ay hindi gumanap tulad ng ginagawa nito sa bihasang hanay ng data, mayroong posibilidad na ang modelo ay may pagkakaiba-iba. Karaniwang sinasabi nito kung gaano kalat ang mga hinulaang halaga mula sa aktwal na mga halaga.



Ang isang mataas na pagkakaiba-iba sa isang hanay ng data ay nangangahulugang ang modelo ay nagsanay na may maraming ingay at hindi kaugnay na data. Kaya't nagdudulot ng overfitting sa modelo. Kapag ang isang modelo ay may mataas na pagkakaiba-iba, ito ay nagiging napaka-kakayahang umangkop at gumagawa ng maling paghula para sa mga bagong puntos ng data. Sapagkat naayos na ang sarili sa mga punto ng data ng hanay ng pagsasanay.

Subukan din nating maunawaan ang konsepto ng bias-variance sa matematika. Hayaan ang variable na hinuhulaan natin na maging Y at ang iba pang mga independiyenteng variable na maging X. Ngayon ay ipalagay natin na mayroong isang ugnayan sa pagitan ng dalawang mga variable na tulad ng:

Y = f (X) + e

Sa equation sa itaas, Narito ay ay ang tinantyang error na may isang average na halaga 0. Kapag gumawa kami ng isang classifier gamit ang mga algorithm tulad linear regression , , atbp, ang inaasahang parisukat na error sa puntong x ay magiging:

err (x) = Bias2+ Pagkakaiba-iba + hindi mababago error

Unawain din natin kung paano makakaapekto ang Bias-Variance a Pag-aaral ng Makina pagganap ng modelo.

Paano Ito Makakaapekto sa Modelong Pag-aaral ng Makina?

Maaari nating mailagay ang ugnayan sa pagitan ng bias-pagkakaiba sa apat na kategorya na nakalista sa ibaba:

  1. Mataas na Pagkakaiba-iba ng Mataas na Bias - Ang modelo ay hindi naaayon at hindi tumpak din sa average
  2. Mababang Pagkakaiba-iba ng Mga bias - Ang mga modelo ay pare-pareho ngunit mababa sa average
  3. Mataas na Pagkakaiba-ibang-Mababang Bias - Medyo tumpak ngunit hindi naaayon sa mga average
  4. Mababang Pagkakaiba-ibang-Mababang Bias - Ito ay ang perpektong senaryo, ang modelo ay pare-pareho at tumpak sa average.

bias-variance sa machine learning-edureka

Kahit na ang pagtuklas ng bias at pagkakaiba-iba sa isang modelo ay maliwanag. Ang isang modelo na may mataas na pagkakaiba ay magkakaroon ng mababang error sa pagsasanay at error sa mataas na pagpapatunay. At sa kaso ng mataas na bias, ang modelo ay magkakaroon ng mataas na error sa pagsasanay at ang error sa pagpapatunay ay kapareho ng error sa pagsasanay.

Habang ang pagtuklas ay tila madali, ang totoong gawain ay upang bawasan ito sa minimum. Sa kasong iyon, magagawa natin ang mga sumusunod:

  • Magdagdag ng higit pang mga tampok sa pag-input
  • Mas kumplikado sa pamamagitan ng pagpapakilala ng mga tampok na polynomial
  • Bawasan ang termino ng regularisasyon
  • Pagkuha ng mas maraming data sa pagsasanay

Ngayong alam na natin kung ano ang bias at pagkakaiba-iba at kung paano ito nakakaapekto sa aming modelo, tingnan natin ang isang bias-variance trade-off.

Bias-Variance Trade-Off

Ang paghahanap ng tamang balanse sa pagitan ng bias at pagkakaiba-iba ng modelo ay tinatawag na trade trade na Bias-Variance. Karaniwan ito ay isang paraan upang matiyak na ang modelo ay hindi overfitted o underfitted sa anumang kaso.

Kung ang modelo ay masyadong simple at may napakakaunting mga parameter, magdurusa ito mula sa mataas na bias at mababang pagkakaiba-iba. Sa kabilang banda, kung ang modelo ay may maraming bilang ng mga parameter, magkakaroon ito ng mataas na pagkakaiba-iba at mababang bias. Ang trade-off na ito ay dapat magresulta sa isang perpektong balanseng ugnayan sa pagitan ng dalawa. Sa isip, mababang bias at mababang pagkakaiba-iba ang target para sa anumang modelo ng Pag-aaral ng Machine.

Kabuuang Error

Sa anumang modelo ng Pag-aaral ng Machine, ang isang mahusay na balanse sa pagitan ng bias at pagkakaiba-iba ay nagsisilbing isang perpektong senaryo sa mga tuntunin ng panghuhula na kawastuhan at pag-iwas sa overfitting, kabuuan na underfitting. Ang isang pinakamainam na balanse sa pagitan ng bias at pagkakaiba-iba, sa mga tuntunin ng pagiging kumplikado ng algorithm, ay titiyakin na ang modelo ay hindi kailanman overfitted o underfitted sa lahat.

Ang ibig sabihin ng parisukat na error sa isang modelo ng istatistika ay isinasaalang-alang bilang kabuuan ng square na bias at pagkakaiba-iba at pagkakaiba-iba ng error. Ang lahat ng ito ay maaaring ilagay sa loob ng isang kabuuang error kung saan mayroon kaming bias, pagkakaiba-iba at hindi maibabalik na error sa isang modelo.

Ipaunawa sa amin kung paano namin mabawasan ang kabuuang error sa tulong ng isang praktikal na pagpapatupad.

Nilikha namin ang isang linear na pag-uuri ng pag-urong nasa Linear Regression sa Pag-aaral ng Machine artikulo sa Edureka gamit ang data ng diabetes na itinakda sa mga module ng datasets ng scikit matuto silid aklatan.

Kapag sinuri namin ang ibig sabihin ng parisukat na error ng classifier, nakakuha kami ng isang kabuuang error sa paligid ng 2500.

Upang mabawasan ang kabuuang error, nagbigay kami ng mas maraming data sa classifier at bilang gantimpala ang ibig sabihin ng parisukat na error ay nabawasan hanggang 2000.

Ito ay isang simpleng pagpapatupad ng pagbawas ng kabuuang error sa pamamagitan ng pagpapakain ng mas maraming data ng pagsasanay sa modelo. Katulad nito maaari naming ilapat ang iba pang mga diskarte upang mabawasan ang error at mapanatili ang isang balanse sa pagitan ng bias at pagkakaiba-iba para sa isang mahusay na modelo ng Pag-aaral ng Machine.

Dinadala tayo nito sa pagtatapos ng artikulong ito kung saan natutunan ang Bias-Variance sa Machine Pag-aaral kasama ang pagpapatupad at paggamit ng kaso. Inaasahan kong malinaw ka sa lahat ng naibahagi sa iyo sa tutorial na ito.

kung paano mag-install ng eclipse ide

Kung nahanap mo ang artikulong ito sa 'Bias-Variance In Machine Learning' na may kaugnayan, tingnan ang isang pinagkakatiwalaang kumpanya sa online na pag-aaral na may isang network ng higit sa 250,000 nasiyahan na mga nag-aaral na kumalat sa buong mundo.

Narito kami upang matulungan ka sa bawat hakbang sa iyong paglalakbay at magkaroon ng isang kurikulum na idinisenyo para sa mga mag-aaral at propesyonal na nais na maging . Ang kurso ay dinisenyo upang bigyan ka ng isang panimula sa Python program at sanayin ka para sa parehong core at advanced na mga konsepto ng Python kasama ang iba't ibang katulad , , atbp.

Kung mahahanap mo ang anumang mga katanungan, huwag mag-atubiling itanong ang lahat ng iyong mga katanungan sa seksyon ng mga komento ng 'Bias-Variance In Machine Learning' at ang aming koponan ay nalulugod na sagutin.