Ano ang Mga Kinakailangan Para sa Pag-aaral ng Makina?



Ang blog na ito sa mga kinakailangan para sa Pag-aaral ng Machine ay makakatulong sa iyo na maunawaan ang pangunahing mga konsepto na kailangan mong malaman bago ka magsimula sa Pag-aaral ng Machine.

Ang Pag-aaral ng Machine ay walang alinlangan na ang pinaka-in-demand na teknolohiya ng panahon! Kung ikaw ay isang nagsisimula na nagsisimula sa Pag-aaral ng Machine, mahalagang alam mo ang mga kinakailangan para sa Pag-aaral ng Machine. Tutulungan ka ng blog na ito na maunawaan ang iba't ibang mga konsepto na kailangan mong malaman bago ka magsimula sa Pag-aaral ng Machine.

Upang makakuha ng malalim na kaalaman sa Artipisyal na Katalinuhan at Pag-aaral ng Makina, maaari kang magpatala nang live ni Edureka na may suporta na 24/7 at habang-buhay na pag-access.





Narito ang isang listahan ng mga paksa saklaw sa blog na ito:

  1. Mga Pangangailangan para sa Pag-aaral ng Makina
  2. Pag-unawa sa Pag-aaral ng Machine sa isang kaso ng paggamit

Mga Pangangailangan Para sa Pag-aaral ng Makina

Upang makapagsimula saPag-aaral ng Machine dapat mong pamilyar sa mga sumusunod na konsepto:



  1. Mga Istatistika
  2. Linear Algebra
  3. Calculus
  4. Ang posibilidad
  5. Mga Wika sa Programming

Mga Istatistika

Naglalaman ang mga istatistika ng mga tool na maaaring magamit upang makakuha ng ilang kinalabasan mula sa data. Mayroong mapaglarawang istatistika na ginagamit upang ibahin ang anyo ng hilaw na data sa ilang mahalagang impormasyon. Gayundin, maaaring magamit ang mga mahihinuhang istatistika upang makakuha ng mahalagang impormasyon mula sa isang sample ng data sa halip na gumamit ng kumpletong dataset.

isang hanay ng mga bagay na java

Upang matuto nang higit pa tungkol sa Mga istatistika maaari kang dumaan sa mga sumusunod na blog:

Linear Algebra

Mga deal sa Linear algebramay mga vector, matrice, at linear transformation. Napakahalaga sa pag-aaral ng makina dahil maaari itong magamit upang mabago at maisagawa ang mga pagpapatakbo sa dataset.



Calculus

Ang Calculus ay isang mahalagang larangan sa matematika at gumaganap ito ng isang mahalagang papel sa maraming mga algorithm ng pag-aaral ng machine. Ang hanay ng data na mayroong maraming mga tampok ayginamit upang bumuo ng mga modelo ng pag-aaral ng machine bilang mga tampok ay maraming multivariable calculus ay gumaganap ng isang mahalagang papel upang bumuo ng isang modelo ng pag-aaral ng machine. Kinakailangan ang mga pagsasama at Pagkakaiba.

Ang posibilidad

Tumutulong ang posibilidad na mahulaan ang posibilidad ng mga pangyayari, Tinutulungan tayo nito na mangatuwiran na maaaring mangyari o hindi na mangyari muli ang sitwasyon. Para sa pag-aaral ng makina, ang posibilidad ay a pundasyon

Mathematics

Upang matuto nang higit pa tungkol sa Probability, maaari kang dumaan dito Blog.

Wika sa pagpoproseso

Mahalagang malaman ang mga wika sa pagprograma tulad ng R at Python upang maipatupad ang buong proseso ng Pag-aaral ng Machine. Ang Python at R ay parehong nagbibigay ng mga built-in na aklatan na ginagawang napakadaling ipatupad ang mga algorithm ng Pagkatuto ng Machine.

Bukod sa pagkakaroon ng pangunahing kaalaman sa pagprogram, mahalaga ding malaman mo kung paano kumuha, magproseso at pag-aralan ang data. Ito ang isa sa pinakamahalagang kasanayan na kinakailangan para sa Pag-aaral ng Makina.

Upang matuto nang higit pa tungkol sa programa mga wika para sa Pag-aaral ng Machine, maaari kang dumaan sa mga sumusunod na blog:

  1. Ang Pinakamahusay na Python Library Para sa Agham ng Data At Pag-aaral ng Makina

Kaso ng Paggamit ng Machine Learning

Ang pag-aaral ng machine ay tungkol sa paglikha ng isang algorithm na maaaring matuto mula sa data upang makagawa ng isang hula tulad ng kung anong mga uri ng mga bagay ang naroon sa larawan, o rekomendasyon engine, ang pinakamahusay na kumbinasyon ng mga gamot upang pagalingin ang ilang sakit o pag-filter ng spam.

Ang pag-aaral ng makina ay binuo sa mga kinakailangan sa matematika at kung alam mo kung bakit ginagamit ang matematika sa pag-aaral ng makina gagawin itong kasiya-siya. Kailangan mong malaman ang matematika sa likod ng mga pagpapaandar na iyong gagamitin at aling modelo ang angkop para sa data at bakit.

Kaya't magsimula tayo sa isang nakawiwiling problema sa paghula ng mga presyo ng bahay, pagkakaroon ng isang dataset na naglalaman ng isang kasaysayan ng iba't ibang mga tampok at presyo, sa ngayon, isasaalang-alang namin ang lugar ng salang puwang sa square square at mga presyo.

Ngayon mayroon kaming isang hanay ng data na naglalaman ng dalawang mga haligi tulad ng ipinakita sa ibaba:

Dapat mayroong ilang ugnayan sa pagitan ng dalawang variable na ito upang malaman na kakailanganin nating bumuo ng isang modelo na maaaring mahulaan ang presyo ng mga bahay, paano natin ito magagawa?

I-graph natin ang data na ito at tingnan kung paano ito hitsura:

Dito ang X-axis ay ang presyo bawat sqft ng espasyo sa sala at ang Y-axis ay ang presyo ng bahay. Kung binabalak namin ang lahat ng mga puntos ng data makakakuha kami ng isang nakakalat na balangkas na maaaring kinatawan ng isang linya tulad ng ipinakita sa pigura sa itaas at kung maglalagay kami ng ilang data ay mahuhulaan ang ilang kinalabasan. Sa isip, kailangan nating maghanap ng isang linya na mag-intersect ng maximum na mga puntos ng data.

Sinusubukan naming lumikha ng isang linya na tinawag bilang:

Y = mX + c

Ang pamamaraang ito ng paghula ng linear na ugnayan sa pagitan ng target (dependant variable) at variable ng prediktor (independiyenteng variable) ay tinatawag na linear regression. Pinapayagan kaming mag-aral at magbuod ng isang ugnayan sa pagitan ng dalawang variable.

  • X = Malayang variable
  • Y = Nakasalalay na variable
  • c = y-maharang
  • m = Slop ng linya

Kung isasaalang-alang namin ang equation na mayroon kaming mga halaga para sa X na kung saan ay isang independiyenteng variable, kaya ang dapat nating gawin ay kalkulahin ang mga halaga para sa m at c upang mahulaan ang halaga ng Y.

Kaya paano natin mahahanap ang mga variable na ito?

Upang makita ang mga variable na ito, maaari naming subukan ang isang grupo ng mga halaga at subukang malaman ang isang linya na intersect ang maximum na bilang ng mga puntos ng data. Ngunit, paano natin mahahanap ang pinakamahusay na linya na magkasya?

Kaya upang makahanap ng linya na pinakaangkop, maaari naming gamitin ang hindi bababa sa mga pag-andar ng error sa mga parisukat na mahahanap ang error sa pagitan ng totoong halaga ng y at ng hinulaang halaga y`.

Ang pinakamaliit na mga parisukat na pag-andar ng error ay maaaring kinatawan gamit ang sumusunod na equation:

Gamit ang pagpapaandar na ito maaari naming malaman ang error para sa bawat hinulaang data point sa pamamagitan ng paghahambing nito sa aktwal na halaga ng data point. Pagkatapos ay kukunin mo ang buod ng lahat ng mga error na ito at parisukat ang mga ito upang malaman ang paglihis sa hula.

Kung idaragdag namin ang pangatlong axis sa aming grap na naglalaman ng lahat ng mga posibleng halaga ng error at isalin ito sa 3-Dimensional space, ganito ang magiging hitsura nito:

Sa imahe sa itaas, ang mga perpektong halaga ay nasa ilalim ng itim na bahagi na mahuhulaan ang mga presyo na malapit sa aktwal na data point. Ang susunod na hakbang ay upang mahanap ang pinakamahusay na posibleng mga halaga para sa m at c. Maaari itong magawa sa pamamagitan ng paggamit ng diskarte sa pag-optimize na tinatawag na gradient na pinagmulan.

Ang gradient na pinagmulan ay isang umuulit na pamamaraan, kung saan nagsisimula kami sa pagsisimula ng ilang hanay ng mga halaga para sa aming mga variable at dahan-dahang pagbutihin ang mga ito sa pamamagitan ng pagliit ng error sa pagitan ng aktwal na halaga at ng hinulaang halaga.

Ngayon kung sa tingin namin praktikal ang mga presyo ng apartment ay hindi talaga nakasalalay lamang sa presyo bawat square square, maraming mga kadahilanan tulad ng bilang ng mga silid-tulugan, banyo, atbp. Kung isasaalang-alang din namin ang mga tampok na iyon pagkatapos ay ang equation ay magmumukhang isang bagay ganito

Y = b0 + b1x1 + b2x2 + & hellip .. + bnxn + c

Ito ang multilinear regression na ito ay kabilang sa linear algebra, dito maaari naming gamitin ang mga matrice na laki ng mxn kung saan ang mga tampok ay at mga puntos ng data.

Isaalang-alang natin ang isa pang sitwasyon kung saan maaari nating gamitin ang posibilidad na makita ang kalagayan ng bahay upang maiuri ang isang bahay batay sa kung ito ay nasa mabuting kalagayan o masamang kalagayan. Para sa mga ito, upang gumana kakailanganin naming gumamit ng isang diskarteng tinatawag na Logistic Regression na gumagana sa posibilidad ng mga pangyayari na kinakatawan ng isang sigmoid function.

Sa artikulong ito, saklaw namin ang mga paunang kinakailangan ng pag-aaral ng makina at kung paano ito inilalapat sa pagkatuto ng makina. Kaya karaniwang, binubuo ito ng mga istatistika, calculus, linear algebra, at posibilidad na teorya. Ang Calculus ay may mga diskarteng ginamit para sa pag-optimize, ang linear algebra ay may mga algorithm na maaaring gumana sa malaking mga hanay ng data, na may posibilidad na mahulaan natin ang posibilidad ng mga pangyayari at ang mga istatistika ay makakatulong sa amin na mahihinuha ang mga kapaki-pakinabang na pananaw mula sa sample ng mga hanay ng data.

Ngayong alam mo na ang Mga Kinakailangan para sa Pag-aaral ng Makina, sigurado akong interesado kang malaman ang higit pa. Narito ang ilang mga blog na makakatulong sa iyong makapagsimula sa Data Science:

Kung nais mong magpatala para sa isang kumpletong kurso sa Artipisyal na Katalinuhan at Pag-aaral ng Makina, ang Edureka ay may espesyal na na-curate iyon ay magpapasikat sa iyo sa mga diskarteng tulad ng Pinangangasiwaang Pag-aaral, Hindi Pinapamahalaang Pag-aaral, at Pagproseso ng Likas na Wika. Kasama rito ang pagsasanay sa pinakabagong mga pagsulong at panteknikal na diskarte sa Artipisyal na Pag-intelektuwal at Pag-aaral ng Makina tulad ng Deep Learning, Mga Modelong Grapiko at Pag-aaral ng Patatag.