SAS Programming - Alamin Kung Paano Mag-Code Sa SAS!



Ang blog na ito sa SAS Programming ay nagpapakilala sa iyo sa mga konsepto ng pagprograma ng SAS at tinutulungan kang maunawaan ang iba't ibang mga batayan ng SAS nang detalyado sa mga halimbawa.

Sa blog na ito, ipakikilala ko sa iyo ang ilan sa mahahalagang konsepto ng pagprogram ng SAS. Bago kami magsimula, mahalaga na pamilyar ka sa SAS. Ang dati kong blog sa SAS Tutorial tutulong sa iyo na maunawaan ang SAS, ang mga application nito at tutulong sa iyo na mai-install ang SAS University Edition, na gagamitin namin dito bilang isang kapaligiran sa pagprograma. Inaasahan kung ano ang mga kasanayan, dapat mong makabisado sa taong ito? Gayundin, kung nagpaplano kang umakyat sa Data Analytics, ay isa sa mga pinakamahusay na paraan upang makapagsimula sa pareho.

Ang Edureka 2019 Tech Career Guide ay wala na! Mga pinakamainit na tungkulin sa trabaho, tumpak na mga landas sa pag-aaral, pananaw sa industriya at higit pa sa gabay. Mag-download ngayon





Kaya't nang walang karagdagangantala,magsimula tayo sa pagprograma ng SAS, hindi ba?

Tutulungan ka ng blog na ito na maunawaan ang mga sumusunod na paksa:



Bago kami magsimula sa pag-coding, nais kong ibigay sa iyo ang ilang mahahalagang termino na mahalaga para sa SAS na programa.

Mga Batayan ng SAS Programming

SAS Windows

Mas gusto ng mga malalaking organisasyon at instituto ng pagsasanay ang paggamit ng SAS Windows. Ang SAS Windows ay may maraming mga kagamitan na makakatulong na mabawasan ang oras na kinakailangan upang magsulat ng mga code.

Ipinapakita ng sumusunod na imahe ang iba't ibang bahagi ng SAS Windows.



SAS-Windows - SAS Programming - Edureka

  • Window ng Log : Ito ay isang window ng pagpapatupad. Dito, maaari mong suriin ang pagpapatupad ng iyong programa. Nagpapakita rin ito ng mga pagkakamali, babala at tala.
  • Window Window :Ang window na ito ay kilala rin bilang window ng editor. Isaalang-alang ito bilang isang blangko na papel o isang notepad, kung saan maaari mong isulat ang iyong SAS code.
  • Output Window : Tulad ng iminungkahi ng pangalan, ipinapakita ng window na ito ang output ng programa / code na isinulat mo sa editor.
  • Resulta Window : Ito ay isang indeks na naglilista ng lahat ng mga output ng mga programa na pinapatakbo sa isang sesyon. Dahil humahawak ito ng mga resulta ng isang partikular na sesyon, kung isasara mo ang software at i-restart ito, ang window ng resulta ay walang laman.
  • Galugarin ang Window : Hawak nito ang listahan ng lahat ng mga aklatan sa system. Maaari mo ring i-browse ang mga sinusuportahang file ng system dito.

Ang ilang mga organisasyon ay gumagamit ng Linux, gayunpaman, nang walang graphic na interface ng gumagamit kailangan mong magsulat ng code para sa bawat query. Samakatuwid ito ay hindi maginhawa upang gamitin.

Mga Set ng Data ng SAS

Ang mga hanay ng data ng SAS ay tinatawag bilang mga file ng data. Ang mga file ng data ay binubuo ng mga hilera at haligi. Humahawak ang mga pagmamasid ng mga pagmamasid at hinahawakan ng mga haligiMga variable na pangalan.

Mga Variable ng SAS

Ang SAS ay may dalawang uri ng mga variable:

  • Mga variable ng numero : Ito ang default na uri ng variable. Ang mga variable na ito ay ginagamit sa mga expression ng matematika.
  • Mga variable ng character :Ginagamit ang mga variable ng character para sa mga halagang hindi ginagamit sa pagpapahayag ng matematika.
    Ginagamot ang mga ito bilang teksto o mga string. Ang isang variable ay nagiging variable ng character sa pamamagitan ng pagdaragdag ng a‘$’ Signsa dulo ng variable na pangalan.

Mga Aklatan ng SAS

Ang SAS library ay isang koleksyon ng mga SAS file na nakaimbak sa parehong folder o direktoryo sa iyong computer.

  • Pansamantalang Library : Sa library na ito, tatanggalin ang hanay ng data kapag natapos ang sesyon ng SAS.
  • Permanenteng Aklatan : Ang mga hanay ng data ay permanenteng nai-save. Samakatuwid, magagamit ang mga ito sa mga session.

Ang mga gumagamit ay maaari ring lumikha o tukuyin ang isang bagong library na kilala bilang mga library na tinukoy ng gumagamit sa pamamagitan ng paggamit ng keyword LIBNAME . Mga permanenteng aklatan din ito.

Programming ng SAS: Istraktura ng SAS Code

Ang programa ng SAS ay batay sa dalawang mga bloke ng gusali:

  • DATA Hakbang : Ang hakbang ng DATA ay lumilikha ng isang hanay ng data ng SAS at pagkatapos ay ipinapasa ang data sa isang hakbang na PROC
  • Hakbang ng PROC : Pinoproseso ng hakbang na PROC ang data

Ang isang programa ng SAS ay dapat sundin ang mga nabanggit na panuntunan sa ibaba:

  • Halos bawat code ay magsisimula sa alinman sa DATA o isang Hakbang ng PROC
  • Ang bawat linya ng SAS code ay nagtatapos sa isang semi colon
  • Ang isang SAS code ay nagtatapos sa RUN o QUIT keyword
  • Ang mga code ng SAS ay hindi sensitibo sa kaso
  • Maaari kang magsulat ng isang code sa iba't ibang mga linya o maaari kang sumulat ng maraming mga pahayag sa isang linya

Ngayon na nakakita kami ng ilang pangunahing mga terminolohiya, magsimula tayo sa pag-program ng SAS gamit ang pangunahing code na ito:

DATA Empleyado_Info input Emp_ID Emp_Name $ Emp_Vertical $ datalines 101 Mak SQL 102 Rama SAS 103 Priya Java 104 Karthik Excel 105 Mandeep SAS Run

Sa code sa itaas, lumikha kami ng isang hanay ng data na tinawag bilang Empleyado_Info. Mayroon itong tatlong variable, isang variable ng bilang bilang Emp_Id at dalawang variable ng character bilang Emp_Name at Emp_Verticals. Ipinapakita ng command na Run ang set ng data sa Output Window.

Ipinapakita ng imahe sa ibaba ang output ng nabanggit na code sa itaas.

Ipagpalagay na nais mong makita ang resulta sa pag-print view, mahusay na magagawa mo ito sa pamamagitan ng paggamit ng isang PROC PRINT na pamamaraan, ang natitirang code ay mananatiling pareho.

DATA Empleyado_Info input Emp_ID Emp_Name $ Emp_Vertical $ datalines 101 Mak SQL 102 Rama SAS 103 Priya Java 104 Karthik Excel 105 Mandeep SAS Run PROC PRINT DATA = Empleyado_Info Patakbuhin

Ang imahe sa ibaba, ay nagpapakita ng output ng code sa itaas.

Lumikha lang kami ng isang hanay ng data at naunawaan kung paano gumagana ang pamamaraan ng PRINT. Ngayon, kunin natin ang hanay ng data sa itaas at gamitin ito para sa karagdagang programa. Sabihin nating nais nating idagdag ang Petsa ng empleyado ng pagsali sa hanay ng data. Kaya lumikha kami ng isang variable na tinawag bilang DOJ, bigyan ito bilang input at i-print ang resulta.

DATA Empleyado_Info input Emp_ID Emp_Name $ Emp_Vertical $ DOJ datalines 101 Mak SQL 18/08/2013 102 Rama SAS 25/06/2015 103 Priya Java 21/02/2010 104 Karthik Excel 19/05/2007 105 Mandeep SAS 11/09/2016 Patakbuhin ang PROC PRINT DATA = empleyado_Info Run

Ipinapakita ng imahe sa ibaba ang output ng code sa itaas. Nakikita na ang isang variable ay nilikha, ngunit ang halaga ng DOJ ay hindi nakalimbag. Sa halip, nakikita naming pinalitan ng mga tuldok ang mga halaga ng petsa.


Bakit nangyari ito? Sa gayon, ang variable ng DOJ ay walang isang panlapi na '$', ibig sabihin, bilang default na babasahin ito ng SAS bilang isang variable na bilang. Ngunit, ang data na inilagay namin ay may isang espesyal na character na '/', samakatuwid hindi ito nai-print ang resulta dahil hindi ito purong data na bilang. Kung susuriin mo ang window ng log makikita mo ang isang mensahe ng error bilang 'hindi wastong data para sa variable DOJ'

Ngayon paano natin malulutas ang problemang ito? Sa gayon, ang isang paraan upang malutas ito ay sa pamamagitan ng paggamit ng isang panlapi na '$' para sa variable ng DOJ. I-convert nito ang variable ng DOJ sa character at magagawa mong i-print ang mga halaga ng petsa. Gawin natin ang mga pagbabago sa code at tingnan ang output.

DATA Empleyado_Info input Emp_ID Emp_Name $ Emp_Vertical $ DOJ $ datalines 101 Mak SQL 18/08/2013 102 Rama SAS 25/06/2015 103 Priya Java 21/02/2010 104 Karthik Excel 19/05/2007 105 Mandeep SAS 11/09 / 2016 Patakbuhin ang PROC PRINT DATA = empleyado_Info Run

Ipapakita ng screen ng output ang sumusunod na output.


Maaari mong makita na ang mga halaga ng data ay ipinapakita bilang mga petsa sa pamamagitan ng pag-convert ng DOJ sa character. Gayunpaman, ito ay isang pansamantalang solusyon. Hayaan mong ipaliwanag ko ito kung paano?

Sa gayon, isipin na ang isang bangko ay may isang katulad na hanay ng data. Ang hanay ng data ay may mga detalye ng may-ari ng account tulad ng halaga ng utang, mga installment,attakdang petsa para sa pag-install ng utang. Isipin, hindi nakuha ng may-ari ang kanyang deadline upang magbayad ng isang installment at nais ng bangko na kalkulahin ang pagkaantala. Kailangang kalkulahin ng bangko ang pagkakaiba sa pagitan ng petsa ng deadline at ng kasalukuyang petsa.

i-convert ang doble sa integer java

Ngunit, kung ang hanay ng data ng bangko ay may mga petsa sa format ng character, kung gayon hindi magagawa ng bangko ang mga pagpapatakbo ng matematika dito. Ang isyu na ito ay maaaring makaapekto sa aming hanay ng data din. Kaya paano natin malulutas ang problemang ito?

Ang susunod na konsepto ay makakatulong sa iyo na mapagtagumpayan ang isyung ito.

Mga Informat At Format sa SAS

Mahalagang maunawaan mo nang mabuti ang paksang ito kung nais mong maging mahusay sa programa ng SAS.Kung maaalala mo, nabanggit ko nang mas maaga na ang SAS ay may dalawang karaniwang mga variable na uri:

  • Numero
  • Tauhan

Kapag ang SAS ay dumating sa mga hindi karaniwang variable, ang SAS ay magtatapon ng isang error o hindi mo makuha ang nais na output. Upang mapagtagumpayan ang problemang ito, gumagamit ang SASIpinaalamat Mga Format.

Alamin ang higit pa

Karaniwang ginagamit ang mga informat upang mabasa o mai-input ang data mula sa mga panlabas na file o flat file (tulad ngmga file ng teksto o sunud-sunod na mga file). Inuutusan ng informat ang SAS kung paano magbasadata sa variable ng SAS. Ang SAS ay may tatlong uri ng Informats:tauhan, bilang, at petsa / oras. Ang mga informat ay pinangalanan ayon sa mga sumusunodistraktura ng syntax:

  • Informat ng Character: $ INFORMATw.
  • Ipinaalam sa Numeric: INFORMATw.d
  • Ipinaalam ang Petsa / Oras: INFORMATw.

Ang '$' ay nagpapahiwatig ng isang character informat. Ang INFORMAT ay tumutukoy sa kung minsan ay opsyonalPangalan ng informasyong SAS. Isinasaad ng 'w' ang lapad (bytes o bilang ng mga haligi) ngvariable. Ginamit ang 'd' para sa numerong data upang tukuyin ang bilang ng mga digit sa kanan ngang decimal place. Ang lahat ng mga informat ay dapat maglaman ng isang decimal point (.) Upang magawa ng SAS
iiba ang isang informat mula sa isang variable ng SAS.

Bumalik tayo sa ating dating code at tingnan kung makakatulong sa atin ang Petsa / Oras na Informat. Kaya't baguhin natin ang code nang naaayon at magdagdag ng isang Petsa ng Informat dito tulad ng sumusunod:

DATA Empleyado_Info input Emp_ID Emp_Name $ Emp_Vertical $ DOJ INFORMAT DOJ ddmmyy10. datalines 101 Mak SQL 18/08/2013 102 Rama SAS 25/06/2015 103 Priya Java 21/02/2010 104 Karthik Excel 19/05/2007 105 Mandeep SAS 11/09/2016 Run PROC PRINT DATA = Empleyado_Info Run

Ang linya numero 3 sa code ay nagtuturo sa SAS na basahin ang variable na 'petsa ng pagsali' (DOJ) gamit ang petsa
ipabatid sa MMDDYYw. Para sa bawat larangan ng petsa ay sumasakop ng 10 puwang, ang kwalipikadong ‘w.’ Ayitakda sa 10

Ang output ng code ay magiging katulad ng mga sumusunod.

Ipinapakita ng resulta na wala pa rin kaming nais na resulta, sa halip ang haligi ng DOJ ay may hawak na ilang mga halagang bilang at hindi ang mga petsa na tinukoy namin. Ngayon, bakit ganun? Sa gayon, sa sandaling mabasa ang isang petsa kasama ang isang informat ng petsa, iniimbak ng SAS ang petsa bilang isang numero. Ibig sabihin, nabasa ito bilang ang bilang ng mga araw sa pagitan ng petsa at Enero 1, 1960 (Halimbawa: 3/15/1994 ay nakaimbak bilang 12492).

Ang dahilan sa likod nito ay ang SAS ay may tatlong magkakahiwalay na counter na sumusubaybay sa mga petsa at oras. Ang mga counter ng petsa na ito ay nagsimula sa zero noong Enero 1, 1960. Samakatuwid ang mga petsa bago ang 1/1/1960 ay may mga negatibong halaga, at anumang petsa pagkatapos ay may positibong halaga. Araw-araw sa hatinggabi, ang counter ng petsa ay nadagdagan ng isa.

Sinabi sa isang kwento na ang mga nagtatag ng SAS ay nais na gamitin ang tinatayang petsa ng kapanganakan ng system ng IBM 370, at pinili nila ang Enero 1, 1960 bilang isang madaling maalala na approximation.

Ngayong alam mo na ang dahilan kung bakit ipinakita ng haligi na DOJ ang mga numerong iyon, subukan nating malutas ang problemang ito. Upang mapagtagumpayan ang problemang ito ginagamit namin ang Format.

Format

Ang Informats ay mga tagubilin para sa pagbabasa ng data, samantalang ang mga format ang mga tagubiling ginamit upang ipakita odata ng output.Ang pagtukoy ng isang format para sa isang variable ay kung paano mo sasabihin sa SAS na ipakita ang mga halaga sa variable. Ang mga format ay pinagsasama sa parehong tatlong klase bilang mga informat (character, numeric, at date-time) at palaging naglalaman ng isang tuldok.

Ang pangkalahatang anyo ng isang format na pahayag ay:

  • FORMAT variable-name na FORMAT-NAME.

Bumalik tayo sa aming code na mayroong dataset na Empleyado_Info upang makita kung maaari naming maipakita nang tama ang petsa gamit ang FORMAT command.

DATA Empleyado_Info input Emp_ID Emp_Name $ Emp_Vertical $ DOJ INFORMAT DOJ ddmmyy10. FORMAT DOJ ddmmyy10. datalines 101 Mak SQL 18/08/2013 102 Rama SAS 25/06/2015 103 Priya Java 21/02/2010 104 Karthik Excel 19/05/2007 105 Mandeep SAS 11/09/2016 Run PROC PRINT DATA = Empleyado_Info Run

Gumamit kami ng FORMAT utos sa linya na numero 4 sa itaas na code. Ang sumusunod na screen ng output ay magbibigay sa amin ng nais na output.

Matagumpay naming naipakita ang hanay ng data gamit ang Petsa format na utos. Inaasahan kong naiintindihan mo kung paano gamitin ang format at informat.Tayo ay magpatuloy sa aming SAS programming blog at tingnan ang isa pang mahalagang konsepto.

SAS Loops

Habang gumagawa ng pagprogram sa SAS, maaari kaming makaharap ng mga sitwasyon kung saan paulit-ulit na kailangan nating magpatupad ng abloke ng code ng maraming bilang ng beses. Hindi maginhawa upang isulat ang parehong hanay ng mga pahayag nang paulit-ulit. Dito nakukuha ang larawan ng mga loop. Sa SAS, ang pahayag ng Do ay ginagamit upang magpatupad ng mga loop. Kilala rin ito bilang Do Loop. Ipinapakita ng imahe sa ibaba angpangkalahatang anyo ng mga pahayag ng Do loop sa SAS.

Ang mga sumusunod ay ang mga uri ng DO loop sa SAS:

  • Index : Ang loop ay nagpapatuloy mula sa halaga ng pagsisimula hanggang sa stop na halaga ng variable ng index.
  • Habang : Ang loop ay nagpapatuloy hangga't ang Habang ang kalagayan ay naging mali.
  • Hanggang sa : Ang loop ay nagpapatuloy hanggang sa Hanggang sa ang kalagayan ay naging Totoo.

Loop ng index ng Do

Gumagamit kami ng variable ng index bilang isang halaga ng pagsisimula at paghinto para sa Loop ng index ng Do . Ang mga pahayag ng SAS ay paulit-ulit na naisakatuparan hanggang sa maabot ng variable ng indeks ang pangwakas na halaga.
Syntax:

Gawin indexvariable = initialvalue sa finalvalue SAS pahayag End

Tingnan natin ang sample code upang maunawaan ang Do Index Loop. Sa code sa ibaba, ang VAR ay ang variable ng index.

DATA SampleLoop SUM = 0 Gawin VAR = 1 hanggang 10 SUM = SUM + VAR END PROC PRINT DATA = SampleLoop Run

Kapag naisagawa mo ang code sa itaas, makukuha mo ang sumusunod na output.

Gawin Habang Loop

Ang Gawin habang ang loop ay gumagamit ng isang kalagayan habang NASA Isinasagawa ng Loop na ito ang bloke ng code kapag totoo ang kundisyon at patuloy itong isinasagawa, hanggang sa maging mali ang kundisyon. Kapag ang kondisyon ay naging hindi totoo, ang loop ay natapos na.

Syntax:

Gawin Habang (kundisyon) SAS pahayag Natapos

Ang pagsunod sa sample code ay makakatulong sa iyo na maunawaan ang DO WHILE loop.

DATA SampleLoop SUM = 0 VAR = 1 Gawin Habang (VAR<15) SUM = SUM + VAR VAR+1 END PROC PRINT DATA = SampleLoop Run 

Ang code sa itaas ay magbibigay sa iyo ng sumusunod na output.

Gawin Hanggang sa Loop

Gumagamit ang loop ng Do Hanggang sa isang Hanggang sa Ang kundisyon na ito. Isinasagawa ng Loop ang bloke ng code kapag ang kondisyon ay hindi totoo at patuloy na isinasagawa ito, hanggang sa maging totoo ang kundisyon. Kapag naging totoo ang kundisyon, natapos ang loop.

Syntax:

overloading ng pamamaraan at pamamaraang overriding sa java
Gawin Hanggang sa (kundisyon) SAS pahayag Natapos na

Tingnan natin ang sample na programa.

DATA SampleLoop SUM = 0 VAR = 1 Gawin Hanggang (VAR> 15) SUM = SUM + VAR VAR + 1 END PROC PRINT Run

Ang code ay may sumusunod na output.

Sa gayon natapos namin ang konsepto ng mga loop sa SAS program. Ang lahat ng mga paksang pinag-aralan hanggang ngayon ay napag-uusapan ang tungkol sa mga pangunahing kaalaman sa SAS na programa sa pangkalahatan.

Tingnan natin ngayon ang ilang mga pamamaraang pang-istatistika. Ang mga pamamaraang ito ay bubuo ng isang batayan para sa advanced mga pamamaraang analitikal.

Mag-subscribe sa aming youtube channel upang makakuha ng mga bagong update ..!

Pangunahing Mga Pamamaraan ng Istatistika Gamit ang SAS

KAHULUGAN NG PROC

Ang pamamaraang ito ay ginagamit upang makalkula ang ibig sabihin ng arithmetic at karaniwang paglihis. Para sa mga taong bago sa istatistika ay maaaring maging mahirap maintindihan ang mga katagang ito. Kaya bago namin simulan ang pag-coding at gamitin ang pamamaraang ito. Susubukan kong ipaliwanag kung ano ang ibig sabihin ng mga term na ito.

Magsimula tayo sa ibig sabihin ng arithmetic at tingnan kung paano ginagamit ang PROC MEANS sa SAS na programa upang makalkula ito.

Kahulugan ng Arithmetic

Kabuuan ng halaga ng mga variable ng bilang, nahahati sa bilang ng mga variable na nagbibigay sa iyo ng ibig sabihin ng arithmetic . Kilala rin ito bilang masama at isang sukatan ng sentral na pagkahilig. Ang isang sukatan ng gitnang pagkahilig ay isang solong halaga na sumusubok na ilarawan ang isang hanay ng data sa pamamagitan ng pagkilala sa gitnang posisyon sa loob ng hanay ng data.

Sa programa ng SAS, gumagamit ka ng KAHULUGANG PROC upang makalkula ang ibig sabihin ng arithmetic. Hinahayaan ka ng pamamaraang ito na makahanap ng ibig sabihin ng lahat ng mga variable o kaunting mga variable ng isang hanay ng data. Maaari ka ring bumuo ng mga pangkat at kalkulahin ang ibig sabihin ng mga variable na tukoy sa pangkat na iyon.

Syntax:

ANG KAHULUGAN NG PROC = DATASET Mga Variable ng Klase Mga Variable ng Var
  • Mga variable : Ang mga variable sa syntax sa itaas ay nagpapahiwatig ng mga variable mula sa hanay ng data na ang ibig sabihin ay makakalkula.

Kahulugan Ng Isang Dataset

kung ikawibigay lamang ang pangalan ng hanay ng data nang walang anumang mga variable, maaari mong kalkulahin ang ibig sabihin ng lahat ng mga variable sa isang hanay ng data.

Tingnan natin ang isang sample code. Isinasaalang-alang ko ang isang paunang natukoy na hanay ng data ng SAS na tinatawag na 'mga kotse'. Ipapakita ng sumusunod na utos ang hanay ng data.

PROC PRINT data = sashelp.CARS Run

Ipinapakita ng imahe sa ibaba ang output ng code sa itaas.


Ngayon ay gamitin natin ang set ng code ng data at kalkulahin ang ibig sabihin ng bawat variable sa hanay ng data'Mga kotse'.

PROC MEANS DATA = sashelp.CARS Ibig sabihin SUM MAXDEC = 2 Run

Ipinapakita ng imahe sa ibaba ang ibig sabihin ng lahat ng mga variable sa set ng data hanggang sa dalawang decimal.

Kahulugan Ng Mga Piling variable

Sa pamamagitan ng pagbibigay ng mga pangalan sa pagpipiliang Var maaari mong makuha ang ibig sabihin ng mga tinukoy na variable. Mangyaring tingnan ang code sa ibaba.

PROC MEANS DATA = sashelp.CARS ibig sabihin SUM MAXDEC = 2 var horsepower cylinders Run

Ibig Sabihin ng Klase

Maaari mong makita ang ibig sabihin ng mga variable ng bilang sa pamamagitan ng pag-aayos ng mga ito sa mga pangkat sa pamamagitan ng paggamitilang parameter upang mapangkat ang mga ito.Isaalang-alang ang pagsunod sa sample code. Hinahayaan natin alamin ang ibig sabihin ng horsepower para sa iba't ibang mga pangkat na ikinategorya sa pamamagitan ng mga klase na 'make' at 'uri' ng iba't ibang mga kotse.

PROC MEANS DATA = sashelp.CARS MEANS SUM MAXDEC = 2 class make type var horsepower Run

Ipinapakita ng imahe sa ibaba ang output ng code sa itaas.

Ipagpatuloy natin ang aming SAS Programming blog at tingnan ang isa pang mahalagang konseptong pang-istatistika.

para saan ginagamit ang balangkas ng tagsibol

Karaniwang lihis

Ang karaniwang paglihis (SD) ay isang sukatan kung gaano iba-iba ang data sa isang naibigay na hanay ng data. Sa matematika, sasabihin nito sa iyo kung gaano kalapit ang bawat data point sa mean na halaga ng isang set ng data. Kung ang halaga ng karaniwang paglihis ay malapit sa 0, ipinapahiwatig nito na ang mga puntos ng data ay malapit sa mean ng hanay ng data at isang mataas na pamantayang paglihis ay nagpapahiwatig na ang mga puntos ng data ay kumalat sa isang malawak na hanay ng mga halaga.

Sa SAS, maaari mong kalkulahin ang halaga ng Standard Deviation gamit ang dalawang pamamaraan. Sila ay:

  • KAHULUGAN NG PROC
  • SURVEYMEANS

Karaniwang Paglilihi Paggamit ng PROC MEANS

Maaari mong sukatin ang Standard Deviation gamit ang paraan ng proc, kailangan mong piliin ang ORAS pagpipilian sa hakbang ng PROC. Ipapakita nito ang mga halagang Karaniwan na Paghiwalay para sa bawat variable ng bilang sa hanay ng data.

Syntax:

ANG KAHULUGAN NG PROC = data STD

Isaalang-alang ang sample code na ito, gumawa kami ng isa pang hanay ng data na CARS1 mula sa hanay ng data ng CARS sa SASHELP library. Upang magawa ito, pinapayagan kaming gumamit ng pamamaraang PROC SQL. Pangkatin natin ang data gamit ang 'type' at 'make' ng mga kotse at kalkulahin ang karaniwang paglihis para sa mga napiling variable na gumagamit ng pagpipiliang STD na nangangahulugang hakbang ng PROC.

Ang PROC SQL ay lumikha ng talahanayan CARS1 bilang SELECT make, type, horsepower, silindro, bigat MULA SA SASHELP. CARS WHERE make in ('Audi', 'BMW') RUN PROC MEANS DATA = CARS1 STD Run

Ang code sa itaas ay magbibigay ng Karaniwang paglihis para sa mga napiling variable. Ipinapakita ng sumusunod na imahe ang output.

PROC SURVEYMEANS

Ang pamamaraang ito ay ginagamit upang sukatin ang Standard Deviation kasama ang ilang mga advance na tampok tulad ng pagsukat ng Standard Deviation para sa mga kategorya na variable at ang pagkakaiba-iba.

Syntax:

Mga pagpipilian sa PRV SURVEYMEANS statistic-keyword ayon sa mga variable na variable ng Class variable na Var

Ang sumusunod ay ang paglalarawan ng mga ginamit na parameter:

  • Ni ay ginagamit upang ipahiwatig ang mga variable na ginamit upang lumikha ng mga pangkat ng mga obserbasyon.
  • Klase ipinapahiwatig ang mga variable na ginamit para sa mga kategorya na variable.
  • Kung saan ipinapahiwatig ang mga variable na kung saan makakalkula ang SD.

Tingnan natin ang sample code na ito na naglalarawan sa paggamit ng parameter ng klase, na lumilikha ng mga istatistika para sa bawat isa sa mga halaga sa variable ng klase.

PROC SURVEYMEANS DATA = CARS1 STD Uri ng klase Uri ng horsepower ods output statistics = rektanggulo Patakbuhin ang PROC PRINT DATA = rektanggulo Patakbuhin

Ipinapakita ng mga imahe sa ibaba ang output ng code sa itaas. Ipinapakita nito ang pamamahagi ng data para sa variable na 'Horsepower' para sa 95% agwat ng kumpiyansa. (Ang agwat ng kumpiyansa ay nangangahulugang isang saklaw ng mga halagang tinukoy na mayroong isang tinukoy na posibilidad na ang halaga ng isang parameter ay nasa loob nito.)

Kaya, dadalhin tayo nito sa pagtatapos ng SAS programming blog. Para sa anumang pag-aalinlangan o isyu sa nilalaman ng blog, mangyaring iwanan ang mga ito sa seksyon ng mga komento, malulutas ko ang mga ito sa pinakamaagang at tumugon muli.

Kung nais mong malaman ang SAS at bumuo ng isang karera sa domain ng analytics, pagkatapos ay tingnan ang aming na kasama ng live na pagsasanay na pinamunuan ng magtuturo at karanasan sa proyekto sa totoong buhay. Tutulungan ka ng pagsasanay na ito na maunawaan ang SAS nang malalim at tutulong sa iyo na makabisado ang iba't ibang mga konsepto ng wika ng programa ng SAS.

May tanong ba sa amin? Mangyaring banggitin ito sa seksyon ng mga komento at babalikan ka namin.