SQL Para sa Agham ng Data: Isang solusyon sa paghinto para sa Mga Nagsisimula



Ang blog post na ito sa SQL para sa Data Science ay makakatulong sa iyo na maunawaan kung paano magagamit ang SQL upang mag-imbak, ma-access at makuha ang data upang maisagawa ang pagsusuri sa data.

Mula nang ang oras ng Data Science ay na-ranggo sa bilang 1 dahil sa siya ang pinaka-promising trabaho ng panahon, lahat tayo ay sumusubok na sumali sa lahi ng . Ang blog post na ito sa SQL para sa Data Science ay makakatulong sa iyo na maunawaan kung paano magagamit ang SQL upang mag-imbak, ma-access at makuha ang data upang maisagawa ang pagsusuri sa data.

Narito ang isang listahan ng mga paksa saklaw sa blog na ito:





    1. Bakit Kailangan ang SQL Para sa Agham ng Data?
    2. Ano ang SQL?
    3. Mga Pangunahing Kaalaman Ng SQL
    4. Pag-install ng MySQL
    5. Aktuwal

Bakit Kailangan ang SQL Para sa Agham ng Data?

Alam mo bang bumubuo kami ng higit sa 2.5 quintillion bytes ng data bawat araw? Ang bilis ng pagbuo ng data na ito ang dahilan sa likod ng katanyagan ng mga high-end na teknolohiya tulad ng Agham sa Data , , at iba pa.

Ang pagkuha ng mga kapaki-pakinabang na pananaw mula sa data ay ang tinatawag na Data Science. Kasama sa Agham sa Data ang pagkuha, pagproseso, at pag-aaral ng toneladang data. Sa kasalukuyan kung ano ang kailangan natin maaaring magamit upang iimbak at pamahalaan ang napakalaking bilang ng data.



Ano ang Agham sa Data - Edureka

Ito ay kung saan SQL ay dumating sa.

Maaaring magamit ang SQL upang mag-imbak, ma-access at kumuha ng napakalaking dami ng data upang maisagawa nang maayos ang buong proseso ng Agham ng Data.



Ano ang SQL?

SQL na nangangahulugang Structured Query Language ay isang nagtatanong na wika na naglalayong pamahalaan ang Mga Relasyong Database.

Ngunit ano nga ba ang isang Relational Database?

Ang isang pamanggit na database ay isang pangkat ng mga natukoy nang maayos na mga talahanayan mula sa kung aling ang data ay maaaring ma-access, mai-edit, ma-update at iba pa, nang hindi kinakailangang baguhin ang mga talahanayan ng database. Ang SQL ay ang pamantayan (API) para sa mga kaugnay na mga database.

Bumabalik sa SQL, ang SQL na programa ay maaaring magamit upang maisagawa ang maraming mga pagkilos sa data tulad ng pag-query, pagpasok, pag-update, pagtanggal ng mga tala ng database. Ang mga halimbawa ng mga pamamagitang database na gumagamit ng SQL ay may kasamang MySQL Database, Oracle, atbp.

ano ang ginagawa ng bufferedreader sa java

Upang matuto nang higit pa tungkol sa SQL, maaari kang dumaan sa mga sumusunod na blog:

  1. Pag-unawa sa Mga Uri ng Data ng SQL - Lahat ng Kailangan Mong Malaman Tungkol sa Mga Uri ng SQL Data
  2. GUMAWA NG TABLE sa SQL - Lahat ng Kailangan Mong Malaman Tungkol sa Paglikha ng Mga Talahanayan sa SQL

Bago kami magsimula sa isang demo sa SQL, pamilyar tayo sa mga pangunahing utos ng SQL.

Mga Pangunahing Kaalaman Ng SQL

Nagbibigay ang SQL ng isang hanay ng mga simpleng utos upang baguhin ang mga talahanayan ng data, dumaan tayo sa ilan sa mga pangunahing utos ng SQL:

  • GUMAWA NG DATABASE - lumilikha ng isang bagong database
  • LIKHA NG TABLE - lumilikha ng isang bagong talahanayan
  • IPASOK SA - nagsisingit ng bagong data sa isang database
  • PUMILI - kumukuha ng data mula sa isang database
  • I-UPDATE - ina-update ang data sa isang database
  • TANGGALIN - tinatanggal ang data mula sa isang database
  • ALTER DATABASE - nagbabago ng isang database
  • ALTER TABLE - binabago ang isang table
  • TABLE NG DROP - tinatanggal ang isang mesa
  • LIKHA NG INDEX - lumilikha ng isang index upang maghanap ng isang elemento
  • DROP INDEX - tatanggalin isang index

Upang mas maintindihan ang SQL, i-install natin ang MySQL at tingnan kung paano ka makakapaglaro sa data.

Pag-install ng MySQL

Ang pag-install ng MySQL ay isang simpleng gawain. Narito ang sunud-sunod na gabay makakatulong iyon sa iyo na mai-install ang MySQL sa iyong system.

Kapag tapos ka nang mag-install MySQL, sundin ang seksyon sa ibaba para sa isang simpleng demo na magpapakita sa iyo kung paano mo maipapasok, manipulahin at mabago ang data.

SQL Para sa Agham ng Data - MySQL Demo

Sa demonstrasyong ito, makikita natin kung paano lumikha ng mga database at maproseso ang mga ito. Ito ay isang demonstrasyon sa antas ng nagsisimula upang makapagsimula ka sa pagtatasa ng data sa SQL.

Kaya't magsimula tayo!

Hakbang 1: Lumikha ng isang SQL Database

Ang isang database ng SQL ay isang warehouse ng imbakan kung saan maaaring maiimbak ang data sa isang nakabalangkas na format. Ngayon ay lumikha tayo ng isang database sa pamamagitan ng paggamit MySQL :

GUMAWA NG DATABASE edureka USE edureka

Sa code sa itaas, mayroong dalawang mga utos ng SQL:

Tandaan : Ang mga utos ng SQL ay tinukoy sa mga malalaking titik at isang semi-colon ang ginagamit upang wakasan ang isang utos ng SQL.

  1. GUMAWA NG DATABASE: Lumilikha ang utos na ito ng isang database na tinatawag na 'edureka'

  2. PAGGAMIT: Ang utos na ito ay ginagamit upang buhayin ang database. Narito pinapagana namin ang database ng 'edureka'.

Hakbang 2: Lumikha ng isang talahanayan na may kinakailangang mga tampok sa data

Ang paglikha ng isang talahanayan ay kasing simple ng paglikha ng isang database. Kailangan mo lamang tukuyin ang mga variable o ang mga tampok ng talahanayan sa kani-kanilang mga uri ng data. Tingnan natin kung paano ito magagawa:

Lumikha ng mga laruan sa TABLE (TID INTEGER HINDI NULO PANGUNAHING KEY AUTO_INCREMENT, Item_name TEXT, Presyo INTEGER, Dami INTEGER)

Sa snippet ng code sa itaas nagaganap ang mga sumusunod na bagay:

  1. Gamitin ang utos na 'CREATE TABLE' upang lumikha ng isang talahanayan na tinatawag na mga laruan.
  2. Naglalaman ang talahanayan ng laruan ng 4 na tampok, katulad ng, TID (Transaction ID), Item_name, Presyo at Dami.
  3. Ang bawat variable ay tinukoy sa kani-kanilang mga uri ng data.
  4. Ang variable ng TID ay idineklara bilang pangunahing key. Ang isang pangunahing susi ay karaniwang nagsasaad ng isang variable na maaaring mag-imbak ng isang natatanging halaga.

Maaari mo pang suriin ang mga detalye ng tinukoy na talahanayan sa pamamagitan ng paggamit ng sumusunod na utos:

NILALARAWAN ang mga laruan

Hakbang 3: Pagpasok ng data sa talahanayan

Ngayong lumikha kami ng isang talahanayan, punan natin ito ng ilang mga halaga. Mas maaga sa blog na ito, nabanggit ko kung paano ka maaaring magdagdag ng data sa isang talahanayan sa pamamagitan lamang ng paggamit ng isang solong utos, ibig sabihin, INSERT INTO.

Tingnan natin kung paano ito tapos:

Ipasok sa mga VALUES ng laruan (Null, 'Train', 550, 88) I-INSERT SA Mga laruang VALUES (Null, 'Hotwheels_car', 350, 80) I-INSERT SA VALUE NG mga laruan (Null, 'Magic_Pencil', 70, 100) I-INSERT SA VALUE NG mga laruan ( Null, 'Dog_house', 120, 54) INSERT SA VALUE NG mga laruan (NULL, 'Skateboard', 700, 42) I-INSERT SA VALUES ng mga laruan (NULL, 'GI Joe', 300, 120)

Sa snippet ng code sa itaas, ipinasok namin ang 6 na obserbasyon sa aming talahanayan na 'mga laruan' sa pamamagitan ng paggamit ng INSERT INTO command. Para sa bawat pagmamasid, sa loob ng mga braket, tinukoy ko ang halaga ng bawat variable o tampok na tinukoy habang lumilikha ng talahanayan.

Ang variable ng TID ay nakatakda sa Null dahil ito ay auto-increment mula sa 1.

Ipakita natin ngayon ang lahat ng data na naroroon sa aming talahanayan. Maaari itong magawa sa pamamagitan ng paggamit ng sumusunod na utos:

PUMILI * MULA sa mga laruan


Hakbang 4: Baguhin ang mga entry ng data

ano ang pagkakaiba sa pagitan ng java at c ++

Sabihin nating nagpasya kang dagdagan ang presyo ng G.I. Joe dahil nakakakuha ka ng maraming mga customer. Paano mo maa-update ang presyo ng variable sa isang database?

Ito ay simple, gamitin lamang ang utos sa ibaba:

I-UPDATE ang mga laruan na Itakda ang Presyo = 350 SAAN TID = 6

Pinapayagan ka ng utos na UPDATE na baguhin ang anumang mga halaga / variable na nakaimbak sa talahanayan. Pinapayagan ka ng parameter ng SET na pumili ng isang partikular na tampok at ang WHERE parameter ay ginagamit upang makilala ang variable / halaga na nais mong baguhin. Sa utos sa itaas, na-update ko ang presyo ng data entry na ang TID ay 6 (G.I. Joe).

Tingnan natin ngayon ang na-update na talahanayan:

PUMILI * MULA sa mga laruan

Maaari mo ring baguhin ang nais mong ipakita sa pamamagitan ng pag-refer lamang sa mga haligi na nais mong tingnan. Halimbawa, ang utos sa ibaba ay ipapakita lamang ang pangalan ng laruan at ang kani-kanilang presyo:

PUMILI ng Item_name, Presyo MULA sa mga laruan

Hakbang 5: Kinukuha ang data

Kaya pagkatapos ipasok ang data at baguhin ito, sa wakas ay oras na upang kunin at kunin ang data ayon sa mga kinakailangan sa negosyo. Dito maaaring makuha ang data para sa karagdagang pagsusuri ng data at pagmomodelo ng data.

Tandaan na isang simpleng halimbawa upang makapagsimula ka sa SQL, gayunpaman, sa mga pangyayari sa real-world ang data ay mas kumplikado at malaki ang laki. Sa kabila nito, ang mga utos ng SQL ay mananatiling pareho at iyon ang ginagawang simple at nauunawaan ng SQL. Maaari nitong maproseso ang mga kumplikadong hanay ng data na may isang hanay ng mga simpleng utos ng SQL.

Ngayon kunin natin ang data sa isang pares ng mga pagbabago. Sumangguni sa code sa ibaba at subukang unawain kung ano ang ginagawa nito nang hindi tinitingnan ang output:

PUMILI * MULA sa mga laruan LIMIT 2

Nahulaan mo! Ipinapakita nito ang unang dalawang obserbasyon na naroroon sa aking talahanayan.

Subukan natin ang isang bagay na mas kawili-wili.

PUMILI * MULA sa mga laruan NG ORDER NG Presyo ASC

Tulad ng ipinakita sa figure, ang mga halaga ay nakaayos na patungkol sa pataas na pagkakasunud-sunod ng variable ng presyo. Kung nais mong hanapin ang tatlong pinakamadalas na biniling item, ano ang gagawin mo?

pumunta sa c ++

Medyo simple lang talaga!

PUMILI * MULA sa mga laruan ORDER BY Dami DESC LIMIT 3

Subukan natin ang isa pa.

PUMILI * MULA sa mga laruan DITO ang Presyo> 400 ORDER BY Price ASC


Ang query na ito ay kumukuha ng mga detalye ng mga laruan na ang presyo ay higit sa 400 at inaayos ang output sa pataas na pagkakasunud-sunod ng presyo.

Kaya't kung paano mo mapoproseso ang data sa pamamagitan ng paggamit ng SQL. Ngayong alam mo na ang mga pangunahing kaalaman sa SQL para sa Data Science, sigurado akong interesado ka upang malaman ang higit pa. Narito ang isang pares ng mga blog upang makapagsimula ka:

  1. Ano ang Data Science? Isang Gabay ng Nagsisimula Sa Agham ng Data
  2. MySQL Tutorial - Isang Gabay sa Baguhan Upang Alamin ang MySQL

Kung nais mong magpatala para sa isang kumpletong kurso sa Artipisyal na Katalinuhan at Pag-aaral ng Makina, ang Edureka ay may espesyal na na-curate iyon ay magpapasikat sa iyo sa mga diskarteng tulad ng Pinangangasiwaang Pag-aaral, Hindi Pinapamahalaang Pag-aaral, at Pagproseso ng Likas na Wika. Kabilang dito ang pagsasanay sa pinakabagong mga pagsulong at panteknikal na diskarte sa Artipisyal na Pag-intelektuwal at Pag-aaral ng Makina tulad ng Deep Learning, Mga Modelong Grapiko at Pag-aaral ng Patatag.