Pinakabagong Mga Proyekto sa Pag-aaral ng Machine na susubukan sa 2019



Magbibigay sa iyo ang artikulong ito ng isang komprehensibong kaalaman tungkol sa Mga Proyekto sa Pag-aaral ng Machine sa industriya at ang mga tagumpay na nagawa sa lugar na ito.

ay malinaw na isang patlang na nakakita ng mga nakatutuwang pagsulong sa nakaraang ilang taon. Ang kalakaran na ito at mga pagsulong ay lumikha ng maraming mga pagkakataon sa Trabaho sa industriya. Ang kailangan para sa Mga Engine Engine Engine Learning ay mataas ang demand at ang paggulong na ito ay sanhi ng umuusbong na teknolohiya at pagbuo ng napakalaking halaga ng data aka Big Data. Kaya, sa artikulong ito, tatalakayin ko ang pinaka kamangha-manghang Mga Proyekto sa Pag-aaral ng Makina na dapat tiyak na malaman at makatrabaho ang isang tao, sa sumusunod na pagkakasunud-sunod:

Ano ang Learning ng Machine?

Ang Machine Learning ay isang konsepto na nagbibigay-daan sa makina na matuto mula sa mga halimbawa at karanasan, at iyon din nang hindi malinaw na nai-program. Kaya sa halip na isulat mo ang code, ang ginagawa mo ay nagpapakain ka ng data sa generic algorithm, at binubuo ng algorithm / machine ang lohika batay sa ibinigay na data.





Sino ang isang ML Engineer

Mga Hakbang sa Pagkatuto ng Makina

Ang anumang Algorithm sa Pagkatuto ng Machine ay sumusunod sa isang karaniwang pattern o mga hakbang.



Nangongolekta ng datos: Ang yugto na ito ay nagsasangkot ng koleksyon ng lahat ng nauugnay na data mula sa iba't ibang mga mapagkukunan

Wrangling ng Data: Ito ang proseso ng paglilinis at pag-convert ng 'Raw Data' sa isang format na nagbibigay-daan sa maginhawang pagkonsumo

Pag-aralan ang Data: Sinusuri ang data upang piliin at salain ang kinakailangang data upang maihanda ang modelo



Algorithm ng Tren: Ang algorithm ay sinanay sa dataset ng pagsasanay, kung saan nauunawaan ng algorithm ang pattern at mga patakaran na namamahala sa data

Modelo ng Pagsubok: Tinutukoy ng dataset ng pagsubok ang katumpakan ng aming modelo.

Pag-deploy: Kung ang bilis at kawastuhan ng modelo ay katanggap-tanggap, kung gayon ang modelong iyon ay dapat na ipakalat sa totoong sistema. Matapos ang modelo ay na-deploy batay sa pagganap nito ang modelo ay na-update at pinabuting kung may isang dip sa pagganap ang modelo ay muling sanayin.

Mga uri ng Pag-aaral ng Makina

Ang Pag-aaral ng Makina ay Sub-kategorya sa tatlong uri:

Pinamamahalaang Pag-aaral: Ito ang isa kung saan mayroon kang mga variable ng pag-input (x) at isang variable ng output (Y) at gumagamit ka ng isang algorithm upang malaman ang pagpapaandar ng pagmamapa mula sa pag-input hanggang sa output.

Hindi suportadong Pag-aaral: Minsan ang ibinigay na data ay hindi istraktura at walang label. Kaya't naging mahirap na uriin ang data na iyon sa iba't ibang mga kategorya. Ang hindi suportadong pag-aaral ay nakakatulong upang malutas ang problemang ito. Ang pagkatuto na ito ay ginagamit upang maipon ang input data sa mga klase batay sa kanilang mga katangiang pang-istatistika.

Pagpapalakas ng Pag-aaral: Ito ay tungkol sa pagsasagawa ng naaangkop na pagkilos upang ma-maximize ang gantimpala sa isang partikular na sitwasyon.
pagdating sa pagpapatibay ng pag-aaral, walang inaasahang output. Nagpapasya ang ahente ng pampalakas kung anong mga pagkilos ang gagawin upang maisagawa ang isang naibigay na gawain. Sa kawalan ng isang dataset ng pagsasanay, tiyak na matututo mula sa karanasan nito.

Ngayon, tingnan natin ang ilang mga Real-Life Machine Learning Project na makakatulong sa mga kumpanya na makabuo ng kita.

Mga Kaso ng Paggamit ng Industriya

1. PAG-AARAL NG PAG-AARAL

Domain: Kalahati

Pokus: Proseso ng Pagpili ng Optimize

kung paano sumulat ng klase ng singleton sa java

Hamon sa Negosyo: Ang Motion Studio ay ang pinakamalaking bahay sa paggawa ng Radyo sa Europa. Ang pagkakaroon ng kita na higit sa isang Bilyong Dolyar, nagpasya ang kumpanya na maglunsad ng isang bagong reality show: RJ Star. Ang tugon sa palabas ay walang uliran at ang kumpanya ay binaha ng mga clip ng boses. Ikaw bilang isang dalubhasa sa ML ay kailangang uriin ang boses bilang alinman sa lalaki / babae upang ang unang antas ng pagsasala ay mas mabilis.

Pangunahing Mga Isyu: Ang sample ng boses ay nasa kabuuan ng mga accent.

Pakinabang sa Negosyo: Mula noon RJ Star ay isang reality show, ang oras upang pumili ng mga kandidato ay napakaliit. Ang buong tagumpay ng palabas at samakatuwid ang kita ay nakasalalay sa mabilis at maayos na pagpapatupad

pag-import ng pandas bilang pd import numpy bilang np import matplotlib.

# Suriin ang no. ng mga tala df.info () df.describe () df.isnull (). kabuuan ()

i-print ('Hugis ng Data:', df.shape) i-print ('Kabuuang bilang ng mga label: {}'. format (df.shape [0])) i-print ('Bilang ng lalaki: {}'. format (df [ df.label == 'male']. hugis [0])) print ('Bilang ng babae: {}'. format (df [df.label == 'babae']. hugis [0]))

X = df.iloc [:,: -1] print (df.shape) print (X.shape)

mula sa sklearn.preprocessing import LabelEncoder y = df.iloc [:, - 1] gender_encoder = LabelEncoder () y = gender_encoder.fit_transform (y) y mula sa sklearn.preproseso ng pag-import ng StandardScaler scaler = StandardScaler () scaler.fit (X) X = scaler.transform (X) mula sa sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split (X, y, test_size = 0.3, random_state = 100) mula sa sklearn.svm import SVC mula sa sklearn import sukat mula sa sklearn.mreics , pagkalito_matrix svc_model = SVC () svc_model.fit (X_train, y_train) y_pred = svc_model.predict (X_test) print ('Accuracy Score:') print (sukatan.akuridad_score (y_test, y_pred))

i-print (pagkalito_matrix (y_test, y_pred))

2. LIONIONPOWER

Domain: Sasakyan

Pokus: Insentibo ang mga Driver

Hamon sa Negosyo: Ang Lithionpower ay ang pinakamalaking tagapagbigay ng mga de-kuryenteng sasakyan (e-sasakyan) na baterya. Karaniwan nang inuupahan ng mga driver ang baterya sa loob ng isang araw at pagkatapos ay pinalitan ito ng isang sisingilin na baterya mula sa kumpanya. Ang Lithionpower ay may isang variable na modelo ng pagpepresyo batay sa kasaysayan ng pagmamaneho ng driver. Tulad ng buhay ng isang baterya ay nakasalalay sa mga kadahilanan tulad ng overspeeding, distansya hinihimok bawat araw, atbp Ikaw bilang isang dalubhasa sa ML ay kailangang lumikha ng isang modelo ng kumpol na kung saan ang mga driver ay maaaring mapagsama-sama batay sa data ng pagmamaneho.

Mga pangunahing isyu: Ang mga driver ay maa-insentibo batay sa kumpol, kaya't dapat maging tumpak ang pagpapangkat.

Mga Pakinabang sa Negosyo: Taasan ang kita, hanggang sa 15-20% habang ang mga driver na may mahinang kasaysayan ay mas singil.

import pandas bilang pd import numpy bilang np import matplotlib.pyplot bilang plt import seaborn bilang sns sns.set () # for plot styling% matplotlib inline import warnings.filterwarnings ('huwag pansinin') import matplotlib.pyplot bilang plt plt.rcParams [ 'figure.figsize'] = (12, 6) df = pd.read_csv ('driver-data.csv') df.head ()

df.info () df.describe ()

mula sa sklearn.cluster import KMeans # Pagkuha ng 2 clusters kmeans = KMeans (n_clusters = 2) df_analyze = df.drop ('id', axis = 1) kmeans.fit (df_analyze)

kmeans.cluster_centers_

print (kmeans.labels_) print (len (kmeans.labels_))

print (uri (kmeans.labels_)) natatangi, binibilang = np.unique (kmeans.labels_, return_counts = True) print (dict (zip (natatangi, bilang)))

df_analyze ['cluster'] = kmeans.labels_ sns.set_style ('whitegrid') sns.lmplot ('mean_dist_day', 'mean_over_speed_perc', data = df_analyze, hue = 'cluster', palette = 'coolwarm', size = 6, aspeto = 1, fit_reg = Mali)

#Now, Suriin natin ang mga kumpol, kapag n = 4 kmeans_4 = KMeans (n_clusters = 4) kmeans_4.fit (df.drop ('id', axis = 1)) kmeans_4.fit (df.drop ('id', axis = 1)) print (kmeans_4.cluster_centers_) natatangi, bilang = np.unique (kmeans_4.labels_, return_count = True) kmeans_4.cluster_centers_ print (dict (zip (natatangi, bilang)))

df_analyze ['cluster'] = kmeans_4.labels_ sns.set_style ('whitegrid') sns.lmplot ('mean_dist_day', 'mean_over_speed_perc', data = df_analyze, hue = 'cluster', palette = 'coolwarm', size = 6, aspeto = 1, fit_reg = Mali)

3. BluEx

Domain: Logistics

Pokus: Pinakamainam na Landas

Hamon sa Negosyo: Ang BluEx ay isang nangungunang kumpanya ng logistics sa India. Kilala ito para sa mahusay na paghahatid ng mga packet sa mga customer. Gayunpaman, nahaharap ang BluEx sa isang hamon kung saan ang mga driver ng van nito ay kumukuha ng suboptimal path para sa paghahatid. Ito ay sanhi ng pagkaantala at mas mataas na gastos sa gasolina. Ikaw bilang dalubhasa sa ML ay kailangang lumikha ng isang modelo ng ML gamit ang Reinforcement Learning upang ang mahusay na landas ay matatagpuan sa pamamagitan ng programa.

Mga pangunahing isyu: Ang data ay maraming mga katangian at ang pag-uuri ay maaaring maging nakakalito.

Mga Pakinabang sa Negosyo: Hanggang sa 15% ng gastos sa gasolina ay maaaring mai-save sa pamamagitan ng pagkuha ng pinakamainam na landas.

import numpy as np import pylab as plt import networkx as nx #Initializing points points_list = [(0,1), (1,5), (5,6), (5,4), (1,2), (2 , 3), (2,7)] layunin = 7 pagmamapa = {0: 'Start', 1: '1', 2: '2', 3: '3', 4: '4', 5: '5 ', 6:' 6 ', 7:' 7-Destination '} G = nx.Graph () G.add_edges_from (points_list) pos = nx.s spring_layout (G, k = .5, center = points_list [2]) nx .draw_networkx_nodes (G, pos, node_color = 'g') nx.draw_networkx_edges (G, pos, edge_color = 'b') nx.draw_networkx_labels (G, pos) plt.show ()

NO_OF_POINTS = 8 #Inititlaizing R Matrix R = np.matrix (np.ones (hugis = (NO_OF_POINTS, NO_OF_POINTS))) R * = -1 para sa point in points_list: print (point) kung point [1] == layunin: R [point] = 150 pa: R [point] = 0 kung point [0] == layunin: R [point [:: - 1]] = 150 pa: # baligtad ng point R [point [:: - 1]] = 0

R [layunin, layunin] = 150 R

Q = np.matrix (np.zeros ([NO_OF_POINTS, NO_OF_POINTS])) # Ang parameter ng pag-aaral gamma = 0.8 initial_state = 1 def available_actions (state): current_state_row = R [state,] av_act = np. saan (current_state_row & ampampampgt = 0 ) [1] return av_act available_act = available_actions (initial_state) def sample_next_action (available_actions_range): next_action = int (np.random.choice (available_act, 1)) ibalik ang susunod na pagkilos = action_next_action (available_act) pag-update ng def (kasalukuyang_state, aksyon, gamma) : max_index = np.where (Q [action,] == np.max (Q [action,])) [1] kung max_index.shape [0] & ampampampgt 1: max_index = int (np.random.choice (max_index, size = 1)) else: max_index = int (max_index) max_value = Q [action, max_index] Q [current_state, action] = R [current_state, action] + gamma * max_value print ('max_value', R [current_state, action] + gamma * max_value) kung (np.max (Q) & ampampampgt 0): return (np.sum (Q / np.max (Q) * 100)) iba pa: ibalik (0) ang pag-update (initial_state, pagkilos, gamma)

mga marka = [] para sa ako sa saklaw (700): current_state = np.random.randint (0, int (Q.shape [0])) available_act = available_actions (current_state) action = sample_next_action (available_act) iskor = update (current_state, mga marka ng pagkilos, gamma). magdagdag (marka) i-print ('Iskor:', str (iskor)) i-print ('Trained Q matrix:') print (Q / np.max (Q) * 100) # Testing current_state = 0 na mga hakbang = [current_state] habang kasalukuyang_state! = 7: next_step_index = np.where (Q [current_state,] == np.max (Q [current_state,])) [1] kung next_step_index.shape [0] & ampampampgt 1: next_step_index = int (np.random.choice (next_step_index, size = 1)) iba pa: next_step_index = int (next_step_index) steps.append (next_step_index) current_state = next_step_index

i-print ('Pinaka mahusay na landas:') i-print (mga hakbang) plt.plot (mga marka) plt.show ()

Mga Open Source Machine Learning Project sa 2019

Detectron : Ang Detectron ay ang sistema ng software ng Facebook AI Research na nagpapatupad ng mga algorithm ng pagtuklas ng object na state-of-the-art. Ito ay nakasulat sa Python at pinalakas ng Caffe2 deep framework framework.

Ang layunin ng Detectron ay upang magbigay ng isang de-kalidad, mataas na pagganap na codebase para sa pagsasaliksik ng pagtuklas ng object. Dinisenyo ito upang maging kakayahang umangkop upang suportahan ang mabilis na pagpapatupad at pagsusuri ng nobela na pagsasaliksik. Naglalaman ito ng higit sa 50 mga pre-train na modelo.

Denspose : Ang siksik na pagtantya ng pose ng tao ay naglalayong ma-map ang lahat ng mga pixel ng tao ng isang RGB na imahe sa ibabaw ng 3D ng katawan ng tao. Ang DensePose-RCNN ay ipinatupad sa balangkas ng Detectron.

TensorFlow.js : Ito ay isang silid-aklatan para sa pagbuo at pagsasanay sa mga modelo ng ML at pag-deploy sa browser. Ito ay naging isang tanyag na pinakawalan mula noong pinakawalan ito ng mas maaga sa taong ito at patuloy na humanga sa kakayahang umangkop nito. Sa pamamagitan nito maaari mo

  • Bumuo ng ML sa Browser: Gumamit ng mga kakayahang umangkop at madaling maunawaan na mga API upang bumuo ng mga modelo mula sa simula gamit ang mababang antas ng JavaScript linear algebra library o ang mataas na antas na mga layer ng API.
  • Patakbuhin ang Mga mayroon nang mga modelo : Gumamit ng mga converter ng modelo ng TensorFlow.js upang patakbuhin ang paunang mayroon nang mga modelo ng TensorFlow sa browser mismo.
  • Muling sanayin ang Mga umiiral na mga modelo: Muling sanayin ang dati nang mga modelo ng ML gamit ang data ng sensor na konektado sa browser, o iba pang data sa panig ng client.

Waveglow: Gumagawa din ang Machine Learning ng mga pangunahing pag-unlad sa pagproseso ng audio at hindi lamang ito bumubuo ng musika o pag-uuri. Ang WaveGlow ay isang Generative Network na batay sa Daloy para sa Synthesis ng Pagsasalita ng NVIDIA. Inilista din ng mga mananaliksik ang mga hakbang na maaari mong sundin kung nais mong sanayin ang iyong sariling modelo mula sa simula.

Pagpipinta ng Larawan : Isipin na mayroon kang kalahating imahe ng isang eksena at nais mo ang buong tanawin, mabuti iyan ang magagawa sa iyo ng pag-outpainting ng imahe para sa iyo. Ang proyektong ito ay isang pagpapatupad ng Keras ng papel ng Image Outpainting ng Stanford. Ang modelo ay sinanay sa 3500 nag-scrab ng data sa beach na may argumento na umaabot sa hanggang 10,500 mga imahe para sa 25 mga panahon .

Ito ay isang kamangha-manghang papel na may isang detalyadong hakbang-hakbang na paliwanag. Kailangang subukan ang isang halimbawa para sa lahat ng Mga Mahilig sa Pag-aaral ng Machine. Sa personal, ito ang aking paboritong proyekto sa Pag-aaral ng Machine.

Malalim na Painterly Harmonization : Sa gayon, pinag-uusapan ang tungkol sa mga imahe, ang isang ito ay isang obra maestra. Ang ginagawa ng algorithm na ito ay, kumukuha ng isang imahe bilang input at pagkatapos kung magdagdag ka ng isang panlabas na elemento sa imahe, pinagsasama nito ang sangkap na iyon sa paligid na para bang bahagi ito nito.

Masasabi mo ba ang pagkakaiba? Hindi, di ba Sa gayon, ipinapakita sa amin kung gaano kalayo ang narating sa mga tuntunin ng Pag-aaral ng Makina.

DeepMimic: Ngayon, suriin nang mabuti ang mga imahe dito, nakikita mo ang isang stick figure na nagsasagawa ng spin-kick, backflip, at cartwheel. Na ang aking kaibigan ay pampatibay na natututo sa aksyon. Ang DeepMimic ay isang halimbawa-Pinatnubayan ng Deep Reinforcement Learning ng Mga Kasanayan sa Character na Batay sa Physics.

pumantay () sa java

Magenta : Ang Magenta ay isang proyekto sa pagsasaliksik na tuklasin ang papel na ginagampanan ng pagkatuto ng makina sa proseso ng paglikha ng sining at musika. Pangunahin na nagsasangkot ng pagbuo ng mga bagong malalim na pag-aaral at pampatibay na pag-aaral ng mga algorithm para sa pagbuo ng mga kanta, larawan, guhit, at iba pang mga materyales.

Ito rin ay isang paggalugad sa pagbuo ng mga matalinong tool at interface na pinapayagan ang mga artist at musikero na pahabain ( hindi papalit! ) ang kanilang mga proseso gamit ang mga modelong ito. Pumunta kumalat ang iyong mga pakpak, lumikha ng iyong natatanging nilalaman para sa Instagram o Soundcloud at maging isang influencer.

Kaya mga tao, sa pagtatapos namin ng kamangha-manghang artikulong ito sa Machine Learning Projects. Subukan ang mga halimbawang ito at ipaalam sa amin sa seksyon ng komento sa ibaba. Inaasahan kong malaman mo ang praktikal na pagpapatupad ng Machine Learning sa industriya. Edureka’s Ginagawa kang sanay sa mga diskarteng tulad ng Pinangangasiwaang Pag-aaral, Hindi Pinapamahalaang Pag-aaral at Pagproseso ng Likas na Wika. Kabilang dito ang pagsasanay sa pinakabagong mga pagsulong at panteknikal na diskarte sa Artipisyal na Pag-intelektuwal at Pag-aaral ng Makina tulad ng Deep Learning, Mga Modelong Grapiko at Paglalaman ng Reinforcement