Home » Articole » RO » Știință » Matematica » Știința datelor (Data science » Teoria învățării statistice

Teoria învățării statistice

Teoria învățării statistice presupune aproximativ evaluarea cantității de date necesare pentru a obține o anumită precizie de predicție. Există diferențe între statistică și învățare automată, chiar dacă cele două domenii împărtășesc obiective comune.

Într-adevăr, ambele par să încerce să folosească date pentru a îmbunătăți deciziile. În timp ce aceste domenii au evoluat în aceeași direcție și au în prezent o mulțime de aspecte, ele au fost la început destul de diferite. Statistica a existat cu mult înainte de învățarea automată, și statistica era deja o disciplină științifică pe deplin dezvoltată până în 1920, în special datorită contribuțiilor lui R. Fisher, care a popularizat estimarea maximă a probabilității (MLE) ca instrument sistematic pentru inferența statistică. Cu toate acestea, MLE necesită în esență cunoașterea distribuției probabilității din care sunt extrase datele, până la un parametru necunoscut de interes. Adesea, parametrul necunoscut are o semnificație fizică, iar estimarea acestuia este esențială pentru a înțelege mai bine unele fenomene. Activarea MLE necesită, prin urmare, să știți multe despre procesul de generare a datelor: acest lucru este cunoscut sub numele de modelare. Modelarea poate fi condusă de fizică sau de cunoașterea prealabilă a problemei. În orice caz, necesită destul de multe cunoștințe de domeniu.

Mai recent (exemplele datează din anii 1960) au devenit disponibile noi tipuri de seturi de date (date demografice, sociale, medicale …). Cu toate acestea, modelarea datelor conținute este mult mai periculoasă, deoarece nu înțelegem foarte bine procesul de intrare / ieșire, necesitând astfel o abordare fără distribuție. Un exemplu tipic este clasificarea imaginilor în care scopul este de a eticheta o imagine pur și simplu dintr-o digitalizare a acestei imagini. Înțelegerea a ceea ce face o imagine o pisică sau un câine, de exemplu, este un proces foarte complicat. Cu toate acestea, pentru sarcina de clasificare, nu este nevoie să înțelegem procesul de etichetare, ci mai degrabă să îl reproducem. În acest sens, învățarea automată favorizează o abordare blackbox (caseta neagră) (vezi Figura 1).

Blackbox pentru învățare automată (Blackbox pentru învățare automată (stânga) unde scopul este de a reproduce perechile de intrare / ieșire din observațiile anterioare, comparativ cu abordarea statistică care deschide caseta neagră și modelează relația.)

Aceste diferențe între statistici și învățarea automată au scăzut în ultimele decenii. Într-adevăr, pe de o parte, statisticile sunt din ce în ce mai preocupate de analiza eșantionului finit, de specificația greșită a modelului și de considerațiile de calcul. Pe de altă parte, modelarea probabilistică este acum inerentă învățării automate. La intersecția celor două câmpuri, se află teoria învățării statistice, un domeniu care se ocupă în primul rând de întrebări privind complexitatea eșantionului.

Sursa: Massachusetts Institute of Technology, CC Attribution-NonCommercial-ShareAlike 4.0 International, Traducere și adaptare de Nicolae Sfetcu

Acest articol este oferit sub licență CC Attribution-NonCommercial-ShareAlike 4.0 International

Filosofia tehnologiei blockchain - Ontologii
Filosofia tehnologiei blockchain – Ontologii

Despre necesitatea şi utilitatea dezvoltării unei filosofii specifice tehnologiei blockchain, accentuând pe aspectele ontologice. După o Introducere în care evidenţiez principalele direcţii filosofice pentru această tehnologie emergentă, în Tehnologia blockchain explicitez modul de funcţionare al blockchain, punând în discuţie direcţiile ontologice de dezvoltare … Citeşte mai mult

Nu a fost votat $0,00$2,44 Citește mai mult
Telelucru (Telework)
Telelucru (Telework)

Telelucrul, ca un nou mod de a lucra prin efectuarea unei activităţi (forme de muncă) flexibile în timp şi la distanţă, utilizând tehnologia informaţională şi comunicaţiile avansate, se concretizează în teleactivităţi şi teleservicii. În ultimii ani, s-au dezvoltat rapid noi … Citeşte mai mult

Nu a fost votat $0,00$3,59 Selectează opțiunile
Ghidul Google SEO
Ghidul Google SEO

Ghidul de iniţiere Google privind optimizarea pentru motoarele de căutare, Versiunea 1.1, 13 noiembrie 2008 Acest document a fost lansat iniţial ca un efort pentru a ajuta echipele Google, însă este la fel de util şi pentru webmasterii începători în … Citeşte mai mult

Nu a fost votat $0,00 Selectează opțiunile

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *