Home » Articole » RO » Știință » Matematica » Statistica » Domenii specifice în statistică

Domenii specifice în statistică

postat în: Statistica 0

O cantitate remarcabilă de statistici moderne de astăzi provine din lucrarea originală a lui R.A. Fisher la începutul secolului XX. Deși există un număr amețitor de discipline minore în domeniu, există câteva studii de bază, fundamentale.

Începătorul în statistici va fi mai interesat de un subiect sau altul, în funcție de necesitățile sale. Următoarea este o listă cu unele dintre ramurile principale ale statisticii.

Teoria probabilităților și statisticile matematice

Puriștii și filozofii ar putea fi interesați de intersecția dintre matematica pură și realitățile dezordonate ale lumii. Un studiu riguros al probabilității – în special distribuțiile probabilității și distribuția erorilor – poate oferi o înțelegere de unde provin toate aceste proceduri statistice și ecuații. Deși este probabil ca acest tip de rigoare să împiedice un psiholog (de exemplu) să învețe și să utilizeze statisticile în mod eficient, este important dacă cineva dorește să facă o muncă serioasă (la nivel academic) în domeniu.

Acestea fiind spuse, există motive întemeiate pentru toți studenții să înțeleagă fundamental de unde provin toate aceste „tehnici și ecuații statistice”! Suntem întotdeauna mai pricepuți să folosim un instrument dacă putem înțelege de ce îl folosim. Provocarea constă în a aduce aceste idei importante către nematematic, fără ca studentul să se holbeze. Se poate duce acest argument cu un pas mai departe pentru a susține că un număr mare de studenți nu vor folosi niciodată un test t – el sau ea nu va conecta niciodată aceste numere la un calculator și nu va răsfoi unele ecuații ezoterice – dar având o înțelegere fundamentală a unui astfel de test, el sau ea va putea să înțeleagă (și să pună la îndoială) rezultatele descoperirilor altcuiva.

Proiectarea experimentelor

Unul dintre cele mai neglijate aspecte ale statisticii – și poate cea mai mare problemă pentru statisticieni – este proiectarea experimentală. De aceea, un om de știință va aduce rezultatele unui experiment important unui statistician și va cere ajutor pentru a analiza rezultatele doar pentru a descoperi dacă o defecțiune a designului experimental a făcut ca rezultatele să fie inutile. Cercetătorii vin foarte des la statisticieni în speranța că aceștia vor „salva” cumva magic experimentele lor.

Iată un exemplu clasic în acest sens. În clasa sa de psihologie, unui student i s-a cerut să efectueze un experiment și să rezume rezultatele acestuia. A decis să studieze dacă muzica a avut un impact asupra rezolvării problemelor. A avut un număr mare de subiecți care să rezolve un puzzle mai întâi în tăcere, apoi în timp ce ascultă muzică clasică și, în cele din urmă, ascultă rock and roll și, în cele din urmă, în tăcere. El a măsurat cât va dura până la finalizarea fiecărei sarcini și apoi a rezumat rezultatele.

Ceea ce studentul nu a reușit să ia în considerare a fost că rezultatele au fost puternic afectate de un efect de învățare pe care nu îl luase în considerare. Primul puzzle a durat întotdeauna mai mult, deoarece subiecții au învățat mai întâi cum să lucreze puzzle-ul. Prin cea de-a treia încercare (când au fost supuși la rock and roll), subiecții erau mult mai abili în rezolvarea puzzle-ului, astfel rezultatele experimentului ar părea să sugereze că subiecții erau mult mai pricepuți la rezolvarea problemelor în timp ce ascultau rock and roll!

Simplul act de randomizare a ordinii testelor ar fi izolat „efectul de învățare” și, de fapt, un experiment bine conceput i-ar fi permis să măsoare atât efectele fiecărui tip de muzică, cât și efectul învățării. În schimb, rezultatele sale au fost lipsite de sens. Un design experimental atent poate ajuta la păstrarea rezultatelor unui experiment și, de fapt, unele modele pot economisi cantități uriașe de timp și bani, pot maximiza rezultatele unui experiment și, uneori, pot oferi informații suplimentare pe care cercetătorul nici măcar nu le-a luat în considerare!

Prelevarea de probe

Similar proiectării experimentelor, studiul eșantionării ne permite să găsim un design statistic cel mai eficient care să optimizeze cantitatea de informații pe care o putem colecta minimizând în același timp nivelul de efort. Cu toate acestea, eșantionarea este foarte diferită de proiectarea experimentală. Într-un laborator putem proiecta un experiment și îl putem controla de la început până la sfârșit. Dar de multe ori vrem să studiem ceva în afara laboratorului, asupra căruia avem mult mai puțin control.

Dacă am vrea să măsurăm populația unui gândac dăunător și efectul acestuia asupra copacilor, am fi obligați să călătorim în unele terenuri forestiere și să facem observații, de exemplu: măsurarea populației gândacilor în diferite locații, observând ce copaci au fost infestați , măsurarea sănătății și mărimii acestor copaci etc.

Proiectarea eșantionării se implică în întrebări precum „Câte măsurători trebuie să fac?” sau „Cum selectez locațiile din care îmi fac măsurătorile?” Fără a planifica aceste probleme, cercetătorii ar putea cheltui mult timp și bani doar pentru a descoperi că trebuie să probeze cu adevărat de zece ori mai multe puncte pentru a obține rezultate semnificative sau că unele dintre punctele lor de probă se aflau într-un peisaj (cum ar fi o mlaștină) unde gândacii au prosperat mai mult sau copacii au crescut mai bine.

Regresia modernă

Modelele de regresie leagă variabile între ele într-un mod liniar. De exemplu, dacă ați înregistra înălțimile și greutățile mai multor persoane și le-ați pus într-un grafic comparativ, veți descoperi că, pe măsură ce înălțimea crește, greutatea tinde să crească și ea. Probabil ați vedea, de asemenea, că o linie dreaptă prin date este o modalitate la fel de bună de a aproxima relația pe care o veți putea găsi, deși va exista o oarecare variabilitate în legătură cu linia. Astfel de modele liniare sunt probabil cel mai important instrument disponibil statisticienilor. Au o istorie lungă și multe dintre aspectele teoretice mai detaliate au fost descoperite în anii 1970. Metoda obișnuită pentru dezvoltarea unor astfel de modele este prin estimarea „celor mai mici pătrate”, deși sunt disponibile alte metode și sunt adesea mai adecvate, mai ales atunci când datele nu sunt distribuite în mod normal.

Ce se întâmplă, totuși, dacă relația nu este o linie dreaptă? Cum se poate potrivi o curbă cu datele? Există multe răspunsuri la această întrebare. O soluție simplă este potrivirea unei relații pătratice, dar în practică o astfel de curbă nu este adesea suficient de flexibilă. De asemenea, ce se întâmplă dacă aveți multe variabile și relațiile dintre ele sunt diferite și complicate?

Metodele moderne de regresie vizează soluționarea acestor probleme. Metode precum modelele aditive generalizate, regresia urmăririi proiecției, rețelele neuronale și boosting permit relații foarte generale între variabilele explicative și variabilele de răspuns, iar puterea de calcul modernă face din aceste metode o opțiune practică pentru multe aplicații.

Clasificarea

Unele lucruri sunt diferite de altele. Cum? Adică, cum sunt clasificate obiectele în grupurile lor respective? Luați în considerare o bancă, care speră să împrumute bani clienților. Unii clienți care împrumută bani nu vor putea sau nu vor să-i ramburseze, deși majoritatea îi vor rambursa ca rambursări regulate. Cum poate banca să clasifice clienții în aceste două grupuri atunci când decide cui să împrumute bani?

Răspunsul la această întrebare este, fără îndoială, influențat de multe lucruri, inclusiv venitul unui client, istoricul creditului, activele, datoriile deja existente, vârsta și profesia. Pot exista și alte caracteristici influente, măsurabile, care pot fi utilizate pentru a prezice ce fel de client este un anumit individ. Cum ar trebui banca să decidă ce caracteristici sunt importante și cum ar trebui să combine aceste informații într-o regulă care să îi spună dacă împrumută sau nu banii?

Acesta este un exemplu de problemă de clasificare, iar clasificarea statistică este un câmp larg care conține metode precum analiza discriminantă liniară, arborii de clasificare, rețelele neuronale și alte metode.

Serii temporale

Multe tipuri de cercetări privesc datele colectate de-a lungul timpului, unde o observație făcută astăzi poate avea o oarecare corelație cu observația făcută mâine. Două exemple importante în acest sens sunt domeniile finanțelor (piața de valori) și știința atmosferică.

Cu toții am văzut acele grafice liniare ale prețurilor acțiunilor, pe măsură ce acestea serpentină în sus și în jos în timp. Investitorii sunt interesați să prezică care sunt acțiunile care vor continua să urce (când să cumpere) și când o acțiune din portofoliul lor scade. Este ușor să vă lăsați induși în eroare de salt brusc de vești bune sau de o simplă „corecție a pieței” pentru a deduce – în mod incorect – ce anume se întâmplă!

În meteorologie oamenii de știință sunt preocupați de venerabila știință a prezicerii vremii. Indiferent dacă încercăm să prezicem dacă mâine va fi însorit sau să stabilim dacă ne confruntăm cu adevărate schimbări climatice (adică încălzirea globală), este important să analizăm datele meteo în timp.

Analiza supraviețuirii

Să presupunem că o companie farmaceutică studiază un nou medicament despre care se speră că va face oamenii să trăiască mai mult (vindecându-i de cancer, reducându-le tensiunea arterială sau colesterolul și, prin urmare, riscul de boli de inimă sau prin orice alt mecanism). Compania va recruta pacienți într-un studiu clinic, va oferi unora pacienți medicamentul și altora un placebo și îi va urmări până când vor aduna suficiente date pentru a răspunde la întrebarea dacă și cât timp, noul medicament extinde speranța de viață.

Astfel de date prezintă probleme de analiză. Unii pacienți vor fi murit mai devreme decât alții și, adesea, unii pacienți nu vor fi murit înainte de finalizarea studiului clinic. În mod clar, pacienții care trăiesc mai mult contribuie cu date informative despre capacitatea (sau nu) a medicamentului de a prelungi speranța de viață. Deci, cum ar trebui analizate astfel de date?

Analiza supraviețuirii oferă răspunsuri la această întrebare și oferă statisticienilor instrumentele necesare pentru a utiliza pe deplin datele disponibile pentru a interpreta corect efectul tratamentului.

Analiza categorică

În laboratoare putem măsura greutatea fructelor pe care le produce o plantă sau temperatura unei reacții chimice. Aceste puncte de date sunt ușor de măsurat cu un indicator sau un termometru, dar ce ziceți de culoarea ochilor unei persoane sau de atitudinea ei cu privire la gustul broccoli? Psihologii nu pot măsura furia cuiva cu un băț de măsurat, dar își pot întreba pacienții dacă se simt „foarte supărați” sau „puțin supărați” sau „indiferenți”. În analiza statistică trebuie utilizate metodologii complet diferite de aceste tipuri de experimente. Analiza categorică este utilizată într-o multitudine de locuri, de la sondaje politice la analiza datelor recensământului până la genetică și medicină.

Studii clinice

În Statele Unite, FDA cere ca toate companiile farmaceutice să fie supuse unor proceduri riguroase numite Studii clinice și analize statistice pentru a asigura siguranța publică înainte de a permite vânzarea sau utilizarea de noi medicamente. De fapt, industria farmaceutică are mai multe statistici decât orice altă afacere!

Întreţinerea şi repararea calculatoarelor
Întreţinerea şi repararea calculatoarelor

Manual pentru începători pentru întreţinerea şi depanarea calculatoarelor, cu o introducere în noţiuni despre calculatoare, hardware, software (inclusiv sisteme de operare) şi securitatea pe Internet. Un calculator de uz general are patru componente principale: unitatea logică aritmetică (ALU), unitatea de … Citeşte mai mult

Nu a fost votat $3,99$8,99 Citește mai mult
Imre Lakatos: Euristica și toleranța metodologică
Imre Lakatos: Euristica și toleranța metodologică

O analiză a conceptelor de euristica și toleranță metodologică dezvoltate de Lakatos, pe baza articolului ”Falsification and the methodology of scientific research programmes”, publicat pentru prima dată în 1970 și apoi în cartea The methodology of scientific research programmes, Volume … Citeşte mai mult

Nu a fost votat $0,00$2,19 Selectează opțiunile
Filmul Solaris, regia Andrei Tarkovsky – Aspecte psihologice și filosofice
Filmul Solaris, regia Andrei Tarkovsky – Aspecte psihologice și filosofice

Principalele aspecte psihologice și filosofice desprinse din filmul Solaris regizat de Andrei Tarkovski, precum și tehnicile cinematografice utilizate de regizor pentru a-și transmite mesajele spectatorului. În ”Introducere” prezint pe scurt elementele relevante din biografia lui Tarkovski și o prezentare generală … Citeşte mai mult

Nu a fost votat $0,00$2,19 Selectează opțiunile

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *