» » » » » » Clasificarea datelor mari (Big Data)

Clasificarea datelor mari (Big Data)

postat în: Big Data 0

În ciuda faptului că nu suntem conștienți de asta uneori, Big Data este un fenomen cu care se confruntă ființele umane. Ele intră în contact cu sistemele care stochează date personale în baze de date masive în multe feluri și pot fi afectate de rezultatele prelucrării datelor mari, fie ca persoană fizică, fie ca parte a unui grup. Aceste atribute diferite ale interacțiunii și utilizării datelor mari sunt utile în clasificarea acestora.

Conceptul că datele sunt partajate și stocate pe servere prin utilizarea Internetului implică faptul că acest proces poate avea loc în două moduri, în funcție de modul în care se produce interacțiunea dintre subiectul care produce datele și sistemul de stocare. În funcție de tipul de interacțiune, putem identifica:

  1. Date mari active, atunci când un utilizator trimite direct date către un sistem de stocare (de exemplu, datele colectate de aplicațiile dispozitivelor mobile pentru care a fost furnizat consimțământul explicit, datele transmise în timpul înregistrării pentru crearea unei identități digitale).
  2. Date mari pasive, atunci când datele unei persoane sunt colectate de o altă persoană și apoi introduse într-un sistem de stocare online (de exemplu, detalii personale și rezultatele analizelor colectate de personalul spitalului în timpul asistenței medicale).

Chiar și în cazul în care datele sunt transferate direct de la un dispozitiv al unui utilizator la un sistem de stocare, nu ar trebui să se înțeleagă că este furnizată o notificare corespunzătoare, care este suficient de rapidă și suficient de clară pentru a fi înțeleasă în mod corect. Transferul de date, de fapt, indiferent de modul în care este realizată conexiunea directă dintre un subiect și sistemul de stocare, poate avea loc într-un mod mai mult sau mai puțin explicit. Prin urmare, este posibil să se facă distincția între:

  1. Date transmise în mod conștient, atunci când un utilizator este în timp util și în mod clar informat că datele despre el sunt colectate și stocate, astfel încât conștientizarea poate fi asumată în siguranță.
  2. Date transferate în mod ne-conștient, în cazul în care nu a fost furnizată o notificare în timp util și clară, prin urmare nu se poate presupune că o persoană este conștientă de faptul că are loc colectarea și stocarea datelor.

După colectarea datelor după una sau o combinație de posibilități descrise, datele sunt de obicei prelucrate pentru a genera statistici. Prelucrarea datelor urmează diferite căi atunci când este utilizată pentru a identifica și caracteriza grupurile dintr-un set de date sau pentru a găsi informații despre o singură persoană. Prin urmare, rezultă următoarele trei dimensiuni ale datelor mari:

  1. Dimensiunea individuală, atunci când un individ este obiectul unei analize care se realizează pentru a înțelege comportamentul, obiceiurile de consum, etc. (de exemplu, istoricul achizițiilor unui utilizator pe o piață online poate fi folosit pentru a genera recomandări).
  2. Dimensiunea socială, atunci când analizele vizează identificarea grupurilor discrete în cadrul unei populații și etichetarea acestora pentru utilizarea ulterioară (de exemplu, un grup de elevi poate fi identificat drept cursanți care învață repede, și acest lucru poate duce la acțiuni de învățare personalizate).
  3. Dimensiunea hibridă, atunci când un individ este definit prin apartenența la un grup ale cărui caracteristici au fost deja definite și acțiunile față de acel individ se bazează pe caracteristicile acestui grup (de exemplu, o organizație ar putea decide să nu angajeze un candidat potrivit religiei datorită unei prejudecăți față de acest grup și potențialei integrări cu politicile companiei).

Sursa: European Economic and Social Committee, ”The ethics of Big Data: Balancing economic benefits and ethical questions of Big Data in the EU policy context”, © European Union, 2017

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *