Cuprins:
Volumul datelor crește rapid datorită utilizării dispozitivelor mobile, a social media și a datelor din alte surse nestructurate. Tehnologiile de date mari, cum ar fi Hadoop, se ocupă de scaunul șoferului în lumea afacerilor prin introducerea de noi abordări pentru analizarea unor volume mai mari de date pe diverse surse.
Datele mari sunt definite ca volumul, varietatea și viteza datelor care depășesc capacitatea unei organizații de a le gestiona și analiza în timp util. Adevăratul avantaj al datelor mari se realizează atunci când pot fi recoltate pentru decizii rapide, bazate pe fapte, care pot duce la decizii de afaceri mari. Deci, organizațiile care pot explora și profita de date mari tind să aibă un avantaj distinct. Aici vom arunca o privire asupra ce poate face datele mari, cum pot fi aplicate într-un singur câmp bogat în date și ce aplicații mai largi are pentru alte domenii de afaceri și de guvernare.
Explozia datelor
Cel mai bun mod de a defini datele mari este „cantitatea și complexitatea în continuă creștere a informațiilor pe care toți le creăm și consumăm zilnic”, spune Charlie Schick, directorul soluțiilor de date mari pentru îngrijirea sănătății și științele vieții la IBM. De fapt, în fiecare zi creăm aproximativ 2, 5 octeți de cvintilete de date folosind o varietate de surse, de la diverse înregistrări de tranzacții de cumpărare la imagini medicale de asistență medicală, de la descoperirile cercetării științifice până la mesajele de socializare.
Motoarele de căutare, împreună cu social media, cum ar fi Twitter, au creat o nouă instanță de biți mici de date colectate la scară largă. Acest lucru a schimbat și modul nostru de a gândi despre colectarea și gestionarea acestor date. Cultura actuală este de a consuma cantități mai mari din aceste mici date în perioade scurte de timp. Această abordare prezintă provocări uriașe, precum și oportunități interesante pentru gestionarea datelor. Pentru ca un model de afaceri să aibă succes, acesta ar trebui să poată prelucra volume mai mari de date, capturate în moduri mici și din ce în ce mai diverse.
Având în vedere volumul datelor, devine o provocare să găsiți un mecanism eficient de colectare a acestora. Să luăm în considerare datele de îngrijire a sănătății și de social media. Ambele domenii au seturi mari de date. Colectarea de date pentru aceste câmpuri este un pas important în evoluția datelor mari. Fără a avea un mecanism adecvat de colectare a datelor, nu putem avea rezultate precise.
Explorarea și procesarea datelor mari
Mergând mai departe, se crede că organizațiile care pot explora și profita de date mari ar trebui să poată lua rapid mai multe decizii bazate pe dovezi. Folosind date mari, putem oferi cu ușurință răspunsuri la unele întrebări semnificative în aproape orice domeniu. Totuși, aici vom analiza sectorul serviciilor sociale, un domeniu în care datele mari au puterea de a avea un impact uriaș.
De exemplu, datele mari ar trebui să poată analiza și răspunde la următoarele întrebări și, în final, să ofere un rezultat mai bun pentru pacient:
- Care este corelația dintre re-admitere și accesul la servicii sociale?
- Există vreo corelație între durata șederii și eficacitatea intervenției?
- Care este legătura dintre adresa de domiciliu și frecvența vizitei?
- Este posibil să găsim o legătură între statutul familiei, intervenții și rezultate care ne pot ajuta să identificăm candidații la intervenție similare pe măsură ce intră în sistemul de îngrijire?
- Există o perspectivă asupra unui segment al populației care ne ghidează să ne modificăm programele pentru a răspunde sau a merge înainte de tendințele negative precum sarcina adolescenților sau violența în familie?
Datele mari permit gestionarea acestor situații și descoperirea motivului problemelor. Aceasta ne ajută să eradicăm problema, odată identificată. Putem descoperi problema doar analizând tendințele și datele istorice. În social media, în timp ce analizăm datele, trebuie să avem un mecanism de analiză a tendințelor. Cu cât analizăm un set mai mare de date, cu atât putem obține rezultate mai bune și mai precise. Datele mari nu numai că oferă modalități de gestionare a volumelor mari de date, dar oferă și soluții inovatoare pentru procesarea unei game mai largi de date. Datele mari au capacitatea de a gestiona seturi de date structurate, nestructurate și semi-structurate. (Aflați mai multe în 5 probleme din lumea reală pe care datele mari le pot rezolva.)
Analiza datelor mari în științele sociale
Analiza datelor sociale nu este altceva decât analiza datelor sociale. Aceste date pot proveni din orice câmp. După cum am menționat mai sus, trebuie să aflăm motivul exact al rezultatelor negative - cum ar fi abandonul liceal - într-un anumit sector. Odată identificată problema, devine mai ușor să gestionați situația. Datele mari reprezintă un instrument care face posibilă găsirea acestor informații.