În vremurile trecute, când ne gândeam la date digitale, avea sens să segregăm datele între datele tranzacționale, datele capturate în aplicațiile de afaceri, stocate în tabelele bazei de date și prezentate de instrumentele BI și toate celelalte date: e-mailuri, pagini web, imagini, video si asa mai departe. În zilele noastre, avem tendința de a face referire la astfel de „alte date” ca date nestructurate.
Cu toate acestea, a fost analizabil și software-ul pentru a obține valoare din astfel de date a traversat prăpastia. Acest imperativ analitic a fost mai mult decât orice altceva, care a dat naștere conceptului inițial de lac de date, un depozit de date pentru ambele specii de date și, în plus, pentru date culese din mai multe surse externe afacerii, unele dintre ele fiind inevitabil nestructurate.
În această lucrare, vom examina modul în care noul ecosistem creat de lacul de date nu va mai consta în totalitate din tranzacțiile (sau evenimentele) afacerii. De asemenea, va include date din alte surse, pe care afacerea le folosește pentru a efectua analize și pentru a informa utilizatorii săi despre informații importante pe care se pot baza deciziile. Sistemul de înregistrare va fi, așa cum a fost întotdeauna, copia de aur a datelor corporative și pista de audit a activităților IT ale afacerii.