Cuprins:
- Definiție - Ce înseamnă extragerea de date nestructurate?
- Techopedia explică extragerea de date nestructurate
Definiție - Ce înseamnă extragerea de date nestructurate?
Exploatarea datelor nestructurate este practica de a analiza date relativ nestructurate și de a încerca să obțină mai multe seturi de date mai rafinate. Adesea constă în extragerea datelor din surse care nu sunt utilizate în mod tradițional pentru activitățile de extragere a datelor.Techopedia explică extragerea de date nestructurate
În general, extragerea de date este practica de a combate prin seturi de date și de a încerca să obțină doar cele mai valoroase biți de informații într-un format specific. Acest lucru este de obicei mai dificil cu date relativ nestructurate. Experții IT definește date nestructurate ca date care nu sunt într-un format specific, date care sunt „grele de text” sau date care sunt „ascunse” în documente imprecise care nu sunt ordonate în mod oficial să furnizeze informații tehnice.
Un exemplu de document nestructurat ar fi o scrisoare sau o corespondență între două sau mai multe părți. În extragerea datelor nestructurate, tehnologiile ar descompune acea scrisoare, căutând identificatori și biți de informații specifice, cum ar fi numele părților asociate, datele la care au fost trimise scrisorile, numele întreprinderilor implicate, sumele de monedă sau alte cuantificări. biți de date sau coduri atribuite anumitor produse, servicii sau oferte. Aceste tipuri de date sunt extrase și apoi introduse într-un format pe care întreprinderile sau alte părți le pot utiliza pentru o referință rapidă sau pentru aplicații dezvoltate de informații de afaceri.
