Cuprins:
Definiție - Ce înseamnă caracterizare?
Caracterizarea este o metodologie de date mare, care este utilizată pentru generarea parametrilor descriptivi care descriu în mod eficient caracteristicile și comportamentul unui anumit element de date. Aceasta este apoi utilizată în algoritmi de învățare nesupervizați pentru a găsi modele, clustere și tendințe, fără a încorpora etichete de clasă care pot avea prejudecăți. Își folosește analiza clusterului și chiar învățarea profundă.
Techopedia explică caracterizarea
Caracterizarea datelor mari este o tehnică de transformare a datelor brute în informații utile, fiind utilizată în algoritmii de învățare automată și în extragerea datelor. Caracterizarea generează în esență reprezentări condensate ale oricărui conținut de informații este ascuns în date. Prin urmare, poate fi utilizat ca mijloc de măsurare și urmărire a evenimentelor, modificărilor și comportamentelor emergente noi în fluxurile de date dinamice mari.
Câteva avantaje ale caracterizării:
- Poate genera valori utile pentru urmărirea și măsurarea evenimentelor și anomaliilor din seturile de date
- Creează mici reprezentări ale amprentei de informații esențiale
- Realizează rapid conversia de la informații la informații, ceea ce aduce industria mai aproape de transformarea completă de la informații la informații la cunoștințe
- Este util pentru indexarea și etichetarea unor obiecte, evenimente și alte caracteristici specifice într-o colecție de date