Cuprins:
Definiție - Ce înseamnă Preprocesarea datelor?
Preprocesarea datelor este o tehnică de extragere a datelor care implică transformarea datelor brute într-un format inteligibil. Datele din lumea reală sunt adesea incomplete, inconsistente și / sau lipsite de anumite comportamente sau tendințe și pot conține multe erori. Preprocesarea datelor este o metodă dovedită de soluționare a acestor probleme. Preprocesarea datelor pregătește datele brute pentru prelucrarea ulterioară.
Preprocesarea datelor este utilizată pentru aplicații bazate pe baze de date, cum ar fi administrarea relațiilor cu clienții și aplicațiile bazate pe reguli (cum ar fi rețelele neuronale).
Techopedia explică Preprocesarea datelor
Datele parcurg o serie de pași în timpul preprocesării:
- Curățarea datelor: Datele sunt curățate prin procese cum ar fi completarea valorilor lipsă, netezirea datelor zgomotoase sau rezolvarea neconcordanțelor din date.
- Integrarea datelor: Datele cu reprezentări diferite sunt reunite și sunt rezolvate conflictele în cadrul datelor.
- Transformarea datelor: datele sunt normalizate, agregate și generalizate.
- Reducerea datelor: Această etapă își propune să prezinte o reprezentare redusă a datelor într-un depozit de date.
- Discretizarea datelor: implică reducerea unui număr de valori ale unui atribut continuu prin împărțirea intervalului de intervale de atribute.
