Cuprins:
Definiție - Ce înseamnă Dirty Data?
Datele murdare se referă la date care conțin informații eronate. Poate fi, de asemenea, utilizat când se face referire la date care sunt în memorie și care încă nu sunt încărcate într-o bază de date. Eliminarea completă a datelor murdare dintr-o sursă nu este practic sau practic imposibilă.
Următoarele date pot fi considerate date murdare:
- Date înșelătoare
- Duplicarea datelor
- Date incorecte
- Date inexacte
- Date neintegrate
- Date care încalcă regulile de afaceri
- Date fără o formatare generalizată
- Date punctate sau ortografiate incorect
Techopedia explică datele murdare
Pe lângă introducerea incorectă a datelor, datele murdare pot fi generate datorită metodelor necorespunzătoare în gestionarea și stocarea datelor. Câteva tipuri de date murdare sunt explicate mai jos:
- Date incorecte - Pentru a vă asigura că datele sunt valide sau corecte, valoarea introdusă ar trebui să respecte valorile valabile ale câmpului. De exemplu, valoarea introdusă în câmpul lunii ar trebui să varieze de la 1 la 12, sau vârsta unei persoane trebuie să fie mai mică de 130. Corectitudinea valorii datelor poate fi aplicată programatic prin intermediul tabelelor de căutare sau cu verificări de editare.
- Date inexacte - Este posibil ca o valoare a datelor să fie corectă, dar nu exactă. Uneori, este practic să se examineze împotriva altor fișiere sau câmpuri pentru a afla dacă valoarea datelor este exactă pe baza contextului în care sunt utilizate. Cu toate acestea, acuratețea poate fi adesea validată numai prin verificare manuală.
- Încălcări ale regulilor de afaceri - Datele care încalcă regulile de afaceri sunt un alt tip de date murdare. De exemplu, o dată de intrare în vigoare trebuie să vină întotdeauna înainte de data de expirare. Un alt exemplu de încălcare a regulilor de afaceri poate fi o cerere de asigurare Medicare a pacientului, în cazul în care pacientul poate fi încă sub vârsta de pensionare și nu are dreptul la Medicare.
- Date inconsecvente - redundanța de date necontrolată duce la inconsistențe ale datelor. Fiecare organizație este afectată de date inconsistente și repetitive. Acest lucru este în mod tipic în special cu datele clienților.
- Date incomplete - Datele cu valori care lipsesc este principalul tip de date incomplete.
- Date duplicate - Datele duplicate pot apărea din cauza trimiterilor repetate, alăturării necorespunzătoare a datelor sau a erorilor utilizatorului.
Pentru a crește calitatea datelor și pentru a preveni datele murdare, organizațiile ar trebui să includă metodologii pentru a asigura completitudinea, validitatea, coerența și corectitudinea datelor.
