Î:
De ce ar trebui managerii să se ferească de redundanța bazei de date?
A:Administratorii bazelor de date și alți profesioniști IT ar trebui să se protejeze de „redundanța bazelor de date” sau „redundanța datelor”, din cauza tuturor impacturilor negative pe care le poate avea redundanța într-un sistem sau un mediu de baze de date. Oriunde o anumită parte a datelor este duplicată, fie în două câmpuri dintr-o bază de date, fie în două medii de baze de date diferite, aceasta poate avea consecințe pentru preluarea datelor.
Unul dintre primele motive pentru evitarea redundanței datelor este acela că poate fi risipitor sau excesiv.
Este important să subliniem că sunt planificate anumite tipuri de redundanță de date, pentru a proteja și a face backup pentru date. Cu toate acestea, altele apar din codificarea slabă sau ineficientă sau din lipsa de atenție asupra celor mai bune practici. În multe cazuri, cantități mari de redundanță a datelor determină creșterea rapidă a bazei de date peste o dimensiune rezonabilă. Având în vedere acest lucru, se fac multe eforturi pentru combaterea redundanței datelor pentru a economisi spațiu într-o bază de date și, în consecință, pentru a reduce costurile și efortul de întreținere. Cu toate acestea, acest lucru trebuie făcut cu ochii spre practic - inginerii pot practica ceva numit deduplicare a datelor, dar trebuie făcut într-un mod eficient.
De exemplu, managerii bazelor de date ar putea explora ceva precum scoaterea unui șir dintr-un câmp repetat, cum ar fi un nume de client sau companie partajat și înlocuirea acesteia cu o simplă referință variabilă unde șirul este ținut în altă parte. Acest lucru poate economisi spațiu într-o bază de date - dar poate, de asemenea, să necesite mai multă activitate de server pentru a efectua o anumită interogare, deci s-ar putea să nu fie atât de eficient pe cât pare.
Un alt motiv important pentru deduplicarea datelor sau evitarea redundanței datelor este din cauza confuziei care poate rezulta. Datele redundante dintr-o bază de date pot provoca diferite tipuri de anomalii. Una dintre acestea se numește anomalie de actualizare - anomaliile de actualizare se întâmplă atunci când o înregistrare este reintrodusă cu informații actualizate, dar actualizarea nu o readuce la înregistrarea inițială. Într-o astfel de situație, pot exista trei înregistrări diferite pentru un anumit angajat al companiei, cu trei titluri de muncă diferite și trei adrese diferite, deoarece informațiile persoanei nu au fost actualizate pe întreaga bază de date, ci doar în înregistrarea ultima dată.
După cum sugerează experții, administratorii bazelor de date pot evita redundanța datelor prin proiectare. De asemenea, se pot implica în practici de normalizare a datelor care pot repara anomaliile de actualizare și alte tipuri de anomalii, prin standardizarea modului în care sunt păstrate înregistrările tabelelor bazei de date. Administratorii bazei de date pot continua, de asemenea, eforturi de deduplicare a datelor care curăță și standardizează datele în alte moduri. Toate acestea servesc în scopul creării de tabele de baze de date mai curate, făcând înregistrările bazei de date mai consistente și prevenind toate durerile de cap și problemele complexe asociate cu redundanța de date neplanificate.