Acasă Baze de date Ce este descoperirea cunoștințelor în bazele de date (kdd)? - definiție din techopedia

Ce este descoperirea cunoștințelor în bazele de date (kdd)? - definiție din techopedia

Cuprins:

Anonim

Definiție - Ce înseamnă descoperirea cunoștințelor în bazele de date (KDD)?

Descoperirea cunoștințelor în bazele de date (KDD) este procesul de descoperire a cunoștințelor utile dintr-o colecție de date. Această tehnică de extragere a datelor folosită pe scară largă este un proces care include pregătirea și selectarea datelor, curățarea datelor, încorporarea cunoștințelor prealabile cu privire la seturile de date și interpretarea soluțiilor precise din rezultatele observate.

Principalele domenii de aplicații KDD includ marketing, detectarea fraudei, telecomunicații și fabricație.

Techopedia explică descoperirea cunoștințelor în bazele de date (KDD)

În mod tradițional, extragerea datelor și descoperirea cunoștințelor au fost efectuate manual. Odată cu trecerea timpului, cantitatea de date în multe sisteme a crescut până la dimensiunea terabytei și nu mai putea fi menținută manual. Mai mult, pentru existența cu succes a oricărei afaceri, descoperirea tiparelor de bază ale datelor este considerată esențială. Drept urmare, au fost dezvoltate mai multe instrumente software pentru a descoperi date ascunse și a face presupuneri, care au făcut parte din inteligența artificială.

Procesul KDD a atins apogeul în ultimii 10 ani. Acum adăpostește multe abordări diferite ale descoperirii, care include învățarea inductivă, statisticile bayesiene, optimizarea interogărilor semantice, achiziția de cunoștințe pentru sisteme de experți și teoria informației. Scopul final este extragerea cunoștințelor la nivel înalt din date la nivel scăzut.

KDD include activități multidisciplinare. Aceasta cuprinde stocarea și accesul datelor, algoritmi de scalare la seturi masive de date și interpretarea rezultatelor. Procesul de curățare a datelor și accesul la date inclus în depozitarea datelor facilitează procesul KDD. Inteligența artificială sprijină și KDD prin descoperirea legilor empirice din experimentare și observații. Modelele recunoscute în date trebuie să fie valide pe date noi și să aibă un anumit grad de certitudine. Aceste tipare sunt considerate cunoștințe noi. Pașii implicați în întregul proces KDD sunt:

  1. Identificați obiectivul procesului KDD din perspectiva clientului.
  2. Înțelegeți domeniile aplicației implicate și cunoștințele necesare
  3. Selectați un set de date țintă sau un subset de probe de date pe care se efectuează descoperirea.
  4. Curățați și preprocesați datele hotărând strategiile de gestionare a câmpurilor lipsă și modificați datele conform cerințelor.
  5. Simplificați seturile de date eliminând variabile nedorite. Apoi, analizați caracteristicile utile care pot fi utilizate pentru a reprezenta datele, în funcție de obiectiv sau sarcină.
  6. Potriviți obiectivele KDD cu metodele de extragere a datelor pentru a sugera tipare ascunse.
  7. Alegeți algoritmi de extragere a datelor pentru a descoperi tipare ascunse. Acest proces include decizia care sunt modelele și parametrii pot fi adecvați pentru procesul general al KDD.
  8. Căutați modele de interes într-o anumită formă reprezentativă, care includ reguli de clasificare sau arbori, regresie și grupare.
  9. Interpretați cunoștințele esențiale din tiparele minate.
  10. Utilizați cunoștințele și încorporați-le într-un alt sistem pentru acțiuni suplimentare.
  11. Documentează-l și creează rapoarte pentru părțile interesate.
Ce este descoperirea cunoștințelor în bazele de date (kdd)? - definiție din techopedia