Cuprins:
Definiție - Ce înseamnă Web Mining?
Minerizarea web este procesul de utilizare a tehnicilor și algoritmilor de extragere a datelor pentru extragerea informațiilor direct de pe Web prin extragerea acestora din documente și servicii Web, conținut Web, hyperlinkuri și jurnalele serverului. Scopul mineritului web este de a căuta tiparele în datele Web prin colectarea și analizarea informațiilor pentru a obține cunoștințe despre tendințele, industria și utilizatorii în general.Techopedia explică Web Mining
Exploatarea web este o ramură a mineritului de date care se concentrează pe World Wide Web ca sursă principală de date, incluzând toate componentele sale de la conținut Web, jurnalele serverului până la tot ce este între ele. Conținutul datelor extrase de pe Web poate fi o colecție de fapte pe care paginile Web sunt menite să le conțină și acestea pot consta în text, date structurate, cum ar fi liste și tabele, și chiar imagini, video și audio.
Categorii de minerit web:
- Extragerea conținutului web - Acesta este procesul de extragere a informațiilor utile din conținutul paginilor Web și documentelor Web, care sunt în mare parte text, imagini și fișiere audio / video. Tehnicile utilizate în această disciplină au fost puternic bazate pe prelucrarea limbajului natural (PNL) și regăsirea informațiilor.
- Minerirea structurii web - Acesta este procesul de analiză a nodurilor și a structurii de conectare a unui site web prin utilizarea teoriei graficului. Există două aspecte care pot fi obținute în acest sens: structura unui site web în ceea ce privește modul în care este conectat la alte site-uri și structura documentelor site-ului în sine, cu privire la modul în care fiecare pagină este conectată.
- Exploatarea utilizării Web - Acesta este procesul de extragere a modelelor și informațiilor din jurnalele serverului pentru a obține informații cu privire la activitatea utilizatorului, inclusiv de unde provin utilizatorii, câți au făcut clic pe ce element de pe site și tipurile de activități desfășurate pe site.
