Acasă Audio Ce este extragerea datelor text? - definiție din techopedia

Ce este extragerea datelor text? - definiție din techopedia

Cuprins:

Anonim

Definiție - Ce înseamnă Text Data Mining?

Exploatarea datelor de text implică comasarea printr-un document text sau resursă pentru a obține informații structurate valoroase. Aceasta necesită instrumente analitice sofisticate care prelucrează textul pentru a obține anumite cuvinte cheie sau puncte cheie de date din ceea ce sunt considerate formate relativ brute sau nestructurate.

Minerirea datelor de texte este, de asemenea, cunoscută sub numele de text mining sau analytics text.

Techopedia explică Text Data Mining

În extragerea datelor text, sistemele proiectate folosesc lucruri precum taxonomiile și analiza lexicală pentru a determina ce părți ale unui document text sunt valoroase ca date minate. Modelele statistice sunt frecvent utilizate și sistemele pot utiliza, de asemenea, euristică sau ghicitură algoritmică, pentru a încerca să determine ce părți ale unui text sunt importante. Alte sisteme de control includ etichetarea și analiza cuvintelor cheie, unde instrumentele caută substantive proprii specifice sau alte etichete și cuvinte cheie pentru a afla despre ce se scrie.

O altă componentă unică a extragerii textului este adesea numită analiză sentimentală. În analiza sentimentului, care este în general mult mai dificilă decât analiza statistică, instrumentele analitice încearcă să descopere starea de spirit sau sentimentul din spatele textului scris și alte aspecte ale abordării la un nivel foarte subiectiv și intuitiv. Odată cu apariția instrumentelor de inteligență artificială, s-au făcut multe progrese în analiza sentimentelor, astfel încât extragerea de date moderne de text este mai mult decât colectarea de referințe cantitative și implică aducerea de modele conceptuale la nivel înalt în minerirea textului pentru a descoperi căi noi și unice. pentru a agrega date valoroase.

Ce este extragerea datelor text? - definiție din techopedia