Acasă Audio Ce este detectarea anterioară? - definiție din techopedia

Ce este detectarea anterioară? - definiție din techopedia

Cuprins:

Anonim

Definiție - Ce înseamnă Detecția Outlier?

Detectarea anterioară este procesul de detectare și de excludere a valorilor exterioare dintr-un set de date.

Un aspect anterior poate fi definit ca o informație sau o informație care se abate drastic de la norma sau media dată de setul de date. O situație anterioară poate fi cauzată pur și simplu din întâmplare, dar poate indica, de asemenea, o eroare de măsurare sau că setul de date dat are o distribuție cu coada grea.

Iată un scenariu simplu în depistarea exterioară, un proces de măsurare produce în mod constant citiri între 1 și 10, dar în unele cazuri rare obținem măsurători mai mari de 20.

Aceste măsurători rare dincolo de normă sunt numite valori exterioare, deoarece „se află în afara” curbei normale de distribuție.

Techopedia explică depistarea anterioară

Nu există într-adevăr o metodă matematică standardizată și rigidă pentru determinarea unei date mai vechi, deoarece aceasta variază cu adevărat în funcție de setul sau populația de date, deci determinarea și detectarea acesteia devine în cele din urmă subiectivă. Prin eșantionarea continuă într-un anumit câmp de date, se pot stabili caracteristici ale unei date anterioare pentru a facilita detectarea.

Există metode bazate pe model pentru detectarea valorilor exterioare și presupun că datele sunt preluate dintr-o distribuție normală și vor identifica observații sau puncte, care sunt considerate puțin probabil bazate pe medie sau abatere standard, ca valori. Există mai multe metode pentru depistarea în timp:

  • Testul lui Grubb pentru Outliers - Acest lucru se bazează pe presupunerea că datele sunt de o distribuție normală și le înlătură pe cele mai devreme odată cu testul fiind iterat până când nu se mai găsesc valori.
  • Testul Q al lui Dixon - Bazat, de asemenea, pe normalitatea setului de date, această metodă testează date rele. S-a remarcat faptul că acest lucru ar trebui să fie utilizat în mod rar și niciodată mai mult de o dată într-un set de date.
  • Criteriul lui Chauvenet - Acesta este folosit pentru a analiza dacă cei din exterior sunt înfocați sau încă se află în limitele și sunt considerați ca parte a setului. Se ia media și abaterea standard și se calculează probabilitatea ca apariția anterioară. Rezultatele vor determina dacă trebuie să fie incluse sau nu.
  • Criteriul Pierce - O limită de eroare este stabilită pentru o serie de observații, dincolo de care toate observațiile vor fi aruncate, deoarece acestea implică deja o eroare atât de mare.
Ce este detectarea anterioară? - definiție din techopedia