Cuprins:
Definiție - Ce înseamnă Cross-Validation?
Validarea încrucișată este o tehnică utilizată pentru evaluarea modului în care rezultatele analizei statistice se generalizează într-un set de date independent. Validarea încrucișată este utilizată în mare parte în setările în care ținta este predicție și este necesară estimarea exactității performanței unui model predictiv. Motivul principal al utilizării validării încrucișate, mai degrabă decât a validării convenționale este faptul că nu există suficiente date disponibile pentru repartizarea lor în seturi de pregătire și testare separate (ca în cazul validării convenționale). Aceasta duce la pierderea capacității de testare și modelare.
Validarea încrucișată este cunoscută și sub denumirea de estimare a rotației.
Techopedia explică Validarea încrucișată
Pentru o problemă de predicție, un model este în general prevăzut cu un set de date cunoscute, numit set de date de instruire și un set de date necunoscute împotriva cărora modelul este testat, cunoscut sub numele de set de date de testare. Ținta este să existe un set de date pentru testarea modelului în faza de instruire și apoi să ofere informații despre modul în care modelul specific se adaptează la un set de date independent. O rundă de validare încrucișată cuprinde împărțirea datelor în subseturi complementare, apoi efectuarea analizei pe un subset. După aceasta, analiza este validată pe alte subseturi (seturi de testare). Pentru a reduce variabilitatea, se realizează multe runde de validare încrucișată folosind multe partiții diferite și apoi se iau o medie a rezultatelor. Validarea încrucișată este o tehnică puternică în estimarea tehnicii de performanță a modelului.