Cuprins:
Definiție - Ce înseamnă K-Means Clustering?
Clustering-ul K-înseamnă un algoritm simplu de învățare nesupravegheat, care este utilizat pentru a rezolva problemele de clustering. Urmează o procedură simplă de clasificare a unui set de date dat într-un număr de clustere, definit prin litera "k", care este fixată în prealabil. Clusterele sunt apoi poziționate ca puncte și toate observațiile sau punctele de date sunt asociate cu cel mai apropiat cluster, sunt calculate, ajustate și apoi procesul începe prin a folosi noile ajustări până când se obține un rezultat dorit.
Clustering-ul K-înseamnă are utilizări în motoarele de căutare, segmentarea pieței, statistici și chiar astronomie.
Techopedia explică clusteringul K-Means
Clustering-ul K-înseamnă o metodă folosită pentru analiza clusteringului, în special în extragerea datelor și statistici. Se urmărește împărțirea unui set de observații într-un număr de clustere (k), ceea ce duce la împărțirea datelor în celulele Voronoi. Poate fi considerată o metodă de a afla din ce grup aparține cu adevărat un anumit obiect.
Este utilizat în principal în statistici și poate fi aplicat la aproape orice ramură de studiu. De exemplu, în marketing, acesta poate fi utilizat pentru a grupa diferite demografii ale persoanelor în grupuri simple, care facilitează orientarea marketingului. Astronomii o folosesc pentru a cernea cantități uriașe de date astronomice; întrucât nu pot analiza fiecare obiect unul câte unul, au nevoie de o modalitate de a găsi statistic puncte de interes pentru observare și investigare.
Algoritmul:
- Punctele K sunt plasate în spațiul de date obiect care reprezintă grupul inițial de centroide.
- Fiecare obiect sau punct de date este alocat în cel mai apropiat k.
- După ce toate obiectele sunt atribuite, pozițiile k centroidelor sunt recalculate.
- Etapele 2 și 3 se repetă până când pozițiile centroidelor nu se mai mișcă.
