Cuprins:
Definiție - Ce înseamnă JobTracker?
JobTracker este un demon care rulează pe motorul MapReduce al lui Apache Hadoop. JobTracker este un serviciu esențial care combate toate sarcinile MapReduce la diferitele noduri din cluster, în mod ideal la nodurile care conțin deja datele sau, cel puțin, sunt localizate în același rack ca nodurile care conțin datele.
Techopedia explică JobTracker
JobTracker este serviciul din cadrul Hadoop care este responsabil de preluarea cererilor clientului. Le atribuie TaskTrackers pe DataNodes unde datele necesare sunt local local. Dacă acest lucru nu este posibil, JobTracker încearcă să atribuie sarcinile TaskTrackers în același rack în care datele sunt prezente local. Dacă din anumite motive, acest lucru nu reușește, JobTracker atribuie sarcina unui TaskTracker unde există o replică a datelor. În Hadoop, blocurile de date sunt replicate pe DataNodes pentru a asigura redundanța, astfel încât dacă un nod din cluster eșuează, jobul nu reușește de asemenea.
Procesul JobTracker:
- Cererile de joburi din aplicațiile client sunt primite de JobTracker,
- JobTracker consultă NameNode pentru a determina locația datelor necesare.
- JobTracker localizează nodurile TaskTracker care conțin datele sau cel puțin sunt aproape de date.
- Jobul este trimis la TaskTracker selectat.
- TaskTracker își îndeplinește sarcinile în timp ce este monitorizat îndeaproape de JobTracker. Dacă lucrarea nu reușește, JobTracker trimite din nou pur și simplu lucrarea la un alt TaskTracker. Cu toate acestea, JobTracker în sine este un singur punct de eșec, ceea ce înseamnă că, dacă nu reușește, întregul sistem scade.
- JobTracker își actualizează starea la finalizarea lucrării.
- Solicitantul client poate acum sondează informații de la JobTracker.