Cuprins:
Definiție - Ce înseamnă Hadoop Ecosystem?
Ecosistemul Hadoop se referă la diferitele componente ale bibliotecii software Apache Hadoop, precum și la accesoriile și instrumentele furnizate de Apache Software Foundation pentru aceste tipuri de proiecte software și la modalitățile de colaborare a acestora.
Hadoop este un cadru bazat pe Java care este extrem de popular pentru manipularea și analizarea seturilor mari de date.
Techopedia explică ecosistemul Hadoop
Atât pachetul principal Hadoop, cât și accesoriile sale sunt în mare parte proiecte open-source licențiate de Apache. Ideea unui ecosistem Hadoop implică utilizarea diferitelor părți din setul principal de Hadoop, cum ar fi MapReduce, un cadru pentru gestionarea unor cantități vaste de date și Sistemul de fișiere distribuit Hadoop (HDFS), un sistem sofisticat de tratare a fișierelor. Există, de asemenea, YARN, un manager de resurse Hadoop.
Pe lângă aceste elemente de bază ale Hadoop, Apache a livrat și alte tipuri de accesorii sau instrumente complementare pentru dezvoltatori. Acestea includ Apache Hive, un instrument de analiză a datelor; Apache Spark, un motor general pentru procesarea datelor mari; Apache Pig, un limbaj al fluxului de date; HBase, un instrument de bază de date; și, de asemenea, Ambarl, care poate fi considerat un manager al ecosistemului Hadoop, deoarece ajută la administrarea utilizării acestor diferite resurse Apache împreună. Odată cu faptul că Hadoop a devenit standardul de facto pentru colectarea datelor și a devenit omniprezent în multe organizații, managerii și liderii de dezvoltare învață totul despre ecosistemul Hadoop și ce tipuri de lucruri sunt implicate într-o configurație generală Hadoop.
![Ce este ecosistemul hadoop? - definiție din techopedia Ce este ecosistemul hadoop? - definiție din techopedia](https://img.theastrologypage.com/img/img/blank.jpg)