Cuprins:
- Definiție - Ce înseamnă Open-Source Big Data Analytics?
- Techopedia explică Open-Source Big Data Analytics
Definiție - Ce înseamnă Open-Source Big Data Analytics?
Analiza open-source de date mari se referă la utilizarea de software și instrumente open-source pentru analizarea unor cantități uriașe de date pentru a aduna informații relevante și acționabile pe care o organizație le poate utiliza pentru a-și continua obiectivele de afaceri. Cel mai mare jucător în analizele de date mari de tip open-source este Hacheop de la Apache - este cea mai utilizată bibliotecă software pentru procesarea unor seturi de date enorme într-un grup de calculatoare folosind un proces distribuit pentru paralelism.
Techopedia explică Open-Source Big Data Analytics
Analiza open-source de date mari folosește software și instrumente open-source pentru a executa analytics de date mari, fie folosind o întreagă platformă software, fie diverse instrumente open-source pentru diferite sarcini în procesul de analiză a datelor. Apache Hadoop este cel mai cunoscut sistem pentru analiza datelor mari, dar sunt necesare alte componente înainte ca un sistem de analiză reală să poată fi reunit.
Hadoop este implementarea open-source a algoritmului MapReduce pionierat de Google și Yahoo, deci este baza celor mai multe sisteme de analiză astăzi. Multe instrumente de analiză a datelor mari utilizează surse deschise, inclusiv sisteme solide de baze de date, cum ar fi MongoDB cu sursă deschisă, o bază de date NoSQL sofisticată și scalabilă, foarte potrivită pentru aplicațiile de date mari, precum și altele.
Serviciile de analiză a datelor de mare dimensiune open-source cuprind:
- Sistem de colectare a datelor
- Centrul de control pentru administrarea și monitorizarea clusterelor
- Bibliotecă de învățare automată și minerit de date
- Serviciul de coordonare a aplicațiilor
- Calculați motorul
- Cadrul de execuție