Cuprins:
Definiție - Ce înseamnă Apache Kudu?
Apache Kudu este un membru al ecosistemului open-source Apache Hadoop. Este un motor de stocare open-source destinat datelor structurate care acceptă acces aleatoriu cu latență scăzută, împreună cu modele de acces analitice eficiente. Acesta a fost proiectat și implementat pentru a reduce diferența dintre sistemul de fișiere distribuite Hadoop (HDFS) pe scară largă și baza de date HBase NoSQL. Deși aceste sisteme se pot dovedi încă avantajoase, Apache Kudu poate răspunde multor sarcini comune de muncă, deoarece poate simplifica în mod dramatic arhitectura lor.
Techopedia explică Apache Kudu
Apache Kudu a fost dezvoltat în primul rând ca proiect la Cloudera. Majoritatea contribuțiilor până în prezent au fost realizate de dezvoltatori angajați de Cloudera. În timpul lansării sale, în depozitele Cloudera au fost incluse doar binare convenabile, cu toate acestea a adoptat procesul de eliberare a sursei Apache Software Foundation (ASF) la intrarea în incubator. Este conceput special pentru cazuri de utilizare care necesită o analiză rapidă a datelor rapide. A fost proiectat pentru a profita de generația viitoare de procesare și procesare în memorie. Reduce semnificativ latența interogărilor pentru Apache Impala și Apache Spark. Distribuie datele prin motorul de stocare pe coloane sau prin partiționare orizontală, apoi reproduce fiecare partiție folosind consensul Raft, oferind astfel latențe medii reduse pentru recuperare și laturi mici.
Deși Kudu este un produs conceput în contextul ecosistemului Apache Hadoop, acesta susține, de asemenea, integrarea cu alte proiecte de analiză a datelor atât în cadrul ASF, cât și în afara acestuia.
Apache Kudu se dovedește a fi eficient, deoarece poate prelucra în timp real sarcini analitice de lucru pe un singur strat de stocare, oferind astfel arhitecților flexibilitate pentru a aborda o varietate mai largă de cazuri de utilizare fără rezolvări exotice.
