Cuprins:
Definiție - Ce înseamnă Apache Avro?
Apache Avro este un cadru de apelare de procedura de serializare a datelor și de la distanță, care este dezvoltat în cadrul proiectului Apache Hadoop, unde oferă atât un format de serializare pentru a obține date persistente, cât și un format de sârmă pentru furnizarea comunicării între nodurile Hadoop, precum și conectarea programelor client la Hadoop Servicii.
Avro folosește formatul JSON pentru definirea protocoalelor și tipurilor de date, precum și serializează datele într-un format binar compact.
Techopedia explică Apache Avro
Apache Avro este un cadru de serializare a datelor mari care produce date într-un format binar compact care nu necesită generare de cod sau obiecte proxy.
Este utilizat ca o componentă de serializare a datelor pentru Apache Hadoop. Avro lucrează la conceptul de scheme. Când se citesc datele Avro, schema care a fost utilizată în timpul scrierii acestor date specifice este întotdeauna prezentă.
Acest lucru permite fiecărui set de date fără supravaloare per-valoare, ceea ce face serializarea atât ca dimensiuni rapide, cât și relativ mici. Și din moment ce datele și schema lor se auto-descriu complet, acest lucru face ușor de utilizat cu limbaje de script dinamice.
Când datele Avro sunt stocate într-un fișier specific, schema este de asemenea stocată cu ele pentru a fi procesate ulterior de un alt program. Deci, dacă un program care citește datele așteaptă o altă schemă, atunci aceasta poate fi rezolvată cu ușurință din moment ce sunt prezente ambele scheme.
Avro oferă:
Un format de date binare compact și rapid
Structuri bogate de date
Un fișier container pentru stocarea datelor persistente
Apel de procedură la distanță (RPC)
Integrare cu limbaje dinamice
Generarea de cod nu este o cerință pentru citirea sau scrierea fișierelor de date sau pentru utilizarea sau implementarea protocoalelor RPC.
