Cuprins:
Când crezi că ai o idee grozavă, dar trebuie să o testezi, vrei să o testezi cât mai rapid și cât mai economic. Nu doriți să intrați într-un ciclu de dezvoltare și testare îndelungat și să pierdeți mult timp și bani. Apache Spark a facilitat dezvoltarea rapidă a aplicațiilor, în principal pentru că vă permite să vă testați rapid ideile cu ajutorul shell-ului și API-urilor sale.
Ce este Apache Spark?
Tehnic, Apache Spark este un motor de procesare a datelor care poate sări în bucăți de date colosale și să le proceseze într-un flash. Cele două caracteristici principale ale acestuia sunt viteza de procesare a datelor și performanța în memorie. Acest cadru de calcul al clusterului este un instrument open-source care ajută dezvoltatorii în devenire să-și construiască aplicațiile în cel mai scurt timp.
Acest cadru avansat de procesare a datelor este creat de AMP Lab și a fost publicat ca un instrument open-source în 2010, ca parte integrantă a Proiectului Apache. Întregul proiect Spark este codat folosind limbajul Scala și poate rula pe o mașină virtuală bazată pe Java (JVM).