Acasă Audio Cum vă poate ajuta sql pe hadoop cu analiza datelor mari?

Cum vă poate ajuta sql pe hadoop cu analiza datelor mari?

Cuprins:

Anonim

SQL on Hadoop este un grup de instrumente de aplicare analitice care combină interogarea în stil SQL și procesarea datelor cu cele mai recente elemente de cadru de date Hadoop. Apariția SQL pe Hadoop este o dezvoltare importantă pentru procesarea de date mari, deoarece permite grupurilor mai largi de oameni să lucreze cu succes cu cadrul de procesare a datelor Hadoop, rulând interogări SQL pe volumele enorme de date mari pe care le procesează Hadoop. Evident, cadrul Hadoop nu a fost la fel de accesibil pentru oameni, mai ales în ceea ce privește capacitățile sale de interogare. Pe baza dezvoltării, mai multe instrumente au fost în lucrările care promit să îmbunătățească productivitatea întreprinderilor atunci când vine vorba de procesarea și analizarea datelor mari cu calitate și rapiditate. De asemenea, nu este necesar să investești mult în învățarea instrumentului, așa cum ar trebui să facă cunoștințele tradiționale de SQL.

Definiția SQL on Hadoop

SQL on Hadoop este un grup de aplicații care vă permite să rulați interogări în stil SQL pe date mari găzduite de cadrul de procesare a datelor Hadoop. Evident, interogarea, preluarea și analiza datelor a devenit mai ușoară odată cu adăugarea de SQL pe Hadoop. Deoarece SQL a fost inițial proiectat pentru baze de date relaționale, acesta a trebuit să fie modificat conform modelului Hadoop 1 care cuprinde MapReduce și Sistemul de fișiere distribuit Hadoop (HDFS) și modelul Hadoop 2 care nu are MapReduce și HDFS.

Unul dintre primele eforturi de a combina SQL cu Hadoop a dus la crearea depozitului de date Hive cu software-ul HiveQL, care ar putea traduce interogările în stil SQL în joburi MapReduce. După aceea, au fost dezvoltate mai multe aplicații care ar putea face lucrări similare. Printre instrumentele de mai târziu sunt Drill, BigSQL, HAWQ, Impala, Hadapt, Stinger, H-SQL, Splice Machine, Presto, PolyBase, Spark, JethroData, Shark (Hive on Spark) și Tez (Hive on Tez).

Cum vă poate ajuta sql pe hadoop cu analiza datelor mari?