Cuprins:
Definiție - Ce înseamnă SQL pe Hadoop?
SQL on Hadoop este un tip de instrument de aplicație analitic - implementarea SQL pe platforma Hadoop, care combină interogarea standard de date structurate în SQL cu cadrul de date Hadoop. Hadoop este o platformă relativ nouă, la fel ca datele mari în sine, și nu mulți profesioniști sunt experți în aceasta, însă SQL on Hadoop simplifică accesul la cadrul Hadoop și facilitează implementarea pe sistemele de întreprindere actuale.
Techopedia explică SQL pe Hadoop
SQL pe Hadoop se referă la diverse implementări ale SQL pentru platforma Hadoop. MapReduce, care este mapatorul de joburi și organizatorul de rezultate al clădirii Hadoop, acceptă SQL ca un caz de utilizare major, precum și alte metode de procesare. Prin urmare, are sens să creăm instrumente puternice pentru a permite SQL, care este unul dintre cele mai utilizate limbi pentru interogarea și manipularea bazelor de date. Deoarece Hadoop câștigă popularitate pentru arhitectura de date a întreprinderii, SQL este esențială pentru adoptarea corectă atât a datelor structurate cât și a datelor structurate utilizate în Hadoop.
Driverele cheie SQL pe Hadoop includ:
- Utilizarea abilităților SQL existente în majoritatea organizațiilor
- Reutilizarea investițiilor de transformare a extrasului (ETL), a informațiilor de afaceri (BI) și a investițiilor în infrastructura de analiză în Hadoop
Unele implementări SQL pe Hadoop includ:
- Apache Spark SQL
- Apache Hive
- Apache Tajo
- Forajul Apache
- HP Vertica pe MapR
- Drivere ODBC
- Presto
- Rechin