Acasă Baze de date Îndepărtarea impulsului: trecerea relațională dincolo de tradițional

Îndepărtarea impulsului: trecerea relațională dincolo de tradițional

Anonim

De personalul Techopedia, 8 iunie 2016

Take away : Gazda Eric Kavanaugh discută inovațiile în tehnologia bazelor de date cu experții Dez Blanchfield, Robin Bloor și Bert Scalzo.

În prezent nu sunteți autentificat. Vă rugăm să vă conectați sau să vă înregistrați pentru a vedea videoclipul.

Eric Kavanagh: Doamnelor și domnilor, este miercuri, la ora patru est. Sunt în New Orleans, vine vara, asta înseamnă că e cald! Este timpul pentru Hot Technologies, da într-adevăr, da într-adevăr. Numele meu este Eric Kavanagh, voi fi gazda ta. Voi da mingea înapoi aici pentru Hot Technologies. Subiectul de astăzi este „Forward Momentum: Moving Relational Beyond tradițional”. Oameni, avem astăzi trei experți în baza de date la telefon, așa că orice întrebări aveți, trimiteți-le pe cele grele, nu fiți timizi. Avem o grămadă de conținut bun aliniat pentru tine astăzi. Există locul despre dvs. cu adevărat, destul despre mine. Desigur, anul acesta este fierbinte. Vorbim totul despre tehnologiile fierbinți din acest spectacol, care este un parteneriat cu prietenii noștri de la Techopedia. Și mergem până la baza managementului informațiilor, astăzi, care este, desigur, baza de date. Vom vorbi despre cum am ajuns aici, despre ce se întâmplă astăzi și despre ce se întâmplă înainte. Se întâmplă o mulțime de lucruri foarte interesante.

Evident, avem o inovație serioasă în spațiul bazei de date. A fost un pic de liniște o vreme; Dacă vorbești cu unii dintre analiștii din afaceri, aș spune probabil din anul cum ar fi, 2005 până în 2009 sau în '10, nu părea că se întâmplă prea multe în ceea ce privește inovația. Și, dintr-odată, a izbucnit pur și simplu, ca un jailbreak sau ceva de genul, și acum se întâmplă tot felul de lucruri interesante. Multe dintre acestea se datorează scării web-ului și a tuturor proprietăților cool ale web care fac lucruri interesante diferite. De aici a venit conceptul NoSQL. Și asta înseamnă două lucruri diferite: înseamnă că nu există SQL, deoarece nu acceptă SQL, înseamnă, de asemenea, nu numai SQL. Există un termen „NewSQL” pe care unii oameni l-au folosit. Dar, evident, SQL - limbajul de interogare structurat - este într-adevăr fundamentul, este baza interogării.

Și este interesant că toate aceste motoare NoSQL, ce s-a întâmplat? Ei bine, au ieșit, a fost o mulțime de entuziasm în acest sens, iar câțiva ani mai târziu, ce am început să auzim cu toții? Oh, SQL pe Hadoop. Ei bine, toate aceste companii au început să bată interfețele SQL pe instrumentele lor NoSQL și oricine se află în lumea programării știe că asta va duce la unele provocări și unele dificultăți, iar unele fire încrucișate și așa mai departe. Așadar, vom afla astăzi despre multe lucruri.

Sunt cei trei prezentatori ai noștri: l-am primit pe Dez Blanchfield să sune de la Sydney, chiar propriul nostru Robin Bloor, care este în Texas, și la fel și Bert Scalzo, și el este în Texas. Deci, în primul rând vom auzi de la Dez Blanchfield. Oameni buni, vom trimite pe hashtag-ul lui #HotTech, așa că nu ezitați să trimiteți comentariile dvs. sau să vă trimiteți întrebările prin componenta Q&A a consolei webcast sau chiar prin fereastra de chat. Și cu asta, Dez Blanchfield, ia-o.

Dez Blanchfield: Mulțumesc, Eric. Buna tuturor. Așa că voi încerca să stabilesc scena la un punct de vedere de 30.000 de metri, de felul celor întâmplate în ultimul deceniu și schimbările semnificative pe care le-am văzut - sau cel puțin un deceniu și jumătate, oricum sistemele de gestionare a bazelor de date și unele dintre impacturile din punct de vedere comercial sau tehnic și unele dintre tendințele pe care le-am îndurat târziu și ne conduc în conversația pe care urmează să o avem astăzi în jurul temei.

Imaginea mea de copertă de aici este o dună de nisip și există vânt care suflă mici bucăți de nisip în partea de sus a acesteia. Și, în consecință, ceea ce se întâmplă este că dunele de nisip se plimbă încet dintr-un spațiu în altul. Și este un fenomen uimitor, în care acești masivi munți de nisip înalt de 40 de metri și 50 de metri, efectiv, se mișcă. Și se mișcă foarte încet, dar se mișcă sigur și, pe măsură ce se mișcă, schimbă peisajul. Și este destul de ceva de urmărit dacă petreci ceva timp într-o zonă în care dunele de nisip sunt un lucru natural. Pentru că poți privi pe fereastră într-o zi și să-ți dai seama că acest munte masiv de nisip, micuțe boabe mici s-au mișcat de la sine, în fapt, și că vântul îl schimbă încet dintr-un loc în altul.

Și cred că în multe privințe, asta a fost lumea sistemelor de baze de date de ceva timp. Până foarte, foarte recent, această schimbare foarte mică, sub formă de boabe de nisip, mișcă un munte uriaș de nisip, sub forma unei dune de nisip. De-a lungul anilor au apărut mici schimbări în platformele bazei de date și a fost un mediu destul de stabil și solid în jurul sistemelor și platformelor de baze de date, prin cadrul principal al erei medii. Dar, până târziu, am avut parte de lucruri destul de importante pentru nevoile noastre comerciale și pentru șoferii noștri tehnici. O să mă plimb printre noi.

Am o părere că conceptul de bază al unei baze de date, așa cum îl știam de mulți, mulți ani și, așa cum ați auzit în banterul pre-show, cei doi experți ai noștri care au apelat astăzi la mine au avut o viață în acest spațiu și aceștia au dreptate să împărtășească drepturile lăudabile de a fi acolo când totul a început la începutul anilor '80. Dar am văzut această schimbare masivă în ultimul deceniu și un pic și am de gând să ne parcurgem rapid înainte să o predăm dr. Robin Bloor.

Am trecut prin asta ceea ce numesc eu, „experiență mai mare, mai bună, mai rapidă, mai ieftină”. După cum spuneam, definiția unei baze de date s-a schimbat. Peisajul în care platformele bazei de date au trebuit să abordeze performanța și cerințele tehnice și comerciale s-au schimbat și ele. Am văzut această creștere a cererii de soluții pentru a face față fie unor cerințe comerciale mai complexe, fie mai complexe. Și, deci, o privire rapidă prin ceea ce înseamnă de fapt, în mintea mea, este că am ajuns la un fel de anii '90 și am văzut că tehnologia bazelor de date este afectată de introducerea internetului și un fel de ceea ce am numit atunci internet scară. Nu vorbeam doar despre persoane care stau în fața terminalelor, inițial le place terminalele de tip teletip cu imprimante fizice încorporate în ele și 132 coloane de text care apar în hârtie. Apoi terminalele ecranului verde timpuriu, perforare cu tastaturi.

Dar știi, lumea noastră era terminale, iar cablurile seriale sau cablurile de rețea vorbeau cu computerele mult timp. Apoi a apărut internetul și această creștere explozivă a conectivității, încât nu mai trebuia să fiți conectat la computer. Pentru a ajunge la un sistem de baze de date aveai nevoie doar de un browser web. Deci tehnologia bazelor de date a trebuit să se schimbe dramatic, pentru a face față dimensiunii tuturor tehnologiilor de bază ale motoarelor de căutare folosite pentru indexarea lumii și pentru a stoca un index de informații, în exemplul scării formatului bazei de date. Și oameni precum Google și alții au oferit o platformă pentru a face acest lucru. Și toate noile tipuri de stocare a bazelor de date, interogare și indexare au fost produse. Și atunci am avut site-uri de muzică și site-uri de filme.

Și apoi în anii 2000, am văzut boom-ul punct-com și asta a produs o explozie și mai dramatică în numărul de oameni care folosesc sisteme care erau alimentate invariabil de o bază de date de o anumită formă. În această etapă, bazele de date relaționale încă fac față majorității încărcării, le-am pus pur și simplu pe un staniu mai mare și am mers la sistemele foarte, foarte, foarte mari, care dispun de platforme Unix de la oameni precum IBM și Sun și așa mai departe. . Boomul dot-com a făcut lucrurile mai mari și mai rapide din punct de vedere al hardware-ului, din punct de vedere al performanței și au existat unele schimbări semnificative în motoarele bazei de date, dar, pentru partea mai bună, a fost în continuare același lucru pe care l-am văzut un perioadă lungă de timp.

Și atunci am obținut această eră a web 2.0, așa cum ne referim la ea. Și aceasta a fost o schimbare monstruoasă, deoarece, dintr-o dată, am avut nevoie de platforme de baze de date mult mai simple și a trebuit să existe o scară la o formă orizontală. Și aceasta a fost o schimbare atât de importantă în modul în care am abordat ideea despre ce este o bază de date. Încă suntem cu adevărat capabili acum din punctul meu de vedere. Și acum avem de-a face cu acest întreg quagmire și spun că, cu o rotire pozitivă, nu cu o conotație negativă, acest vagon de ceea ce ne referim ca date mari și o explozie enormă și mă refer la explozie. Această schimbare scandaloasă vertical pe graficul numărului de opțiuni pe care le avem atunci când vorbim despre o bază de date și o anumită formă de capacitate relațională de interogare.

Și destul de interesant, personal sunt de părere că cred că datele mari sunt cu adevărat doar vârful aisbergului. Avem tendința de a ne emoționa puțin cu privire la impactul datelor mari și a tipurilor de alegeri pe care le avem disponibile acum. Avem totul de la motoarele NoSQL, avem motoare grafice, avem toate aceste tipuri diferite de platforme la care putem arunca date și să facem lucruri cu ea. Chiar până la punctul în care, de fapt, una dintre primele conversații pe care le-am avut cu Eric Kavanagh, care este astăzi aici cu noi, a fost în jurul unei conversații referitoare la un lucru numit Apache Drill, care este un proiect open-source care vă permite să interogați. datele din interiorul modelului diferitelor tipuri de date: de la fișierele CSE brute care stau pe un hard disk, până la sistemele de fișiere HDFS la scara petabyte. Și știți, vă permite să faceți aceste interogări în stil SQL de date structurate și nestructurate de tot felul de plante interesante.

Suntem pe cale să vedem că „clădirea inteligentă” devine un lucru și ne-ar plăcea să credem că avem clădiri inteligente de gestionare a securității și căldurii, dar vorbesc despre clădiri inteligente care știu mult mai multe despre cine sunteți și unde sunteți când intrați și faceți tot felul de lucruri îngrijite la acel nivel, prin orașe inteligente - ecosisteme întregi la nivel de oraș - care știu să facă lucrurile în mod inteligent. Și dincolo de asta, am primit acest lucru incredibil pe care nu cred că nimeni din lume l-a înțeles pe deplin, și aceasta este forma Internetului Lucrurilor. Au fost toate aceste schimbări în ultimul deceniu și un pic, poate două decenii, aproximativ, dacă îl rotunjim, au avut un impact asupra lumii a ceea ce considerăm bazele noastre de date.

Au fost câteva lucruri semnificative care au făcut acest lucru chiar posibil. Costul hard disk-urilor a scăzut dramatic și, în multe feluri, asta a făcut posibilă conducerea unor arhitecturi de referință, cum ar fi modelul Hadoop, prin faptul că preluăm o mulțime de date și o distribuim pe o mulțime de hard disk-uri și fă lucruri inteligente cu ea. Și, de fapt, ceea ce a devenit clarificator, în opinia mea, a bazei de date relaționale sau a modelului tradițional de unitate DB. Și RAM a obținut foarte, foarte ieftin și asta ne-a oferit o ocazie cu totul nouă de a ne juca cu arhitecturi de referință diferite, cum ar fi în memorie, și de a face lucruri precum compartimentarea unor volume foarte mari de date.

Și, astfel, aceasta ne-a oferit această mică imagine pe care o analizăm acum, care este o diagramă care arată tipurile de platforme disponibile dacă sunteți în peisajul de date mari. Și este foarte, foarte greu de citit, iar motivul pentru asta, există prea multe informații despre asta. Există atât de multe opțiuni de realizare, modelare și fabricare a modalităților de a introduce date în sistemele de baze de date de orice formă și de a le interoga, precum și de a scrie în mod tradițional. Și nu sunt toate conforme, de fapt, foarte puțini dintre ei chiar respectă orice standard de stil de bază, dar totuși se consideră a fi o bază de date. Și am să vă arăt câteva ecrane într-o secundă pentru a vă oferi un context în jurul a ceea ce vreau să spun prin trecerea de la anii '90 și scara de internet, la web 2.0, și apoi întreaga creștere prin date mari. Dacă ne gândim că acest grafic al peisajului tehnologiei de date este interesant, deoarece există o mulțime de opțiuni, hai să aruncăm o privire asupra unei singure chei verticale.

Să ne uităm la tehnologia de marketing. Iată opțiunile pentru sistemele de gestionare a bazelor de date sau gestionarea datelor în spațiul mar-tech, deci tehnologia legată de marketing. Acum aceasta era în 2011, deci acum câțiva ani; acum cinci ani, așa arăta peisajul. Dacă mă întorc pe scurt o diapozitivă, așa arată peisajul de date din zilele noastre în diferitele mărci și oferte pe care le avem în tehnologiile bazelor de date. Așa arăta o verticală în urmă cu cinci ani, tocmai în tehnologia de marketing.

Acum, dacă merg la viziunea de astăzi, așa arată și este complet impenetabil. Este doar acest perete de mărci și opțiuni și este vorba despre mii și mii de combinații de software care se consideră a fi în clasa bazei de date, care poate capta, crea sau stoca și recupera date în diferite forme. Și cred că intrăm într-un moment foarte, foarte interesant și curajos, în care, odată, puteți cunoaște mărcile importante, puteți cunoaște cele cinci sau șase platforme diferite de la Oracle și Informix, DB2 etc. aproape un expert în toate mărcile care erau disponibile acum 20 de ani. În urmă cu zece ani, a devenit un pic mai ușor, deoarece unele dintre mărci au căzut, și nu toate mărcile au putut face față cu amploarea avizului dot-com, iar unele companii tocmai s-au rupt.

Astăzi, este absolut imposibil să fii expert în toată tehnologia bazelor de date care există, fie că este vorba de baze de date relaționale sau de platforme standard de gestionare a bazelor de date pe care le-am cunoscut în ultimele câteva decenii. Sau probabil cazul, motoarele mai moderne precum Neo4j și acele tipuri. Și așa cred că intrăm într-o lume foarte curajoasă, unde sunt disponibile o mulțime de opțiuni și avem platforme la scară orizontală, fie în memorie, fie pe disc acum. Dar cred că este o perioadă dificilă pentru factorii de decizie din domeniul tehnologiei și al afacerilor, pentru că aceștia trebuie să ia niște decizii foarte mari în ceea ce privește stivele de tehnologie, care în unele cazuri au rămas doar de luni întregi. Vechimea de optsprezece luni nu este acum un număr înspăimântător pentru unele dintre cele mai interesante și noi platforme de baze de date open-source. Și încep să îmbine platformele și devin și mai noi și mai interesante.

Cred că vom avea o discuție minunată astăzi despre modul în care toate acestea au afectat platformele tradiționale de baze de date și modul în care acestea răspund la acestea, precum și tipurile de tehnologii care sunt aruncate în acest sens. Și cu asta în minte, o să trec acum la dr. Robin Bloor și să-i pun la punct ideile. Robin, peste tine.

Robin Bloor: Bine, mulțumesc pentru asta. Da, este un subiect prea mare. Adică, dacă ai luat doar o glumă din una dintre ilustrațiile pe care tocmai Dez ti le-a arătat, ai putea avea o conversație lungă doar despre una dintre zvelte. Dar știi, poți merge la o bază de date - mă uit la baze de date, nu știu, încă din anii 1980, și poți privi baza de date în moduri diferite. Și unul dintre lucrurile pe care mi-am dat seama că le voi face, doar să le arunc în conversație astăzi, a fost să vorbesc despre motivul pentru care s-au întâmplat lucruri perturbatoare la nivel de hardware. Și trebuie să țineți cont, de asemenea, s-au întâmplat o mulțime de lucruri perturbatoare la nivel de software, deci nu este imaginea completă a nimicului, este doar un lucru hardware.

Nici nu aveam de gând să vorbesc prea mult, ci voiam doar să vă ofer imaginea hardware. O bază de date a fost capabilitățile de recuperare a datelor care acoperă procesorul, memoria și discul și asta se schimbă dramatic. Și motivul pentru care spun asta, a fost că am învățat să înțeleg baza de date din perspectiva a ceea ce ai făcut de fapt. Știți, există o diferență de latență între datele efectiv de pe procesor și datele care sunt trase în procesor din memorie, iar datele sunt trase de pe disc în memorie și prin procesor. Iar vechile arhitecturi ale bazelor de date încercau doar să echilibreze asta. Știi, ei spuneau: „Ei bine, acest lucru merge foarte lent, vom memora în cache datele de pe disc, astfel încât să rămână în memorie. Vom încerca să facem acest lucru într-un mod cu adevărat exact, astfel încât o proporție foarte bună din datele solicitate să fie deja în memorie. Și vom marca datele pe CPU cât de repede putem. "

Și bazele de date au fost scrise în vechile mașini sunt scrise pentru grupuri mici. Și acum, pentru ignoranții paralelismului. Pentru că dacă veți obține unele performanțe dintr-un cluster, va trebui să faceți diferite lucruri în paralel. Paralelismul este o parte a jocului, nimic similar modului în care este acum. O să fac o plimbare prin cele întâmplate.

În primul rând, pe disc. Ei bine, discul s-a terminat, într-adevăr. Se termină destul de mult în ceea ce privește bazele de date. Cred că există o serie de contexte de arhivare a datelor, și chiar și lacuri de date foarte mari care rulează pe Hadoop, cel mai rău disc de filare este probabil viabil în zilele noastre. Într-adevăr, problema discului de filare a fost că viteza de citire nu s-a îmbunătățit în mod deosebit. Și când CPU crește viteza legii lui Moore, un fel de ordine de mărime, mai rapid la fiecare șase ani. Și amintirea a urmărit un fel, apoi acei doi au ținut pasul rezonabil unul cu celălalt, nu a fost complet complet, dar au făcut-o.

Dar la întâmplare citit pe un disc în care capul zboară pe disc, vreau să spun, în afară de orice altceva, este o mișcare fizică. Și dacă faci lecturi aleatorii de pe disc, este incredibil de lent în comparație cu citirea din memorie, parcă este de 100.000 de ori mai lent. Și destul de recent, majoritatea arhitecturilor bazelor de date pe care le-am privit în orice profunzime au citit de fapt seriale de pe discuri. Chiar doriți, într-un fel sau altul, doar să memorați memoria cache cât puteți de pe disc și să îl scoateți de pe dispozitivul lent și să-l puneți pe un dispozitiv rapid. Și puteți face multe lucruri inteligente cu asta, dar s-a terminat.

Și discurile cu stare solidă, sau unitățile flash, într-adevăr, este ceea ce sunt, înlocuiesc foarte rapid discul de filare. Și asta se schimbă din nou complet, deoarece modul în care datele sunt organizate pe un disc, este organizat în funcție de modul în care funcționează discul. Este vorba, de fapt, despre un cap care se deplasează pe o suprafață de filare, de fapt mai multe capete care se deplasează pe mai multe suprafețe de filare și colectează datele pe măsură ce merg. O unitate de stare solidă este doar un bloc de lucruri pe care le puteți citi. Adică, primul lucru este că toate bazele de date tradiționale au fost concepute pentru discuri de filare, iar acum sunt re-proiectate pentru SSD. Noile baze de date pot, probabil, orice persoană care scrie o nouă bază de date în acest moment poate ignora, probabil, discul rotativ, nu se gândește deloc la asta. Samsung, principalul producător de SSD-uri, ne spune că SSD-urile sunt de fapt pe curba legii Moore.

Cred că erau deja de trei sau patru ori mai rapide decât discul învârtit, dar acum vor ajunge mult mai repede la fiecare 18 luni, practic. Dublă în viteză și de 10 ori în viteză până la aproximativ șase ani. Dacă asta a fost doar asta, totuși, nu-i așa, așa cum vă voi spune într-o clipă. Discul de filare devine desigur un mediu de arhivare.

Despre memorie. Primele lucruri, RAM. Raportul CPU între RAM pe CPU crește tot timpul. Și, desigur, într-un fel, oferă o viteză mult mai mare, pentru că acrele de memorie pe care le puteți avea acum pot stoca mult mai multe. Ceea ce face de fapt este, reduce genul de presiune asupra aplicațiilor MLTP sau aplicațiilor citite la întâmplare, pentru că este mai ușor să le rezolvi pe acestea, deoarece acum ai foarte multă memorie și, în acest fel, poți cache orice. probabil să fie citit în memorie. Însă aveți probleme cu o mulțime de date mai mare, deci datele mari nu sunt chiar atât de simple.

Și apoi avem Intel cu 3D Xpoint, iar IBM cu ceea ce numesc PCM, care este memorie de schimbare de fază, livrează ceva ce cred ei că este - ei bine, este de cel puțin 10 ori mai rapid decât SSD-urile actuale și cred că va obține foarte aproape de a avea aceeași viteză ca memoria RAM. Și, desigur, este mai puțin costisitor. Deci, anterior, aveai această structură a bazei de date cu procesor, memorie și disc, iar acum ne îndreptăm către o structură care are patru straturi. Are procesor, memorie sau memorie RAM, și apoi acest tip de memorie mai rapidă decât SSD, care este de fapt nevolatilă și apoi SSD. Și aceste noi tehnologii nu sunt volatile.

Și există memristorul HP, care nu este încă, știți, pentru că a fost anunțat acum aproximativ șapte ani, dar încă nu a apărut. Dar zvonurile pe care le aud este că HP va schimba puțin jocul și cu un memristor, așa că ai doar o nouă situație de memorie. Acest lucru nu este ca și cum am avea lucruri mai rapide, este ca și cum am avea un strat cu totul nou. Și atunci am obținut faptul că accesul SSD, îl puteți citi în paralel. Nu puteți citi discul de filare în paralel, decât dacă aveți o mulțime de discuri de filare diferite. Dar un bloc de SSD, puteți citi de fapt în paralel. Și pentru că puteți citi asta în paralel, merge mult mai repede decât viteza simplă de citire, dacă configurați de fapt mai multe procese pe diferite procese de pe un singur procesor și aveți la dispoziție doar SSD.

Se estimează că puteți ridica aproape viteze de RAM făcând asta. Și tot ceea ce se spune este, viitorul arhitecturii memoriei nu este clar. Adică, realitatea este că diverșii vânzători dominanți, oricine s-ar dovedi, vor determina probabil direcția hardware-ului. Dar nimeni nu știe unde se întâmplă în acest moment. Am vorbit cu unii ingineri de baze de date care spun: „Nu mi-e teamă de ce se întâmplă”, dar ei nu știu cum să-l optimizeze din start. Și mereu ai făcut asta, așa că este interesant.

Și atunci există procesorul. Ei bine, procesoarele multicore nu au fost doar procesoare multicore. De asemenea, avem volume semnificative de memorie cache L1, L2 și L3, în special L3, ceea ce reprezintă, nu știu, zeci de megabytes. Puteți pune multe acolo, știți. Prin urmare, puteți folosi cipul ca mediu de memorie în cache. Deci, asta a schimbat jocul. Și, cu siguranță, procesarea vectorială și compresiunea datelor, o serie de furnizori au făcut asta, au târât chestiile pe procesor pentru a face totul să meargă mult mai repede la procesor. Apoi obțineți faptul că, bine, procesoarele cu GPU sunt foarte bune la accelerarea analizelor. Și chiar sunt foarte bune la anumite tipuri de întrebări, depinde doar de întrebarea dvs.

Puteți crea placi cu CPU și GPU-uri sau, așa cum face AMD în acest moment, produceți ceva numit APU, care este un fel de căsătorie a unui procesor și a unui GPU; are ambele tipuri de capacitate. Deci este un alt tip de procesor. Și apoi anunțul recent făcut de Intel că vor pune FPGA pe cip, așa mi-a intrat capul. Mă gândeam: „Cum se va întâmpla?” Pentru că dacă ai posibilitatea de CPU, GPU și aveți posibilitatea de CPU, FPGA - și, apropo, dacă doriți cu adevărat, pe aceeași placă puteți pune un procesor, un GPU și un FPGA. Nu am idee cum ar conduce de fapt ceva în acest fel, dar știu despre companii care fac astfel de lucruri și primesc răspunsuri foarte rapide la întrebări. Acesta nu este un lucru care va fi ignorat, acesta este ceva care va fi folosit de către furnizorii consacrați, și, probabil, de către noi furnizori. DBMS-urile au fost întotdeauna paralele, dar acum posibilitățile paralele tocmai au explodat, deoarece acest lucru vă permite să paralelizați acest lucru cu acela, cu acela, cu acela în diverse moduri.

În cele din urmă, pentru a mări sau a extinde? Creșterea dimensiunii este într-adevăr cea mai bună soluție, dar pentru un singur lucru. Obțineți performanțe de nod mult mai bune dacă puteți optimiza absolut performanța procesorului și a memoriei de pe disc pe un singur nod. Și veți folosi mai puține noduri, deci va fi mai ieftin, nu? Și va fi mai ușor de gestionat. Din păcate, este un design dependent de hardware și, pe măsură ce hardware-ul se schimbă, devine din ce în ce mai puțin posibil să faci asta, cu excepția cazului în care inginerii tăi vor putea să funcționeze cât de repede se schimbă hardware-ul. Și primiți probleme privind volumul de muncă, pentru că atunci când faceți o scalare, faceți diverse ipoteze despre ce va face volumul de muncă.

Dacă extindeți dimensiunea, adică dacă arhitectura dvs. pune accent pe scară înainte de creștere - de fapt trebuie să le faceți pe amândouă, este doar faptul că accentuați una. Apoi veți obține performanțe de rețea mai bune, pentru că arhitectura va face față. Va fi mai scump din punct de vedere al hardware-ului, deoarece vor exista mai multe noduri, dar vor exista mai puține probleme privind volumul de muncă și va exista un design mai flexibil.

Și doar m-am gândit că o să arunc asta, pentru că, dacă te gândești de fapt la toate schimbările hardware, doar mi-am arătat degetul spre, și atunci te-ai gândit, cum ai de gând să crezi și să extinzi aceste chestii? Atunci vă dați seama că inginerii de baze de date sunt, cel puțin după părerea mea, foarte bine plătite. Așadar, dacă încercați doar stratul hardware, provocările bazei de date sunt clare. Acum îi transmit asta lui Bert, care ne va face să ne simțim educați pe toți.

Eric Kavanagh: Asta e! Bert?

Bert Scalzo: Mulțumesc foarte mult. Lasă-mă să intru direct în aceste diapozitive. Am o mulțime de diapozitive pe care să le parcurg, așa că pe câteva dintre ele pot merge destul de repede. Vom vorbi despre acest „Forward Momentum: Mutarea relațională dincolo de tradițională”. Nu mai este baza de date a tatălui tău. Lucrurile s-au schimbat și, după cum spunea un vorbitor anterior, în ultimii șase-șapte ani, peisajul s-a schimbat radical.

Eu, fac baze de date de la mijlocul anilor '80. Am scris cărți despre Oracle, SQL Server, benchmarking și destul de multe alte lucruri. „Lumea se schimbă foarte repede. Mare nu va mai bate mic. Va fi cea mai rapidă bătaie de lent. ”Am adăugat„ să mă adaptez ”. Asta a fost de la Rupert Murdoch. Cred cu adevărat că acest lucru va fi adevărat. Nu vei putea face chestii din baza de date așa cum ai făcut acum 10, 15, 20 de ani. Va trebui să o faci așa cum își dorește acum afacerea.

Voi încerca să rămân puțin generic în ceea ce vă prezint, dar cele mai multe caracteristici despre care vorbesc le veți găsi în Oracle, le veți găsi în SQL Server, MySQL, MariaDB și unele dintre celelalte mari jucători. Revoluția bazei de date relaționale, sunt din nou de acord cu vorbitorii anterioare. Dacă arătați exact în jurul anului 2010, am trecut de la mașina de cursă roșie la mașina galbenă. A avut loc o schimbare semnificativă și vine în 2020, cred că veți vedea o altă schimbare radicală. Suntem într-un moment foarte interesant.

Acum, acest slide este cheia, de aceea am pus o cheie acolo. Se întâmplă toate aceste schimbări, iar pe partea stângă am tehnologie, iar pe partea dreaptă am afaceri. Și întrebarea este, care este cea care provoacă, și care este cea care susține care? Avem toate aceste modificări de hardware: discuri care coboară, dimensiunea discurilor în creștere, noi tipuri de discuri, astfel încât acestea au fost acoperite de boxele anterioare. Prețul scăderii memoriei, toate aceste versiuni mai noi de baze de date. Dar, pe partea dreaptă, avem protecție și conformitate a datelor, depozitare de date, informații de afaceri, analize, păstrarea obligatorie a datelor. Ambele părți ale ecuației conduc, și ambele părți ale ecuației vor folosi toate aceste caracteristici noi.

În primul rând, avem discul nostru tip de rotire SAS tipic, acum au până la 10 terabyți. Dacă nu ați văzut, Western Digital, HGST are ceea ce ei numesc unitatea lor de heliu, care se ridică la aproximativ 10 terabyți în acest moment. Costurile de disc rotitoare sunt destul de mici. Așa cum am menționat anterior, puteți obține discuri cu stare solidă de până la aproximativ doi terabyți, dar Samsung are o unitate de 20 de terabyte în curând. Costurile devin rezonabile. Un lucru despre care voi vorbi despre ceilalți nu a fost acela, conceptul de discuri flash. PCIe, adică PCI Express, față de NVMe, este posibil să fi auzit sau nu despre această expresie de memorie nevolatilă. Practic, NVMe va fi un înlocuitor pentru SAS și SATA și este cu adevărat mai mult un protocol de comunicare decât orice altceva. Dar aceste discuri au până la aproximativ trei terabyți acum.

Ați văzut, de asemenea, că unele unități SAS vin acum cu conectori U.2, care este un fel de conector diferit de un SAS sau SATA, care acceptă NVMe cu un disc standard - discul trebuie să îl suporte, de asemenea. Și apoi SATA cu conectori M.2, iar cei care încep să obțină NVMe. De fapt, există vânzători de notebook-uri care vând acum notebook-uri care au un disc flash NVMe în el, iar acele lucruri vor urla în comparație cu tehnologia pe care ai folosit-o înainte.

Mulți oameni nu știu care sunt toate aceste licăriri diferite. Dacă te uiți în colțul din dreapta jos, acesta este un exemplu de M.2. Puteți spune: „Bine, geam, seamănă foarte mult cu unitatea mSATA din stânga”. Dar, după cum puteți vedea, are două lacune în ace, spre deosebire de una, și este puțin mai mare. Și, de asemenea, M.2 poate veni în trei dimensiuni diferite.

Și apoi blițul PCI Express și blițul NVMe. Acum, blițul NVMe este, de asemenea, PCI Express, dar PCI Express este în mod obișnuit un algoritm de control SAS sau SATA, care a fost scris pentru discul de filare, iar NVMe este algoritmii sau tehnicile care au fost scrise special pentru flash. Și din nou, veți vedea toate acestea.

NVMe oferă destul de multe lucruri. Cred că cele două mari îmbunătățiri sunt, în colțul din dreapta sus, latența este redusă cu până la 70%. Am văzut de fapt chiar mai sus decât atât. În plus, dacă te uiți în colțul din dreapta jos, când sistemul de operare vorbește cu discul NVMe, acesta parcurge mult mai puține niveluri de software. Practic, parcurgi driverul NVMe inclus acum în sistemul de operare și vorbește direct cu media. Există o mulțime de motive pentru care această tehnologie va schimba radical lumea bazei de date.

Și de multe ori, oamenii vor spune: „Păi, cât de repede este NVMe?” Știi, zilele bune, în 2004 și înainte, ne-am entuziasmat dacă am avea Ultra-320 SCSI, 300 megabyte pe secundă. Vitezele de astăzi, mulți dintre voi sunt probabil pe fibre sau InfiniBand, iar genurile de top. NVMe acolo, în dreapta, începe de unde se termină tehnologiile actuale. Ceea ce mă interesează este, PCI Express 3.0 cu o legătură pe opt benzi începe de la aproape 8000 și va crește pe măsură ce vom primi versiuni mai noi de PCI Express, versiunile patru și așa mai departe. NVMe nu are unde să meargă decât în ​​sus.

Acum, care sunt unele dintre lucrurile care se schimbă în baza de date? Acum, în colțurile din dreapta sus ale diapozitivelor mele, am pus motivele pentru afaceri, cred că tehnologia a apărut. În acest caz, din cauza stocării de date și din motive de reglementare pentru păstrarea obligatorie a datelor, bazele de date încep să ofere compresie în ele. Acum, unele baze de date oferă compresie ca un supliment, altele o oferă ca fiind încorporată standardului, să spunem că ediția de întreprindere a bazei de date și, totuși, unele baze de date, ca în Oracle, ar putea avea chiar și o versiune mai bună a compresiei, în, să zicem, platforma lor Exadata, așa că au construit de fapt hardware care poate suporta o compresie foarte specializată, iar cea din Exadata, de exemplu, primește o rată de compresie de 40x, deci este foarte semnificativă. Și cred că este păstrarea obligatorie a datelor, oamenii vor doar date mai mult. Întreprinderile, pentru a face analize și BI au nevoie de date în ultimii 5, 10, 15 ani.

Acum o altă caracteristică care a început să apară chiar în jurul acelei perioade din 2008, 2009 a fost partiționarea. Din nou, veți găsi acest lucru în baze de date precum Oracle, SQL Server și în cele două pe care trebuie să le plătiți. În Oracle trebuie să cumpărați opțiunea de partiționare și în SQL Server trebuie să fiți în ediția centrului de date. Este tehnica dvs. tradițională de împărțire și de cucerire, iar ceea ce faceți este să aveți conceptul de masă logică mare în partea de sus acolo și atunci când este pus pe disc, de fapt este împărțit în găleți. Și puteți vedea că acele buchete sunt organizate după anumite criterii pentru separarea, în mod obișnuit referite sau denumite funcția dvs. de partiționare, și, de asemenea, puteți de asemenea subdiviza în unele platforme de baze de date și puteți merge chiar mai departe.

Din nou, cred că atât stocarea de date, cât și păstrarea obligatorie a datelor au împins acest lucru, iar în unele dintre aceste baze de date puteți avea până la 64.000 de partiții și cred că în alte baze de date chiar și până la 64.000 de sub-partiții. Acest lucru vă permite să împărțiți datele dvs. în piese gestionabile. De asemenea, veți partitiona indexurile; este o opțiune, nu trebuie să o faceți, dar vă puteți partiționa și indexurile. Unul dintre motivele pentru a face acest lucru ar putea fi faptul că aveți o fereastră glisantă de date. Doriți să păstrați date de 10 ani, dar pentru a arunca indexurile pentru a rula sarcina lotului din această seară, nu doriți să aruncați indexurile pe fiecare rând, doar pe rândurile care sunt în cupa curentă. Partiționarea este de fapt un instrument administrativ foarte bun, deși majoritatea oamenilor consideră că beneficiul său mare este să eliminiți partițiile din planurile dvs. și, prin urmare, să grăbiți întrebările. Este un fel de gheață pe tort.

Acum probabil că ați auzit despre ascuțire și probabil vă gândiți: „Ei, de ce ați introdus acest slide aici?” Acesta este unul dintre acele NoSQL - acesta este unul dintre acele medii de tip Hadoop. Oracle 12c a lansat două, care nu este încă G8, dar care este arătat sau previzualizat are de fapt o clarificare. Veți avea un sistem de baze de date tradițional precum Oracle și veți putea să vă descurcați ca în cazul modelului Hadoop, și astfel veți avea o altă tehnică de împărțire și cucerire care va împărți tabel-înțeles în rânduri în grupări pe nod și acest lucru va fi - la fel ca ceea ce vedeți în unele baze de date NoSQL. Și de fapt MySQL, puteți realiza acest lucru destul de mult folosind una dintre tehnicile lor de clustering, dar vine la o bază de date tradițională și cred că Microsoft nu va dori să rămână în urmă. Aceste două joacă salturi între ele tot timpul, așa că m-aș aștepta să văd ascuțit în versiunea următoare a SQL Server.

Gestionarea ciclului de viață a datelor, din nou păstrarea obligatorie a datelor, dar și pentru informații și analize de afaceri. Într-adevăr, aceasta este o tehnică de împărțire și de cucerire și, de obicei, DBA-urile fac acest lucru manual, și anume: „O să păstrez datele din acest an pe discuri rapide, datele de anul trecut pe discuri ușor mai lente, poate mă duc să păstrez ultimii doi ani înainte de asta pe discuri și mai lente și atunci voi avea o metodă de arhivare. ”De obicei nu mai este înregistrat, de obicei - ai un fel de spațiu de stocare atașat la rețea sau un dispozitiv care are multe de stocare și este, știi, rentabil, dar încă se învârte disc.

Și, acum, puteți efectiv - atât pe Oracle, cât și pe SQL Server - puteți achiziționa o opțiune în care definiți regulile, iar acest lucru se întâmplă automat în fundal. Nu mai trebuie să scrii scripturi, nu trebuie să faci nimic. Și dacă ați văzut SQL Server 2016, care tocmai a apărut primul iunie, există o nouă caracteristică numită „Stretch Database”, care vă permite practic să faceți - în colțul din dreapta jos - puteți trece de la mai multe straturi direct în cloud și din nou aceasta este o caracteristică care este încorporată în baza de date, spuneți ceva de genul: „Dacă datele au mai mult de 365 de zile, vă rugăm să o mutați în cloud și, știți, faceți-o automat pentru mine.”

Aceasta va fi o caracteristică foarte interesantă, de fapt mă gândesc că poate fi ceea ce vom vedea în viitor, ceea ce înseamnă că veți avea baze de date hibride în care veți păstra unele localuri iar unii în nor. Înainte de aceasta, oamenii se gândeau: „Oh, fie o să fac pe premiză, fie o voi face pe cloud”. Acum vedem căsătoria celor două tehnologii în acest mod hibrid. Cred că asta va fi destul de mare și Microsoft a ajuns acolo mai întâi.

Redacția, aceasta se datorează protecției și conformității datelor. Acum, în vremurile bune, am fi putut spune: „Hei, dezvoltator de aplicații, atunci când afișați acest lucru în raport, atunci când afișați acest lucru pe ecran, aici sunt câteva lucruri de securitate pe care ar trebui să le verificați și vă rog, să știți, să afișați doar datele ar trebui să vadă sau să mascheze sau să redacteze datele pe care nu trebuie să le vadă. ”Ei, așa cum este de obicei, atunci când o împingeți către aplicație nu este făcută pe un singur loc, așa că se face altfel sau nu nu se termină în unele locuri. Și acum acum aveți această capacitate în sistemele de baze de date.

Acum, în SQL Server 2016, această caracteristică este încorporată, astfel încât nu este încă un element de cost opțional care să fie încă pe adăugarea centrului de date, cred; iar în Oracle 12 trebuie să cumpărați suplimentul de gestionare a ciclului lor de viață, dar acesta este ceva nou și din nou este condus de afacere. Și mai ales pentru că acum păstrezi atât de multe date și faci mineritul de date, deci BI și analitice, trebuie să știi cine accesează ce date și să te asiguri că le este permis să vadă doar ce au voie să vadă.

De asemenea, priviți din nou la aceasta, la protecția și conformarea datelor. Vei constata că multe dintre sistemele de baze de date acum comprimă, sau îmi pare rău, criptarea directă în baza de date și ceea ce este important în legătură cu această criptare, dacă te uiți la săgeata în jos și săgeata sus în diagrama pe care o scrie în jos pe disc criptat și apoi îl citește înapoi în memorie și îl decriptează. Acesta este de fapt un model, există un alt model care ar face-o, de fapt, numai atunci când comunică datele din rețea cu aplicația client reală.

În acest caz, ar fi încă pe serverul de baze de date în memorie, ar putea fi criptat și decriptat numai atunci când este trimis la aplicația client. Există două modele diferite aici și le veți găsi în bazele de date, iar de fapt una dintre bazele de date care tocmai au adăugat acest lucru a fost MariaDB în versiunea lor 10.X; Cred că sunt pe 10.1 sau 10.2 acum. Și de fapt am făcut niște analize comparative cu privire la această criptare și, pentru a obține această criptare, am experimentat doar o scădere de aproximativ 8% a debitului sau a vitezei. Într-un test de evaluare comparativă, criptarea nu a cauzat atât de mult și, prin urmare, este o caracteristică foarte utilă.

Acum, am menționat mai devreme despre memoria flash și SSD-uri și lucruri de genul acesta. Una dintre caracteristicile pe care le aveți în Oracle și SQL Server pe care o mulțime de oameni nu își dau seama este că puteți lua un flash sau SSD care este pe serverul dvs. de baze de date și puteți spune la baza de date: „Folosiți acest lucru ca și cum ar fi memorie. Tratați memoria RAM ca preferențială, dar prefaceți-vă că este o memorie lentă și folosiți-o ca un cache extins. ”Acum, în SQL Server 2014, aceasta a apărut și a fost numită„ Buffer Pool Extension ”, este gratuită. În Oracle, acesta a apărut în 11g R2 și a fost numit „Baza de date Flash Cache” și a fost gratuit și acolo.

Totuși, sfatul meu este să testați cu atenție această caracteristică. De fiecare dată când creșteți memoria cache mai mare când mergeți să faceți o căutare, este nevoie de mai mult timp. Dacă puneți o placă flash cu trei terabyte și spuneți în baza de date: „Adăugați asta în memoria voastră”, de fapt, s-ar putea să constatați că ceva a încetinit din cauza timpului de a privi și a vedea că este în flash, este murdar sau curat? Există un punct de diminuare a revenirii. Sfatul meu este din nou test drive, vezi ce funcționează pentru tine, dar din nou, este în baza de date și în cazul Oracle, atât în ​​SQL Server cât și în Oracle, există deja de câțiva ani.

Și atunci asta ne aduce la bunicul care era baza de date în memorie și asta pentru că prețurile bazelor de date au scăzut. Celălalt motiv pentru care probabil credeți că acest lucru s-a întâmplat este că multe dintre analitice necesită ca datele să fie foarte accesibile și deci trebuie să fie în memorie. Rețineți că algoritmii pe care bazele de date le utilizează pentru a accesa aceste date, pentru a le comprima, pentru a le cripta, pentru a le stoca, știți că, în unele cazuri, unele baze de date pot continua să stocheze în memorie ca rând.

În unele cazuri, unele baze de date pot împărți acest lucru într-o coloană orientată și motivul pentru care fac asta este că obțin un nivel de compresie mult mai ridicat, undeva în jurul valorii de la 11 până la 12X, stocându-l în ordinea coloanelor versus rând. Acest lucru a apărut pentru prima dată în SQL Server 2014, a fost numit „Hekaton”. A fost crescut radical în SQL Server 2016, îl vor vedea referit de câteva nume diferite și a apărut în Oracle 12c; Spun a doua versiune aici, nu R2. Au existat două versiuni diferite de Oracle 12c, versiunea 12.1.0.1 și 12.1.0.2. Este a doua versiune a versiunii R1 a bazei de date.

Și modul în care îl definiți, obiectul din memorie este similar în ambele baze de date. Aici puteți vedea în colțul din dreapta sus, creez un SQL Server și îl puteți vedea spune cu memorie optimizată și durabilitatea fiind doar schema. Nu o să trec peste toate aceste semnificații de sintaxă, iar în Oracle este de fapt și mai simplu, doar modificați un tabel și spuneți în memorie sau nu și puteți schimba asta. Pot spune astăzi că este în memorie și mâine nu este și deci este foarte flexibil.

Am făcut câteva teste pe Oracle cu tabele din memorie, am avut niște teste care au durat aproape 40 de minute pentru a rula, acolo sus, pe rândul de sus. Acum, ceea ce este important este când am ajuns în cele două rânduri de jos, am crescut timpul de rulare sau l-am redus, ar trebui să spun, la cinci minute aproximativ, și când m-am uitat la factorul de compresie, datele din memorie erau de fapt 3, 6 la 4, 6 ori mai mic. Acest lucru este important pentru că în acest caz foloseam formatul orientat pe coloană și este compresie. Și deci ghici ce? În realitate am încadrat de aproape patru-cinci ori mai multe date în memoria mea. Nu numai că am obținut avantajul in-memory, avantajul orientat pe coloane, ci și avantajul mult mai multe date - de până la cinci ori mai multe date în memoria cache, deci este o tehnică destul de puternică. Din nou Oracle și SQL Server, vrei să te uiți la acestea, sunt caracteristici foarte frumoase. Și cu asta, cred că o voi deschide la întrebări.

Eric Kavanagh: Ei bine, Bert, în primul rând, ai fost foarte dezinteresat în toată această educație minunată. Ați putea vorbi doar un minut despre ce faceți voi? Pentru că ai o tehnologie de activare care poate facilita ceea ce ai vorbit. Vorbiți doar un minut despre ce faceți voi, apoi hai să-i aducem pe Dez și Robin în ecuația de aici.

Bert Scalzo: Da, lucrez pentru o companie numită IDERA. Suntem în Texas, avem sediul în Houston și de fapt stau în Austin chiar acum, dar am sediul în Dallas. Realizăm instrumente de bază de date și creăm instrumente de bază de date care vă ajută să rezolvați probleme. Această problemă ar putea fi ceva la fel de simplu ca productivitate, caz în care avem un instrument numit DBArtisan care vă permite să faceți sarcinile administrative ale bazei de date și este un instrument care vă permite să gestionați 12 platforme de baze de date diferite. Pot gestiona SQL Server, pot gestiona Oracle, pot gestiona MySQL, DB2, Postgres și folosesc un instrument, unul executabil, un design GUI și un set constant de fluxuri de lucru. De asemenea, creăm instrumente pentru a respecta conformitatea, avem un instrument numit SQL Compliance Manager pentru a vă ajuta să îndepliniți nevoile de conformitate. Un alt instrument numit SQL Security, așa că încercăm să facem instrumentele care vă vor ajuta să fiți eficiente și eficiente, iar ceea ce este cu adevărat plăcut dacă accesați site-ul nostru web, avem o grămadă de freeware-uri, așa că, dacă nimic altceva, mergeți să descărcați - Cred că avem 20 sau 25 de freewares. Există câteva lucruri freeware foarte bune, de exemplu, există un SQL Server și un Windows Help Check care va analiza practic ceea ce aveți și vă va spune dacă aveți probleme sau lucruri și este complet gratuit.

Eric Kavanagh: Și tu cu adevărat …

Bert Scalzo: Cu siguranță primele lucruri …

Eric Kavanagh: Voi vorbiți despre eterogenitatea de pe piață astăzi, a existat un fel de ecuație de dimensiuni unice, care, de fapt, îmi amintesc că l-am intervievat pe dr. Michael Stonebraker în 2005 când a continuat o mare apăsare vorbind despre verdictul pe mișcarea bazei de date orientată pe coloană și vorbea totul despre modul în care modelul relațional unic-potrivit-totul-a dominat timp de mai mulți ani și prezicea că toate se vor schimba, iar băiatul avea dreptate despre acea. Acum avem acest mediu cu adevărat divers și interesant, cu o mulțime de opțiuni și oportunități diferite, dar aveți nevoie de cineva care să gestioneze toate acestea și mi se pare că compania dvs. este concentrată destul de acut pe rezolvarea problemelor matematice, fiind astfel un facilitator al antet de eterogenitate, nu?

Bert Scalzo: Absolut. Adică mereu vor exista DBA-uri care să spună: „Nu vreau să folosesc un instrument GUI, fac totul cu scripturi”, știi? Ei cred că sunt tipul de DBA superman și este în regulă, dar pentru majoritatea oamenilor, vrem să lucrăm și - știi, eu folosesc Microsoft Word pentru a-mi scrie documentele. Folosesc Microsoft Outlook pentru a-mi trimite e-mailul. Adică, am instrumente pentru a face sarcini. Construim același tip de concept, construim instrumente pentru administratorii de baze de date și dezvoltatori pentru a-i ajuta să se concentreze pe ceea ce vor să facă și nu pe modul în care trebuie să o facă.

Eric Kavanagh: Asta are sens, dar permiteți-mi să vă adresez experților noștri, iar oamenii se simt liberi să se cufunde. Avem câteva comentarii venite din partea publicului. Poate, Dez, câteva întrebări și Robin câteva întrebări?

Dez Blanchfield: Sigur. Una dintre primele întrebări pe care vreau să le arunc, având în vedere amploarea enormă a experienței pe care le-ați obținut, vedeți un punct în timp curând, când vreuna dintre acestea va încetini? Sau credeți că suntem într-adevăr doar la punctul de intrare al acestei linii de creștere continuă de schimbare? Cred că una dintre cele mai mari probleme cu care se confruntă companiile și, apoi, invariabil, oamenii care încearcă să sprijine tehnologia oferită acelor companii pentru a-și conduce afacerile, este că rata schimbării este atât de dramatică încât pur și simplu nu pot să țină pasul cu toate diferitele caracteristici și software, sisteme și cadre și arhitecturi și noul cod apărând, iar hardware-ul de dedesubt, observați că ritmul actual al modificărilor încetinește imediat? Adică, aveți de-a face cu o gamă atât de largă de platforme cu întreaga suită IDERA, o să încetinesc în curând sau mai facem parte din acest tren nebun de transport de marfă de mult timp?

Bert Scalzo: Cred că suntem la primele 20 la sută din acea curbă de creștere și avem un drum lung de parcurs și există două lucruri care o împing. Tehnologia continuă să evolueze. Ați menționat câteva dintre noile tipuri de memorie care vor fi apărute, care vor fi fantastice. Samsung va avea o unitate flash de 20 de terabyte aici în curând. Asta va schimba lucrurile. Avem toate aceste baze de date NoSQL și cloud, aceasta va continua. Singurul lucru amuzant este însă când mă uit la baze de date precum Oracle și SQL Server și unele dintre altele, nu mai sunt baze de date relaționale. Pot să introduc date nestructurate în Oracle și să mențin totuși conformitatea ACID. Dacă mi-ai fi spus în urmă cu 20 de ani, aș fi spus doar că ești pe droguri.

Dez Blanchfield: Da, da, sunt mișto. Ei bine, chiar și acum motoarele care au niște verticale de nișă destul de drăguțe precum GIS, doar mai bine decât capacitatea nativă acum. Ați făcut câteva comentarii grozave cu privire la provocările cu care se confruntă DBA-urile și la diferitele momente ale DBA-urilor pe care sperăm să le vedem în jurul locului, dar cum arată lumea cu felul acela de activitate cu care vă confruntați? Adică, aceștia sunt oamenii care folosesc diferitele platforme de la managerul dumneavoastră de diagnostic, la instrumentele de inventar și până la descărcarea la defragging, cum se ocupă DBA-urile cu această schimbare și cum fac asta - știți, ce fac cu instrumentele dvs. pentru a face față acestei schimbări semnificative a peisajului lor?

Bert Scalzo: Ei bine, mă voi întoarce acum aproape 20 de ani, apoi voi spune că DBA-urile rezolvă un rol foarte specific într-o organizație. De obicei, lucrează cu o platformă de baze de date, poate două și au gestionat un număr relativ mic de baze de date. Acum transmite foarte repede astăzi și administratorul bazei de date, va cunoaște de fapt 10 platforme de baze de date. El administrează, iar acest lucru nu este o glumă, în unele cazuri mii de baze de date; adică mai mult pe lumea SQL Server sau lumea MySQL. Dar totuși în lumea Oracle ar putea gestiona sute de baze de date. Și astfel au apărut toate aceste funcții noi, au toate aceste noi platforme și au toate aceste baze de date de care sunt responsabili. Caută instrumente care să le permită productivitatea și, de asemenea, să-i ajute să învețe unele lucruri.

Și vă voi da un exemplu - dacă vreau să partiționez un tabel, este o sintaxă destul de obscură și dacă vreau să o sub-partitionez, sintaxa devine și mai dificilă. Știu ce vreau să fac, vreau să creez găleți. Dacă am un instrument precum DBArtisan care spune: „Hei, iată un ecran frumos care vă permite să vă concentrați asupra a ceea ce încercați să faceți, mai degrabă decât asupra modului în care încercați să o faceți și, oh, apropo, împingeți Afișați butonul SQL când ați terminat și vă vom arăta ce a fost SQL, astfel încât să puteți începe să aflați cu adevărat și să stăpâniți acest lucru. "

DBA-urile descoperă că instrumentele care îi ajută să își îndeplinească treaba, dar, de asemenea, îi ajută să le învețe toate aceste lucruri noi pe care le folosesc și la fel ar fi adevărat - să zicem că sunt un tip Oracle și mă duc la MySQL și spun: „Bine, creează o bază de date, DBArtisan. Acum arată-mi SQL pentru că mă întreb cum este să creezi o bază de date pe MySQL și am învățat doar să sintaxez. ”Și, astfel, nu numai că îi ajutăm să lucreze pe baza de date, ci îi educăm și pe baza de date.

Dez Blanchfield: Devine și mai interesant când ieșiți la unele dintre cele mai moderne - sau nu mai moderne, asta nu este un lucru corect de spus - dar, odată, o bază de date este o bază de date. În aceste zile văd tot ce vorbești acolo, cu provocarea adăugată pe care tehnologia o pilesc pe care, în mod tradițional, o vedem de la furnizori și în felul în care te descoperi în open source și, de asemenea, că sunt bune. Nu doar că se ocupă de motoarele bazei de date și de limbajele de interogare, ci se ocupă și de tipurile de date, structurate și nestructurate, știi, provocarea de a avea de a face cu totul, de la capătul îndepărtat al spectrului unui HDFS multi-petabyte mediu la containere mici și pachete fișiere și diverse formate de fișiere jurnal.

Și cred că asta este ceva ce acum vedem unde nu există nici o ființă umană, indiferent cât de superman, superwoman, orice ar crede că ar fi, ei fizic, pur și simplu nu pot face față mental acestei rate a schimbării și scara variațiilor. Cred că suita de instrumente pe care le oferiți acum va ajunge într-un punct în care acestea vor fi aproape într-un set implicit din mai multe moduri, astfel încât să nu putem rula mediile de baze de date pe care le avem fără ele, deoarece doar fizic nu pot arunca atât de multe corpuri la ei. Mi-a plăcut foarte mult prezentarea ta. O să trec la Dr. Robin Bloor, sunt sigură că are și o mulțime de întrebări pe care să le arunce și la tine.

Robin Bloor: Bine. Ei bine, cu siguranță am întrebări. Bert, nu știu unde te duci - am avut o discuție cu adevărat interesantă acum câteva zile, unde cineva a început să îmi povestească despre cea mai recentă protecție a datelor DU și mi se părea din ce spuneau că este incredibil draconian în ceea ce privește lucrurile la care au insistat. M-am întrebat dacă te-ai uita de fapt la asta; este ceva cu care ești familiar?

Bert Scalzo: Absolut. Da.

Robin Bloor: 2016, bine, spune-ne despre asta.

Bert Scalzo: Și de fapt …

Robin Bloor: Profund interesant.

Bert Scalzo: De fapt, am lucrat un timp pentru un furnizor de flash, în zona lor de baze de date ajutându-i să creeze produse flash pentru baze de date și pot să vă spun că draconianul se duce până la capăt. Ce vreau să spun este că, dacă vă amintiți singura mea diapozitivă, am spus că în unele baze de date va face criptarea, dar o pune în memoria serverului și în unele baze de date criptarea - este încă criptată în memoria serverului, este decriptată doar atunci când acesta este trimis clientului. Ei bine, ceea ce veți găsi, de asemenea, este o parte din aceste standarde guvernamentale, în special Departamentul Apărării sau militar aici, în SUA, de asemenea, merg până la nivelul flash și vor să știe nu numai că susțineți criptarea și decriptarea în hardware-ul tău, dar asta dacă cineva a furat cipurile care - știi, le-a scos din lucrul tău, din serverul tău, că ceea ce există este criptat și așa, chiar dacă au stocare nu poate fi și ar până la actual - nu la partea flash în sine, ci până la jetoane individuale. Au vrut să știe acel cip după cip, totul a fost criptat.

Robin Bloor: Uau. Vreau să spun că există o mulțime de lucruri care - știți, cred că a fost doar unul sau două diapozitive pe care le-ați adus în discuție, dar a fost ceva, un scenariu care cred că este cu adevărat interesant. Redactarea informațiilor, de exemplu, trebuie să fie un pic mai inteligent decât să maschezi diferite domenii, deoarece mai ales cu învățarea automată în zilele noastre, poți face lucruri deductive care îți permit să ieși la suprafață informații pe care nu le puteai supraviețui.

Dacă încercați să protejați, să spunem informații despre sănătate, atunci aceasta este o regulă foarte draconică în SUA în ceea ce privește informațiile despre sănătate, dar puteți, de fapt, folosind diverse tehnici de învățare a mașinilor, puteți găsi de multe ori cine este informația medicală a cuiva. de fapt este. M-am întrebat doar dacă aveți ceva de spus despre asta, deoarece toți cred că este o zonă interesantă.

Bert Scalzo: Da, absolut, și folosesc doar acest exemplu, nu încerc să spun că o bază de date este mai bună decât alta, dar acesta este un exemplu foarte bun pentru ceea ce tocmai ai întrebat. În Oracle, de exemplu, dacă nu am voie să văd un rând de date, de exemplu, nu am voie să văd fișa medicală a lui John Smith. În Oracle, dacă spun: „Selectează înregistrarea”, voi fi blocat sau voi avea voie să văd ce am voie să văd și va fi redactat. Și dacă spun: „Selectați steaua contului din tabelul unde este egal cu John Smith”, voi primi zero.

În SQL Server, poate face redaction, dar are unele găuri. Dacă spun: „Selectați steaua contului de pe tabelul în care este egal cu John Smith”, de fapt voi primi înapoi una, așa că știu că există un John Smith. Unul este mai sigur decât celălalt. Acum mă aștept ca ei să remedieze asta, ei joacă mereu broască leapă între ei. Și, din nou, nu încerc să fac diferența între bazele de date decât să arăt un exemplu de - uită-te despre ce vorbim acum, ceva atât de simplu precum un cont select trebuie redus și de redarea, chiar dacă, din punct de vedere tehnic vorbind, nu există nimic redactat decât existența rândului.

Robin Bloor: Da, nu. Este interesant. Adică, o altă întrebare generală, deoarece nu am foarte mult timp, este doar despre îmbunătățiri. Adică ai fost într-unul în care știu că ne-ai arătat exemple de diferite rezultate ale testelor pe care le-ai rulat - crezi că bazele de date tradiționale, hai să le numim bazele de date dominante, SQL Server și Oracle, nu? credeți că vor rămâne înainte de finalizare? Sau credeți că vor fi de fapt prinși de unul sau altul de diverse tipuri de perturbări de pe piață, care chiar se ocupă de ele? Care este parerea ta?

Bert Scalzo: Am o opinie și este - știi, din nou, voi spune că este părerea mea - Microsoft, de exemplu, în epoca post-Ballmer impresionează doar dracul din mine. Vreau să spun că această bază de date întindere obține SQL Server pe Linux, obținerea .NET peste Linux, preluarea PowerShell pe Linux; Nu cred că furnizorii de baze de date tradiționale vor rămâne în urmă. Cred că au decis: „Hei, lăsați-i pe noii băieți, startup-urile să definească ceva. Permiteți-le să-și dea seama care este ascuțirea și cum ar trebui să fie perfecționată și, după ce au făcut toate cercetările și dezvoltarea, știm exact ce vor utilizatorii, acum să adăugăm ascuțirea la Oracle. ”Cred că devin deștepți și spunând: „Hei, a fi al doilea sau al treilea nu este rău când ești jucătorul dominant, deoarece atunci oamenii nu vor migra din tine.”

Robin Bloor: Da, vreau să spun că este o strategie folosită. Adică IBM obișnuia să facă asta și întregul - pentru toate gamele lor de produse și evaluează rezonabil bine până când cineva vine cu ceva care se află complet în afara peretelui la care nimeni nu s-a gândit vreodată, dar nu poți planifica împotriva oricum.

Întrebări din partea publicului, Eric?

Eric Kavanagh: Da, dar ai timp să cred că poate doar pentru unul și știu că Bert trebuie să alerge. S-a întâmplat ceva aici - în regulă, arhitectura de ascuțire a Oracle 12c este aceea că o indicație a - sau care este această indicație în opinia dvs., ce credeți că se întâmplă acolo?

Bert Scalzo: Ei bine, Oracle absoarbe sau / și oferă tot ceea ce sunt toți ceilalți furnizori de baze de date. De exemplu, pot pune date nestructurate în Oracle. Nu știu cum puteți pune date nestructurate și apoi numiți o bază de date relațională, deci nu are niciun sens, dar puteți. Și acum Oracle adaugă ascuțirea, așa că Oracle spune: „Știi ce? Orice vrea piața, vom face oferta noastră de baze de date, deoarece piața vrea ceea ce piața își dorește și vrem să oferim soluția, dorim ca ei să rămână cu noi. ”

Cred că veți vedea articole suplimentare. Nu m-ar mira să văd grupul de noduri al bazei de date asemănător lui Hadoop, nu într-un rack Oracle sau într-un cluster de aplicații reale, dar, practic, în mai multe tipuri de clustering tip Hadoop, care fac asta de ascuțire. Și, deci, cred că veți putea să implementați o bază de date precum Oracle, cum ar fi un Hadoop, iar aceste tendințe vor continua. Acești mari furnizori de baze de date, fac miliarde de dolari și nu vor să își piardă piața, așa că sunt dispuși să se adapteze la orice sau să adopte ceva.

Eric Kavanagh: Păi, știi, este amuzant pentru că am urmărit vânzătorii cu sursă deschisă destul de mult timp și m-am întrebat toate acestea, cât de mare va avea un impact asupra tehnologiei tradiționale cu uși închise și de ceva timp sigur m-am simțit ca vânzătorii open-source făceau niște progrese serioase și acum, când mă uit la piață, văd un fel de ceea ce spui, că băieții mari și-au făcut matematica, și-au ascuțit creioanele și și-au dat seama cum ei pot țese o mulțime de lucruri în arhitecturile lor. Fie că este vorba de IBM, sau de Oracle, sau de SAP - am fost doar la SapphireNow Conference luna trecută și Steve Lucas, care conduce jumătate din acea companie, s-a lăudat că SAP încorporează acum în platforma lor cloud HANA, componente mai open-source decât oricare dintre concurenți. Dacă faci matematica pe asta, este o afirmație destul de impresionantă și îmi spune că băieții mari nu vor pleca nicăieri în curând.

Bert Scalzo: Nu, mi-aș paria banii pe amândoi. Adică, dacă te uiți, stocul Microsoft recent a fost de aproximativ 50 de dolari și, știi, acum câțiva ani era la 25. Nu îți dublezi prețul acțiunilor într-o perioadă scurtă, decât dacă faci lucruri bune și, Știi, de la a face totul, de la Windows 10, fiind gratuit pentru primul an până la toate celelalte lucruri inteligente pe care le fac, această caracteristică de bază de date extensivă cred că este doar fenomenală. Cred că ceea ce se va întâmpla este că o mulțime de persoane vor ajunge în Azure, nu direct, nu cum ar fi spus: „Hai să-mi migrez baza de date către Azure.” Va migra acolo acolo magic, deoarece va fi arhivat Acolo, folosind această nouă caracteristică a bazei de date întinse, deci adoptarea Azure va duce la o singură declanșare.

Eric Kavanagh: Ei bine, aceasta este una dintre tendințele de pe piață pe care chiar le pot vedea, chiar și pe Mac. Pe măsură ce intrați în Mac-ul dvs. pentru a salva unele documente, ei acum - și Mac-urile mai noi urmează doar prin cloud, nu? Adică, există mult sens în acea strategie și, de asemenea, mă uit la ea și mă duc: „Bine, băieți, încercați să mă atrageți bucată cu bucată în mediul dvs. de cloud și apoi într-o zi când vreau să vizitez un film dacă cardul meu de credit a expirat. O să am probleme. ”

Bert Scalzo: Da, dar o faci pe Facebook.

Eric Kavanagh: Da. Este adevărat.

Bert Scalzo: Pui totul pe Facebook.

Eric Kavanagh: Ei bine, nu chiar totul.

Bert Scalzo: Nu, vreau să spun …

Eric Kavanagh: Da, mergeți mai departe.

Bert Scalzo: Aceste tendințe sociale ajung la întreprinderi. Acum, întreprinderile mai au o mulțime de alte lucruri pe care trebuie să le facă, dar văd aceste tendințe și fac aceleași lucruri. Nu văd nici Oracle, nici Microsoft plecând. De fapt, o să cumpăr stocuri pentru ambele ori de câte ori va fi o baie.

Eric Kavanagh: Da, într-adevăr. Ei bine, oameni buni, accesați idera.com, IDERA dot com. Așa cum a spus Bert, au o mulțime de lucruri gratuite acolo și este una dintre noile tendințe de pe piață - îți oferă câteva lucruri gratuite cu care să te joci, să te agăți și apoi te duci să cumperi lucrurile adevărate.

Oameni buni, aceasta a fost o altă tehnologie fierbinte. Mulțumesc pentru timpul acordat astăzi, Bert, Dez, desigur, și Robin. Vom vorbi săptămâna viitoare, oameni buni, multe lucruri care se întâmplă. Dacă aveți idei, nu ezitați să vă trimiteți prin e-mail cu adevărat, . Vom vorbi cu voi data viitoare, aveți grijă. Pa! Pa.

Îndepărtarea impulsului: trecerea relațională dincolo de tradițional