De personalul Techopedia, 22 septembrie 2016
Take away : Gazda Rebecca Jozwiak discută analize de margine cu Dr. Robin Bloor, Dez Blanchfield și Shawn Rogers de la Dell Statistica.
În prezent nu sunteți autentificat. Vă rugăm să vă conectați sau să vă înregistrați pentru a vedea videoclipul.
Rebecca Jozwiak: Doamnelor și domnilor, salut și bine ați venit la Hot Technologies din 2016. Astăzi avem „Edge Analytics: IoT Economy at Last”. Numele meu este Rebecca Jozwiak. Voi fi moderatorul dvs. pentru transmisia web de astăzi. Facem un tweet cu un hashtag de # HOTTECH16 dacă doriți să vă alăturați conversației pe Twitter.
Deci, IoT, cu siguranță un subiect fierbinte anul acesta și internetul lucrurilor, este cu adevărat despre datele despre mașină, datele despre senzori, datele de jurnal, datele dispozitivului. Nimic din acestea nu este nou, am avut acel tip de date pentru totdeauna, dar este faptul că nu am reușit să le folosim și acum vedem doar o mulțime de moduri noi de a utiliza aceste date. În special în industria medicală, piețele financiare, cu petrol și gaze, mărfuri, este doar o mulțime de informații care anterior nu au fost exploatate. Și nu foarte mulți oameni au obținut cu adevărat o înțelegere a modului de a face asta bine. Vorbim despre o mulțime de date puține, dar este vorba de o mulțime de date și, știți, sunt probleme de rețea implicate, există hardware implicat sau trebuie să fie procesate și cum faceți asta fără să vă blocați sistemul? Ei bine, despre asta vom învăța astăzi.
Iată gama noastră de experți. Îl avem pe Dr. Robin Bloor, analistul nostru principal la The Bloor Group. Avem și Dez Blanchfield, omul nostru de date din The Bloor Group. Și ne bucurăm că îl avem pe Shawn Rogers, directorul marketingului și canalelor globale de la Dell Statistica. Și cu asta, voi trece mingea lui Robin.
Dr. Robin Bloor: Bine, mulțumesc pentru asta. Voi apăsa un buton și voi arunca o lamă. Nu am idee de ce am creat această imagine apocaliptică pentru internetul lucrurilor. Posibil pentru că cred că va deveni haotic până la urmă. Voi merge mai departe. Acest lucru este egal pentru curs în orice prezentare IoT. Trebuie, într-un fel sau altul, să spui ceva scandalos în cazul în care merge totul. Și de fapt, cea mai mare parte a acestui lucru este probabil adevărată. Dacă vă uitați efectiv la modul în care aceste curbe se extind treptat. Știi, probabil că computerele personale, smartphone-urile și tabletele vor continua să crească. Televizoarele inteligente vor crește probabil. Wearables, probabil că explodează chiar acum, în comparație cu ceea ce erau acum câțiva ani. Mașinile conectate, inevitabil că aproape toate mașinile vor fi conectate în întregime și transmiterea completă a datelor tot timpul. Și orice altceva. Și acest grafic special de BI Intelligence indică faptul că orice altceva va depăși lucrurile evidente foarte repede.
Ce să spun despre IoT? Primul lucru este doar un punct arhitectural. Știi, când vei obține date și te vei prelucra, într-un fel sau altul, va trebui să le combini pe cele două. Și cu date la volumele pe care le are acum și care se adună în diverse locuri, cele două nu mai sunt în mod natural împreună. Cred că erau în vechile perioade principale, cred. Deci, vă puteți gândi în ceea ce privește existența unui strat de procesare, a unui strat de transport și a unui nivel de date. Și într-un fel sau altul, stratul de transport în zilele noastre va muta procesarea sau va muta datele prin rețele. Iată opțiunile: Puteți muta datele în procesare, puteți muta prelucrarea la date, puteți muta procesarea și datele într-un punct de execuție convenabil sau puteți să înlăturați prelucrarea și să fragmentați datele. În ceea ce privește internetul lucrurilor, datele sunt deja limitate la naștere, iar probabilitatea este ca o mare parte a procesării să fie întreruptă pentru ca aplicațiile care trebuie executate să poată avea loc.
Așa că am pictat o imagine. Lucrul interesant pentru mine despre IoT, vorbesc despre un domeniu de agregare din această diagramă și subliniez că există subdomenii. Așadar, vă puteți imagina că domeniul IoT 1 aici este o mașină de un fel, iar domeniul 2 și domeniul 3 și domeniul 4, sunt mașini de un fel și veți agrega date la nivel local, veți rula aplicații locale pe aceste date și vei pune în acțiune diverse lucruri. Dar pentru a avea analize despre toate mașinile, va trebui să transferați date către centru, nu neapărat toate datele, dar va trebui să agregați în centru. Și dacă vă gândiți la acest lucru, atunci poate doriți să aveți multe domenii de agregare diferite la același set de lucruri IoT. Și domeniile în sine ar putea agrega în continuare. Deci, ai putea avea această ierarhie repetantă. Și practic ceea ce avem acolo este o rețea incredibil de complexă. Mult mai complex decât orice trebuia să avem înainte.
Am o notă în partea de jos aici. Toate nodurile de rețea, inclusiv nodurile frunze, pot fi creatoare de date, magazine de date și puncte de procesare. Și asta vă oferă o posibilitate de distribuție, de genul pe care nu l-am mai văzut până acum. Dez va vorbi ceva mai mult despre asta, așa că voi trece la acest punct. Odată ce suntem pe internetul lucrurilor și toate datele s-au rezolvat efectiv în a fi evenimente, ideea despre această diapozitiv este doar să indicăm că va trebui să standardizăm evenimentele. Trebuie să trebuiască, cel puțin, va trebui să avem asta. Vom avea ora la care a avut loc evenimentul, locația geografică în care s-a produs, locația virtuală sau logică a procesului care l-a creat, dispozitivul sursă care l-a creat, ID-ul dispozitivului, astfel încât să știți exact ce dispozitiv sursă l-a creat, proprietatea din date și actori, acei oameni care au dreptul să utilizeze datele într-un fel sau altul, va trebui să-și poarte permisiunile cu el, ceea ce înseamnă că va trebui să poarte securitate cu el, și atunci va exista datele în sine. Și când te uiți la asta îți dai seama de asta, știi, chiar dacă ai un senzor care nu face altceva decât să raporteze temperatura a ceva în fiecare secundă, de fapt, există destul de multe date doar pentru a identifica exact unde sunt datele. este originar și ce este de fapt. Apropo, aceasta nu este o listă exhaustivă.
Deci, în ceea ce privește peisajul IT viitor, modul în care îl văd este acesta: că nu este doar internetul lucrurilor, există și faptul că vom fi într-o lume a activității bazate pe evenimente și, prin urmare, va trebui să aibă arhitecturi bazate pe evenimente, iar acele arhitecturi vor trebui să extindă rețele mari. Și celălalt lucru este totul în timp real, nu este neapărat cazul pentru noi să fim în timp real, dar există ceva la care mă refer ca business-time, care este momentul în care datele trebuie să fie furnizate și gata. la procesat. S-ar putea să nu fie, știți, o milisecundă după ce a fost creată. Dar există întotdeauna un astfel de timp pentru fiecare informație și, odată ce aveți o arhitectură bazată pe evenimente, începe să devină mai sensibil să gândiți în termeni de abordare în timp real a modului în care funcționează lumea.
Așadar, reduceți-l, pentru că despre ce vorbim de fapt este analitica IoT. În ciuda a toate acestea, este tot timpul pentru a vedea, și nu este doar timpul de a intui, intuiția trebuie să fie urmată de acțiuni. Așadar, timpul pentru a fi înțeles și timpul pentru acțiune este ceea ce aș reduce. Acestea fiind spuse, voi trece mingea înapoi la Dez.
Dez Blanchfield: Mulțumesc, Robin. Insightful întotdeauna. Îmi place faptul că este un act greu de urmat în fiecare caz, dar voi face tot posibilul.
Unul dintre lucrurile pe care le văd și de multe ori mă distrează este să fiu sincer și nu într-o formă oblică și negativă înclinată, dar există o mulțime de preocupări și panică cu privire la internetul lucrurilor care preiau lumea și ne poți face cu ochiul și vei începe să-ți pierzi datele, așa că vreau să arunc o privire înapoi la unele dintre lucrurile pe care le-am făcut înainte în ultimele două-trei decenii, care erau un facsimil apropiat de internet de lucruri, dar poate nu chiar la aceeași scară. Și doar pentru a ne arăta că am fost de fapt aici și am rezolvat unele dintre probleme, nu la acest nivel de scară și nu cu această viteză. Pentru că înseamnă că putem rezolva efectiv problema și că știm care sunt unele dintre răspunsuri; tocmai trebuie să coborâm și să reaplicăm unele dintre învățările pe care le-am avut înainte. Și știu că aceasta este întreaga conversație pe care urmează să o purtăm și am o serie întreagă de lucruri amuzante doar pentru a discuta în secțiunea Q&A.
Dar, când ne gândim la internetul lucrurilor din cerc, în prezent există o mare centralizare la un nivel de design care a fost scris chiar în primele zile. Dispozitivele Fitbit, de exemplu, toate au tendința de a merge într-un loc central și este probabil să fie găzduite pe o platformă cloud undeva și toate datele de la toate acele dispozitive ating aceleași, să zicem doar, partea din față a unei stive, inclusiv web și servicii bazate pe aplicații și date. Dar, în timp, această scară va necesita o reinginerie pentru a face față cantității de date care vin la ele și vor reinginerii, astfel încât există mai multe capete frontale și mai multe copii ale stivei în mai multe locații și regiuni. Și vedem acest lucru și există o serie de exemple pe care le voi oferi pe care le putem discuta.
Principalul lucru este că, deși am văzut unele dintre aceste soluții pe care urmează să le acopere, amploarea și volumul de date și traficul de rețea pe care internetul lucrurilor îl va genera necesită urgent o mutare de la central pentru arhitecturile distribuite în viziunea mea și știm acest lucru, dar nu am înțeles neapărat care este soluția. Când ne gândim la ce înseamnă internetul lucrurilor, este un model de rețea pe scară largă. Sunt multe și multe lucruri care acum fac zgomot. Lucruri care nu au făcut zgomot până de curând. Și, de fapt, cred că a fost ieri, am vorbit în glumă despre stivă, dar am mers să cumpăr un nou toaster și a venit cu o opțiune care îmi putea spune diverse lucruri, inclusiv atunci când a fost nevoie de curățare. Și un nou cuptor cu microunde cu o caracteristică foarte asemănătoare și ar putea chiar să pingă o aplicație pe telefonul meu pentru a spune că lucrul pe care îl reîncălzisem era acum. Și sunt foarte mult de părere că dacă există câteva lucruri nu vreau să vorbesc cu mine, sunt frigiderul, cuptorul cu microunde și toaletele. Sunt destul de confortabil cu ele fiind dispozitive stupide. Însă am primit o mașină nouă recent, puțin Audi, și mă vorbește și sunt destul de mulțumit de asta, pentru că lucrurile despre care vorbește sunt lucruri de interes. Cum ar fi actualizarea hărților în timp real, să-mi spuneți unde există o rută mai bună pentru a ajunge din punctul A în punctul B, deoarece este detectat traficul prin diferite mecanisme cu date pe care le trimite.
Am acest diapozitiv. Am văzut deja că modelele de rețea cu volum mare necesită trecerea de la captarea centrală la distribuirea și livrarea modelelor de prelucrare a datelor și analitice. Am văzut că lucrurile se deplasează de la cele trei diagrame mici de pe marginea din dreapta unde avem, cea din stânga dintre cele trei, există un model centralizat cu toate dispozitivele mici care vin în locația centrală și colectează date și scala nu este atât de grozavă, ele fac față acolo. La mijloc avem un model și un hub și o vorbă ceva mai descentralizate, ceea ce cred că vom avea nevoie de internetul lucrurilor din următoarea generație. Și apoi, pe partea dreaptă, avem această rețea complet distribuită și plasa, care este locul în care internetul lucrurilor și mașină-mașină va merge pe termen foarte scurt în viitor, dar nu suntem destul acolo pentru o serie de motive. Și mai ales pentru că folosim până acum platforme de internet pentru majoritatea comunicațiilor și nu am construit de fapt o a doua rețea pentru a transporta o mulțime de date.
Există a doua rețele care există deja, cum ar fi rețeaua Batelco. Mulți oameni nu se gândesc la faptul că rețelele de telecomunicații nu sunt internet. Internetul este un lucru foarte separat în multe privințe. Repartizează datele de pe telefoanele inteligente prin rețelele de telefonie, apoi prin rețelele de telefon și către internet, în general, unde le plasează efectiv în două rețele. Dar este complet posibil și probabil că internetul lucrurilor va avea nevoie de o altă rețea. Vorbim despre internetul industrial ca subiect în general, pe care nu vom intra în detalii acum, dar, în esență, vorbim despre o altă rețea concepută special pentru tipurile de transport pentru date sau internet de lucruri și mașină-la-mașină comunicare.
Dar unele dintre exemplele pe care am vrut să le împărtășesc acolo unde am văzut rețele cu volum mare și datele distribuite funcționează foarte bine sunt lucruri precum internetul. Internetul a fost proiectat și arhitect special pentru prima zi pentru a putea supraviețui unui război nuclear. Dacă părțile din SUA sunt explozate, internetul a fost conceput astfel încât datele să se poată deplasa pe internet fără pierderi de pachete din motive pentru care suntem încă conectați. Și asta există și astăzi la scară globală. Internetul are multiple funcții în jurul redundanței și al pachetelor de rutare. Și, de fapt, internetul este controlat de un lucru numit BGP, Border Gateway Protocol și Border Gateway Protocol, BGP, este conceput special pentru a face față fie unui router, fie al unui switch sau al unui server care este în starea de eroare. Când trimiteți sau primiți un e-mail, dacă trimiteți trei e-mailuri la rând, nu există nicio garanție că fiecare dintre aceste e-mailuri va urma același traseu către aceeași destinație finală. Se pot muta prin diferite părți ale internetului din diverse motive. Ar putea exista o întrerupere, ar putea exista ferestre de întreținere în care lucrurile sunt offline pentru a fi modernizate, ar putea fi doar o aglomerație în rețea și vedem că, precum lucrurile precum rețelele de trafic cu mașini și transport în comun și nave și avioane. Obținem conținut pe dispozitivele noastre, cum ar fi laptopurile și tabletele și computerele noastre prin browsere și așa mai departe în fiecare zi prin rețelele de livrare a conținutului. Rețelele de livrare a conținutului se referă la preluarea copiilor conținutului de pe platforma principală de difuzare, cum ar fi serverul web și mutarea copiilor acestuia și a cantităților mici din cache către marginea rețelei și care vi le furnizează numai din partea cea mai apropiată a marginii.
Anti-spam și cibersecuritate - în cazul în care un eveniment spam are loc în Canada și Microsoft îl detectează și vede că sunt trimise o mulțime de copii ale aceluiași e-mail către un grup de persoane aleatorii, se iau verificări în acest sens, o semnătură pentru mesajul respectiv este creat și pus într-o rețea și distribuit imediat. Și astfel încât e-mailul să nu intre niciodată în căsuța de e-mail sau, dacă se întâmplă, acesta este etichetat drept spam imediat, deoarece a fost detectat în altă parte din marginea rețelei. Și astfel, alte părți ale marginii rețelei li se spune despre această semnătură a mesajelor spam și este introdus în indexul unei baze de date și dacă aceste mesaje încep să apară pe cealaltă parte a planetei, le detectăm și știm că sunt spam. Și același lucru se aplică cibersecurității. Un hack care are loc pe o parte a planetei este detectat și înregistrat și mapat și, dintr-o dată, pe cealaltă parte a rețelei, îl putem combate, arhiva regulile și politicile și se schimbă pentru a vedea dacă îl putem bloca. În special cu noul impact al lucrurilor precum refuzul de serviciu sau refuzul de serviciu distribuit în care mii de mașini sunt folosite pentru a ataca un site web central.
Bitcoin și blockchain sunt în mod implicit, în natura sa este un registru distribuit, blockchain și face față oricăror întreruperi sau ruperi din rețea. Detectarea și prevenirea fraudei, utilitățile electrice și de apă - vedem, știți rețeaua electrică, dacă o parte a rețelei primește un teren de arbore pe ea și scoate un stâlp și un fir, casa mea tot primește putere. Nici măcar nu știu despre asta, de multe ori nici măcar nu o văd în știri. Și suntem cu toții obișnuiți cu rețelele de transport, unde inițial exista un model centralizat, „Toate drumurile au dus la Roma”, așa cum spun ei, și apoi, în cele din urmă, a trebuit să mergem la modelul descentralizat cu butuci și spițe, iar apoi am mers la o rețea cu ochiuri în care puteți ajunge dintr-o parte a orașului în cealaltă prin diverse rute cu ochiuri și intersecții diferite. Și deci ceea ce vedem aici este că acest model centralizat al ceea ce facem acum cu internetul lucrurilor va trebui să se împingă până la marginea rețelei. Și acest lucru se aplică analiticii mai mult decât oricând, și este necesar să impingem analitica în rețea. Pentru a face asta, necesită o abordare complet nouă în ceea ce privește modul în care accesăm și procesăm datele și fluxurile de date, din punctul meu de vedere. Vorbim acum despre un scenariu în care cred că vedem o inteligență limitată împinsă la marginea rețelei pe dispozitivele conectate la internet, dar în curând vom vedea acele dispozitive crescând în inteligență și cresc nivelul de analiză pe care și-l doresc. a face. Și, în consecință, va trebui să îi împingem pe acești smartphone mai departe și mai departe prin rețea.
De exemplu, aplicațiile inteligente și social media - dacă ne gândim la social media și la unele aplicații inteligente, acestea sunt încă foarte centrale. Știi, există doar două sau trei centre de date pentru Facebook. Google a fost mult mai descentralizat, dar există încă un număr limitat de centre de date din întreaga lume. Atunci când ne gândim la personalizarea conținutului, trebuie să vă gândiți la un nivel foarte local. Multe dintre acestea se realizează în browserul dvs. sau la un nivel local de rețea de livrare de conținut. Și ne gândim la trackerele de sănătate și fitness - o mulțime de date colectate de la ei sunt analizate la nivel local și astfel noile versiuni ale dispozitivelor Garmin și Fitbit pe care le puneți la încheietură, devin mai inteligente și mai inteligente în dispozitiv. . Acum nu trimit toate datele despre frecvența cardiacă la un server centralizat pentru a încerca analiza. construiesc acea informație direct în dispozitiv. Navigarea în mașină, era ca mașina să primească constant actualizări și hărți dintr-o locație centrală, acum smart-urile sunt în mașină, iar mașina ia decizii de la sine și, în cele din urmă, mașinile vor plasa. Mașinile vor discuta între ele prin intermediul rețelelor wireless de o anumită formă, care ar putea fi peste o rețea wireless 3G sau 4G în următoarea generație, dar în cele din urmă va fi dispozitiv la dispozitiv. Și singurul mod în care vom face față volumului este acela de a face dispozitivele mai inteligente.
Avem deja sisteme de avertizare de urgență care vor colecta informații la nivel local și le vor trimite central sau într-o rețea de plasă și vor lua decizii cu privire la ceea ce se întâmplă local. De exemplu, în Japonia, există aplicații pe care oamenii le rulează pe smartphone-uri cu accelerometre în smartphone. Accelerometrele din smartphone vor detecta vibrațiile și mișcarea și pot determina diferența dintre mișcarea normală de zi cu zi și tremurările și șocurile unui cutremur. Și acel telefon va începe să vă avertizeze imediat, local. Aplicația reală știe că detectează cutremure. Dar, de asemenea, împărtășește aceste date printr-o rețea dintr-un hub distribuit și un model de vorbire, astfel încât persoanele de lângă tine să fie avertizate imediat sau cât mai curând posibil, ca datele să curgă prin rețea. Și apoi, în cele din urmă, când ajunge într-o locație centrală sau o copie distribuită a locației centrale, aceasta se retrage către oameni care nu se află în zona imediată, nu au detectat mișcarea planetei, dar trebuie avertizați pentru că poate vine un tsunami.
Și infrastructura de oraș inteligent - conceptul de infrastructură inteligentă, construim deja intelectul în clădiri inteligente și infrastructură inteligentă. De fapt, ieri mi-am parcat mașina în oraș, într-o zonă nouă, unde o parte din oraș este renovată și reconstruită. Și au făcut din nou toate străzile și există senzori pe străzi, iar contorul propriu de parcare știe că atunci când am intrat cu o mașină, știe că atunci când mă duc să reîmprospăteze limita de două ore, mașina nu s-a mișcat și nu m-ar lăsa de fapt să mă ridic și să rămân încă două ore. A trebuit să intru în mașină, să scot din spațiu și apoi să mă întorc înapoi pentru a o păcăli pentru a-mi permite să rămân acolo încă două ore. Dar ceea ce este interesant este că, în cele din urmă, vom ajunge la punctul în care nu este doar să detectăm mașina care intră în zonă ca un senzor localizat, ci lucruri precum caracteristicile optice în care recunoașterea se va aplica cu camerele care se uită la placa mea, și va ști că de fapt am scos și am tras înapoi și l-am păcălit și nu mă va lăsa să mă reînnoiesc și voi continua. Și apoi va distribui aceste date și se va asigura că nu pot face asta în altă parte și voi păcăli rețeaua în mod continuu. Pentru că trebuie, prin natură, să devină mai inteligent, altfel vom continua să-l păcălim.
Există un exemplu în acest sens pe care l-am trăit personal în tehnologia firewall, la sfârșitul anilor '80 și începutul anilor '90, un produs numit Check Point FireWall-1. O tehnologie firewall foarte simplă pe care am folosit-o pentru a crea reguli și a construi politici și reguli în jurul anumitor lucruri pentru a spune că tipurile de trafic prin anumite porturi și adrese IP și rețele pentru a ajunge și de la unul la altul, traficul web dintr-un loc în altul, mergând de la capătul browserului și clientului la capătul serverului nostru. Am rezolvat această problemă scoțând efectiv logica de pe firewall-uri și mutând-o efectiv în ASIC, circuitul integrat specific aplicației. Acesta controla porturile din comutatoarele Ethernet. Am constatat că calculatoarele de server, computerele pe care le foloseam de fapt ca servere pentru a lua decizii ca firewall-uri, nu erau suficient de puternice pentru a gestiona volumul de trafic care le trece prin fiecare mic control al pachetelor. Am rezolvat problema mutând logica necesară pentru a face inspecția de pachete și detectarea internetului în comutatoarele de rețea care au fost distribuite și capabile să gestioneze volumul de date care trece prin nivelul rețelei. Nu ne-am îngrijorat de asta la nivel centralizat cu firewall-uri, l-am mutat la comutatoare.
Și, astfel, am avut ca producătorii să dezvolte capabilitatea pentru a împinge căi și reguli și politici în comutatorul Ethernet, astfel încât la nivelul portului Ethernet real și poate o mulțime de oameni din piscină nu sunt familiarizați cu acest lucru pentru că suntem toți trăiau acum într-o lume fără fir, dar, odată, totul trebuia să se conecteze prin Ethernet. Acum la nivelul portului Ethernet făceam inspecția pachetelor pentru a vedea dacă pachetele aveau voie chiar să se deplaseze în comutator și în rețea. O parte din acestea este ceea ce rezolvăm acum în jurul acestei provocări de a capta date în rețea, în special de pe dispozitivele IRT, de a le inspecta și de a face analize asupra acesteia și, probabil, analitice asupra acesteia în timp real pentru a lua decizii cu privire la aceasta. Și unele dintre ele sunt pentru a obține informații despre informații de afaceri și informații despre modul în care oamenii iau decizii mai bune și alte analize și performanțe pentru lucrurile de la mașină la mașină, unde dispozitivele vorbesc cu dispozitivele și iau decizii.
Și aceasta va fi o tendință pe care trebuie să o analizăm în viitorul imediat, deoarece, dacă nu o facem, vom ajunge să terminăm cu acest pic de zgomot. Și am văzut în lumea de date mari, am văzut lucruri ca lacurile de date se transformă în mlaștini de date, care tocmai terminăm cu un diluat de zgomot pe care nu ne-am gândit cum să rezolvăm analiza procesării într-o centralizare Modă. Dacă nu rezolvăm această problemă, în opinia mea, cu IoT imediat și obținem o soluție de platformă foarte repede, vom ajunge într-un loc foarte, foarte rău.
Și cu asta în minte mă voi apropia de punctul meu de vedere, care este că cred că una dintre cele mai mari schimbări care au loc în spațiul de date și analitice este acum determinată de nevoia imediată de a reacționa la impactul internetului a lucrurilor pe analizele de volum mare și în timp real, prin faptul că trebuie să mutăm analitica în rețea și apoi în cele din urmă la marginea rețelei doar pentru a face față volumului pur, doar pentru a o prelucra. Și apoi, în cele din urmă, sperăm, introducem informația în rețea și marginea rețelei într-un model hub și a vorbit că putem să-l gestionăm de fapt și să obținem informații în timp real și să obținem valoare din aceasta. Și cu asta voi trece pe oaspetele nostru și voi vedea unde ne duce această conversație.
Shawn Rogers: Mulțumesc foarte mult. Este vorba despre Shawn Rogers de la Dell Statistica și băiat, doar pentru început, sunt total de acord cu toate subiectele majore care au fost atinse aici. Și Rebecca, ați pornit cu una în jurul ideii de, știți, aceste date nu sunt noi și este remarcabil pentru mine cât de mult timp și energie este cheltuit pentru a discuta despre datele, datele, datele IoT. Și, cu siguranță, este relevant, știi, Robin a arătat un punct bun, chiar dacă faci ceva cu adevărat simplu și te apasă într-un termostat o dată pe secundă, știi, faci asta 24 de ore pe zi și chiar ai, știți, câteva provocări interesante de date. Dar, în sfârșit, știți, și cred că o mulțime de oameni din industrie vorbesc despre aceste date în acest fel - că nu este chiar atât de interesant și, în opinia lui Rebecca, a trecut în jur de mult timp, dar în trecut nu am reușit să-l folosim foarte bine. Și cred că industria de analiză avansată și industria de BI în general încep să își îndrepte capul către IoT. Și Dez, până la punctul tău final, acesta este o parte sau unul dintre punctele provocatoare ale peisajului de date mari cred că este foarte adevărat. Cred că toată lumea este foarte încântată de ceea ce putem face cu acest tip de date, dar, în același timp, dacă nu ne putem da seama cum să aplicăm informații, să luăm măsuri și, să știți, să analizați unde sunt datele, cred vom avea provocări pe care oamenii nu le văd cu adevărat.
Acestea fiind spuse, în spațiul avansat de analiză suntem mari fani ai ceea ce credem că se poate întâmpla cu datele IoT, mai ales dacă aplicăm analitice. Și există o mulțime de informații despre acest diapozitiv și voi lăsa pe toată lumea să vâneze și să ciugulească în jurul valorii, dar dacă te uiți la sectoare diferite, cum ar fi vânzarea cu amănuntul la extremitatea dreaptă, își vede oportunitatea să apară în jurul valorii de a fi mai inovatori sau de a avea unii economiile de costuri sau optimizarea procesului sau îmbunătățirile sunt foarte importante și se văd foarte multe cazuri de utilizare pentru asta. Dacă te uiți, știi, de la stânga la dreapta peste diapozitiv, vei vedea cum fiecare dintre aceste industrii individuale revendică noi capacități și noi oportunități de diferențiere pentru ei înșiși atunci când aplică analize pentru IoT. Și cred că linia de bază este că, dacă veți încerca să mergeți pe acea cale, nu trebuie să vă îngrijorați doar de datele, așa cum am discutat și de arhitectură, dar trebuie să vă uitați cât mai bine aplicați analitica la ea și unde trebuie să aibă loc analitica.
Pentru mulți dintre noi în apelul de astăzi, știți, Robin și cu mine ne cunoaștem de foarte mult timp și am avut nenumărate conversații despre arhitecturi tradiționale din trecut, cele din bazele de date centralizate sau depozite de date ale întreprinderilor, etc. Am găsit în ultimul deceniu o astfel de activitate, noi facem o treabă destul de bună de a întinde limitele acestor infrastructuri. Și nu sunt la fel de ferme sau atât de puternice pe cât ne-am dori să fie astăzi pentru a susține toate marile analize pe care le aplicăm informațiilor și, bineînțeles, informația ar rupe arhitectura, de asemenea, știi, viteza datelor, volumul de date și așa mai departe, întind cu siguranță limitările unora dintre abordările și strategiile noastre mai tradiționale pentru acest tip de lucru. Și, așadar, cred că începe să apeleze la nevoia companiilor de a avea un punct de vedere mai agil și poate mai flexibil și asta este partea, cred, aș dori să vorbesc puțin despre partea IoT.
Înainte de a face acest lucru, voi lua un moment doar pentru a permite tuturor apelurilor, să vă oferim un pic de cunoștințe despre ce este Statistica și ce facem. După cum puteți vedea pe titlul acestui slide, Statistica este o analiză predictivă, date mari și vizualizare pentru platforma IoT. Produsul în sine are puțin peste 30 de ani și suntem în competiție cu ceilalți lideri de pe piață cu care probabil sunteți familiarizați pe linia de a putea aplica analize predictive, analize avansate la date. Am văzut o ocazie de a ne extinde domeniul în care ne-am pus analizele și am început să lucrăm la unele tehnologii cu ceva timp în urmă, care ne-au poziționat destul de bine pentru a profita de ceea ce Dez și Robin au vorbit astăzi, care este această nouă abordare și unde veți pune analitica și cum o veți topi cu datele. De-a lungul aceleiași părți apar și alte lucruri pe care trebuie să le poți aborda cu platforma, iar după cum am menționat, Statistica a fost pe piață mult timp. Suntem foarte buni în ceea ce privește combinarea datelor cu lucrurile și cred că, știți, nu am vorbit prea mult despre accesul la date astăzi, ci să putem să accesați aceste rețele diverse și să vă puneți mâna pe datele corecte la timpul potrivit devine din ce în ce mai interesant și mai important pentru utilizatorii finali.
În sfârșit, voi mai comenta încă o piesă aici, deoarece Dez a arătat un aspect bun despre rețelele în sine, având un anumit nivel de control și securitate asupra modelelor analitice din mediul dvs. și modul în care acestea se atașează de datele devin foarte importante. Când am intrat în această industrie cu câțiva ani în urmă - aproape 20 cred că în acest moment - când am vorbit despre analize avansate, a fost într-o manieră foarte curată. Doar câteva persoane din organizație au pus mâna pe ea, au desfășurat-o și le-au oferit oamenilor răspunsul în funcție de necesitate sau au oferit informații necesare. Acest lucru se schimbă cu adevărat, iar ceea ce vedem este o mulțime de oameni care lucrau cu unul sau mai multe moduri mai diverse și mai flexibile de a ajunge la date, să aplice securitatea și guvernanța asupra datelor și apoi să poată colabora la acestea. Acestea sunt câteva dintre lucrurile importante la care se uită Dell Statistica.
Dar vreau să mă afund în subiectul care este puțin mai aproape de titlul de astăzi, care este, cum ar trebui să abordăm datele care provin de pe internet a lucrurilor și ce ar putea dori să cauți atunci când te uiți la soluții diferite. Diapozitivul pe care l-am ridicat în fața ta chiar acum este un fel de vedere tradițională, iar atât Dez și Robin au atins acest aspect, știi, această idee de a vorbi cu un senzor, fie că este vorba de un automobil sau de un toaster sau o turbină eoliană, sau ce aveți, și apoi mutați datele de la sursa de date în rețeaua dvs. într-un fel de configurare centralizată, așa cum a menționat Dez. Și rețelele destul de bine și o mulțime de companii intră în spațiul IoT inițial încep să o facă cu acel model.
Celălalt lucru care a venit, dacă priviți spre partea de jos a diapozitivului, este această idee de a lua alte surse de date tradiționale, de a mări datele IoT și apoi de la acest tip de nucleu, indiferent dacă nucleul dvs. se dovedește a fi un centru de date sau s-ar putea să fie în cloud, nu contează cu adevărat, ai lua un produs precum Statistica și apoi i-ai aplica analitice în acel moment și apoi oferiți aceste informații consumatorilor de la dreapta. Și cred că este vorba de mize de masă în acest moment. Acest lucru trebuie să puteți face și trebuie să aveți o arhitectură suficient de deschisă pentru o platformă de analiză avansată și să discutați cu toate acestea, fel de surse de date diverse, cu toți acești senzori și cu toate aceste destinații diferite. ai datele. Și cred că este ceva ce trebuie să poți să faci și cred că vei descoperi că este adevărat că o mulțime de lideri de pe piață sunt capabili să facă aceste tipuri de lucruri. Aici, la Statistica, vorbim despre acest lucru ca analiză de bază. Duceți-vă datele, aduceți-le înapoi la bază, prelucrați-le, adăugați mai multe date, dacă este necesar sau dacă este avantajos, faceți analizele dvs. și apoi împărtășiți aceste informații pentru acțiune sau pentru perspectivă.
Și deci cred că acestea sunt cu siguranță din punct de vedere al funcției, probabil că toți am fi de acord că, știți, aceasta este necesitatea goală și toată lumea trebuie să facă asta. În cazul în care începe să devină un fel de interesant este locul în care ai cantități masive de date, știi, provenind din surse de date diverse, cum ar fi senzorii IoT, așa cum am menționat, indiferent că este vorba despre o mașină sau o cameră de securitate sau un proces de fabricație, începe să devină un avantaj de a putea face analitica unde se produc efectiv datele. Și cred că avantajul pentru majoritatea oamenilor, atunci când începem să mutăm analiticul de la miez la margine este această capacitate de a difuza unele dintre provocările de date care se întâmplă, iar Dez și Robin vor comenta probabil acest lucru la final. astăzi, dar cred că trebuie să fii în măsură să monitorizezi și să acțiuni asupra datelor la margine, astfel încât nu este întotdeauna necesar să transmiți toate aceste date în rețeaua ta. Robin a vorbit despre asta în imaginile sale, despre fel de arhitectură pe care le-a realizat, unde aveți toate aceste surse diferite, dar de obicei există un punct de agregare. Punctul de agregare pe care îl vedem destul de des este fie la nivel de senzor, dar chiar mai des la nivel de poartă. Și aceste gateway există ca un fel de intermediar în fluxul de date din sursele de date înainte de a vă întoarce la nucleu.
Una dintre oportunitățile de care a profitat Dell Statistica este aceea că capacitatea noastră de a exporta un model din platforma noastră de analiză avansată centralizată pentru a putea lua un model și apoi a-l executa cu acelasi model la marginea pe o platformă diferită, cum ar fi o poartă sau în interior a unei baze de date sau ce aveți. Și cred că flexibilitatea pe care ne-o oferă este ceea ce este într-adevăr punctul interesant al conversației de astăzi este, aveți asta în infrastructura dvs. astăzi? Sunteți capabil să mutați o analiză în locul în care datele trăiesc față de mutarea datelor întotdeauna în locul în care analizează dvs.? Și asta este un lucru pe care Centistica s-a concentrat de ceva timp și, în timp ce te uiți mai atent la diapozitive, vei vedea că există o altă tehnologie din partea companiei noastre surioare, Dell Boomi. Dell Boomi este o platformă de integrare a datelor și de integrare a aplicațiilor în cloud și de fapt folosim Dell Boomi ca dispozitiv de trafic pentru a muta modelele noastre de la Dell Statistica, prin Boomi și pe dispozitive de margine. Și credem că aceasta este o abordare agilă pe care companiile o vor solicita, atât cât le place versiunea pe care ți-am arătat-o acum un minut, care este un fel de idee de bază pentru a muta datele de la senzori înapoi la centru, în același timp, companiile vor dori să o poată face așa cum am conturat aici. Iar avantajele pentru a face acest lucru sunt unele dintre punctele pe care și Robin și Dez le-au făcut, adică, puteți lua o decizie și luați măsuri cu viteza afacerii dvs.? Puteți muta analizele dintr-un loc în altul și puteți economisi timp, bani și energie și complexitate pentru a vă deplasa constant aceste date de margine înapoi.
Acum sunt primul care a spus că unele dintre datele de margine vor avea întotdeauna un merit suficient de ridicat acolo unde ar fi logic să stocați aceste date și să le păstrați și să le readuceți în rețea, dar ce analize de bord vă vor permite să este capacitatea de a lua decizii cu viteza în care datele ajung de fapt, nu? Că puteți aplica perspectiva și acțiunea la o viteză în care este cea mai mare valoare posibilă. Și cred că asta este un lucru pe care îl vom căuta cu toții atunci când vine vorba de utilizarea unor analize avansate și a datelor IoT este această oportunitate de a vă deplasa la viteza afacerii sau la viteza pe care clientul o cere. Cred că poziția noastră este că cred că trebuie să poți face ambele. Și cred că destul de curând și foarte repede, deoarece mai multe companii se uită la seturi de date mai diverse, în special cele din partea IoT, vor începe să se uite la spațiul furnizorilor și să solicite ce este capabil să facă Statistica. Ceea ce este să implementăm un model în centrul atenției, așa cum am făcut-o în mod tradițional de mulți ani sau să îl implementăm pe platforme care sunt poate neontradiționale, precum o poartă IoT și să poată efectiv să marcheze și să aplice analitice la date la margine pe măsură ce datele sunt produse. Și cred că acolo vine partea interesantă a acestei conversații. Pentru că, prin faptul că putem aplica o analiză la margine în momentul în care datele ies dintr-un senzor, ne permite să luăm măsuri cât de repede trebuie, dar ne permite, de asemenea, să decidem, este necesar ca aceste date să se întoarcă imediat până la bază? Putem să-l lotăm aici și apoi să-l trimitem înapoi în bucăți și piese și să analizăm ulterior? Și asta vedem mulți dintre clienții noștri de top.
Modul în care Dell Statistica face acest lucru este că avem o capacitate de utilizare, deci spuneți, de exemplu, că construiți o rețea neurală în interiorul Statistica și ați dorit să puneți rețeaua neuronală în altă parte din peisajul dvs. de date. Avem capacitatea de a emite acele modele și toate limbile pe care le-ați observat în colțul din dreapta acolo - Java, PPML, C și SQL, etc., includem și Python și putem exporta scripturile noastre de asemenea - și pe măsură ce deplasați platforma noastră centralizată, puteți să implementați acel model sau algoritmul acolo unde aveți nevoie. Și după cum am menționat anterior, folosim Dell Boomi pentru a-l pune și a-l parca acolo unde trebuie să-l rulăm și apoi putem readuce rezultatele sau putem ajuta la readucerea datelor sau la punctarea datelor și să luăm măsuri folosind regulile noastre pentru motor. . Toate aceste lucruri devin importante atunci când începem să ne uităm la acest tip de date și ne gândim din nou.
Acesta este un lucru pe care cei mai mulți dintre voi de la telefon va trebui să îl facă, deoarece va deveni foarte scump și impozitarea rețelei dvs., așa cum a menționat Dez, pentru a muta datele din stânga acestor diagrame în dreapta acestor diagrame peste timp. Nu sună mult, dar am văzut clienți producători cu zece mii de senzori în fabricile lor. Și dacă aveți zece mii de senzori în fabrica dvs., chiar dacă faceți doar unul dintre acestea un al doilea fel de teste sau semnale, vorbiți despre optzeci și patru de mii de rânduri de date de la fiecare dintre acești senzori pe zi. Și deci datele se acumulează cu siguranță și Robin a menționat așa ceva. Înainte am menționat câteva industrii în care vedem că oamenii obțin niște lucruri destul de interesante realizate folosind software-ul nostru și datele IoT: automatizarea clădirii, energia, utilitățile este un spațiu cu adevărat important. Se constată că se lucrează foarte mult la optimizarea sistemului, chiar și la serviciul pentru clienți și, bineînțeles, la operațiunile și la întreținerea generală, în cadrul instalațiilor energetice și în clădirile pentru automatizare. Și acestea sunt unele cazuri de utilizare pe care le vedem că sunt destul de puternice.
Am mai făcut analize de margine, cred, termenul a fost inventat. După cum am menționat, la Statistica avem rădăcini adânci. Compania a fost înființată în urmă cu aproape 30 de ani, astfel încât avem clienți să se întoarcă destul de mult timp, care integrează datele IoT cu analizele lor și sunt de ceva timp. Și Alliant Energy este unul dintre cazurile noastre de utilizare sau clienți de referință. Și vă puteți imagina problema pe care o are o companie de energie cu o fabrică fizică. Mărirea dincolo de pereții de cărămidă a unei fabrici fizice este dificilă, astfel încât companii energetice precum Alliant caută modalități de a-și optimiza producția de energie, practic îmbunătățind procesul de fabricație și optimizându-l la cel mai înalt nivel. Și folosesc Statistica pentru a gestiona cuptoarele din fabricile lor. Și pentru toți cei care ne întoarcem la începuturile noastre în clasa de știință, știm cu toții că cuptoarele fac căldură, căldura face abur, turbinele se învârt, obținem electricitate. Problema pentru companii precum Alliant este de fapt optimizarea modului în care lucrurile se încălzesc și ard în interiorul acelor cuptoare mari cu cicloni. Și optimizarea producției pentru a evita costurile suplimentare de poluare, deplasarea carbonului și așa mai departe. Așadar, trebuie să poți monitoriza interiorul unuia dintre aceste cuptoare cu cicloni cu toate aceste dispozitive, senzori și apoi să iei toate aceste date ale senzorului și să faci modificări ale procesului energetic în mod continuu. Și asta este exact ceea ce face Statistica pentru Alliant încă din 2007, înainte chiar și termenul IoT era super popular.
Spre punctul lui Rebecca, mai devreme, datele cu siguranță nu sunt noi. Abilitatea de a-l prelucra și folosi corect este într-adevăr acolo unde se întâmplă lucruri interesante. Am vorbit un pic despre îngrijirea sănătății în apelul prealabil astăzi și vedem tot felul de aplicații pentru oameni pentru a face lucruri precum îngrijirea mai bună a pacienților, întreținerea preventivă, gestionarea lanțului de aprovizionare și eficiența operațională în îngrijirea sănătății. Și asta este destul de continuu și există o mulțime de cazuri de utilizare diferite. Unul de care suntem foarte mândri aici la Statistica este cu clientul nostru Shire Biofarmaceutice. Și Shire face medicamente de specialitate pentru boli cu adevărat dificil de tratat. Iar când creează un lot de medicamente pentru clienții lor, este un proces extrem de scump și acel proces extrem de scump necesită timp. Când vă gândiți la un proces de fabricație, deoarece vedeți că provocările se unifică peste toate datele, fiind suficient de flexibile pe diferite modalități de introducere a datelor în sistem, de validare a informațiilor și de a fi capabil să fie predictivi despre cum ajutăm clientul respectiv. Și procesele care au extras cea mai mare parte a informațiilor din sistemele noastre de fabricație și, desigur, dispozitivele și senzorii care conduc aceste sisteme de fabricație. Și este un caz util pentru modul în care companiile evită pierderea și optimizarea proceselor de fabricație folosind o combinație de date senzor, date IoT și date obișnuite din procesele lor.
Deci, știți, un bun exemplu despre locul în care producția și, în special, producția de înaltă tehnologie, beneficiază industria de îngrijire a sănătății în jurul acestui tip de lucrări și date. Cred că am doar câteva alte puncte pe care mi le-aș dori să le dau înainte de a le încheia și a le da înapoi lui Dez și Robin. Dar știi, cred că această idee de a putea să îți împing analitica oriunde în mediul tău este ceva care va deveni extrem de important pentru majoritatea companiilor. A fi legat de formatul tradițional de date ETL de la surse înapoi la locații centrale va avea întotdeauna un loc în strategia dvs., dar nu ar trebui să fie singura dvs. strategie. Trebuie să adoptați o abordare mult mai flexibilă a lucrurilor astăzi. Pentru a aplica securitatea menționată, evitați impozitarea rețelei dvs., pentru a putea gestiona și filtra datele așa cum provin din margine și să determinați ce date merită păstrate pe termen lung, ce date merită să vă deplasați la rețeaua noastră sau ce date trebuie doar analizate la momentul creării, pentru a lua cele mai bune decizii posibile. Această abordare analitică de pretutindeni și oriunde este ceva pe care-l luăm cu drag la Statistica și este un lucru la care suntem foarte pricepuți. Și se întoarce la unul dintre aceste diapozitive despre care am menționat mai devreme, capacitatea de a exporta modelele dvs. într-o varietate de limbi, astfel încât acestea să se potrivească și să se alinieze platformelor în care sunt create datele. Și, desigur, să avem un dispozitiv de distribuție pentru acele modele, ceea ce aducem la masă și de care suntem foarte încântați. Cred că conversația de astăzi este, dacă într-adevăr vom lua în serios aceste date care au fost în sistemele noastre de mult timp și am dori să găsim un avantaj competitiv și un unghi inovator pentru a-l utiliza, trebuie să aplicați ceva tehnologie care vă permite să vă îndepărtați de unele dintre acele modele restrictive pe care le-am folosit în trecut.
Din nou, părerea mea este că, dacă vei face IoT, cred că trebuie să poți să o faci în esență și să adaugi datele și să le asortezi cu alte date și să îți analizezi. Dar, de asemenea, la fel de important sau poate chiar mai important, trebuie să ai această flexibilitate pentru a pune analitica cu datele și pentru a-l muta pe analitic din partea centrală a arhitecturii tale către avantajele pe care le-am menționat. inainte de. Acesta este un pic despre cine suntem și ce facem pe piață. Și suntem foarte încântați de IoT, credem că va îmbătrâni cu siguranță și există multe oportunități pentru toată lumea de aici de a-și influența analizele și procesele critice cu acest tip de date.
Rebecca Jozwiak: Shawn, mulțumesc mult, a fost o prezentare cu adevărat fantastică. Și știu că Dez va muri probabil să vă pună câteva întrebări, așa că Dez, vă las să plecați mai întâi.
Dez Blanchfield: Am un milion de întrebări, dar mă voi conține pentru că știu că Robin va avea și el. Unul dintre lucrurile pe care le văd departe și larg este o întrebare care apare și sunt foarte dornic să obțin o informație despre experiența dvs. în acest sens, având în vedere că sunteți chiar în centrul lucrurilor. Organizațiile se confruntă cu provocarea și se uită că unele dintre ele au citit doar aprecierile din „A patra revoluție industrială” ale lui Klaus Schwab și apoi au avut un atac de panică. Și cei care nu sunt familiarizați cu această carte, este în esență o perspectivă a domnilor, de Klaus Schwab, care cred că este un profesor, care este fondatorul și președintele executiv al Forului Economic Mondial din memorie, iar cartea este în esență despre acest întreg internet omniprezent al exploziei lucrurilor și o parte a impactului asupra lumii în general. Organizațiile cu care vorbesc nu sunt siguri dacă ar trebui să meargă și să modernizeze mediul actual sau să investească totul în construirea întregului mediu, infrastructură și platforme noi. De asemenea, în Dell Statistica, vedeți că oamenii își modernizează mediile actuale și își desfășoară platforma în infrastructura existentă sau îi vedeți să își îndrepte atenția spre construirea întregii infrastructuri noi și să se pregătească pentru acest deluviu?
Shawn Rogers: Știi, am avut ocazia să servim ambele tipuri de clienți și să fim pe piață atâta timp cât avem, veți obține aceste oportunități să se extindă. Avem clienți care în ultimii doi ani au creat noi fabrici fabuloase și le-au echipat cu date despre senzori, IoT, analize de la margine, de la capăt la întregul proces. Dar ar trebui să spun că majoritatea clienților noștri sunt oameni care au făcut acest tip de muncă de ceva vreme, dar au fost nevoiți să ignore aceste date. Știi, Rebecca a pus punctul în față - nu sunt date noi, acest tip de informații a fost disponibil în mai multe formate diferite de foarte mult timp, dar unde problema a fost conectarea la ea, mutându-l, aducându-l într-un loc unde puteți face ceva inteligent cu el.
Și deci aș spune că majoritatea clienților noștri se uită la ceea ce au astăzi, iar Dez, ai făcut acest punct înainte, că aceasta face parte din acea revoluție a datelor mari și cred că despre ce este vorba, este vorba despre toate revoluția datelor, nu? Nu mai trebuie să ignorăm anumite date de sistem sau date de fabricație sau date de automatizare a clădirilor, acum avem jucăriile și instrumentele potrivite pentru a le lua și apoi a face lucruri inteligente cu el. Și cred că există o mulțime de șoferi în acest spațiu care fac acest lucru și unii dintre ei sunt tehnologici. Știi, soluțiile mari de infrastructură de date, cum ar fi Hadoop și altele, l-au făcut puțin mai puțin costisitoare și un pic mai ușor pentru unii dintre noi să ne gândim la crearea unui lac de date cu acel tip de informații. Și acum ne uităm în jurul întreprinderii pentru a merge, „Hei, avem analize în procesul nostru de fabricație, dar ar fi ele îmbunătățite dacă am putea adăuga o perspectivă asupra acestor procese?” Și asta cred, ce este cea mai mare parte din clienții noștri fac. Nu este atât crearea de la început, ci creșterea și optimizarea analizelor pe care le au deja cu date care le sunt noi.
Dez Blanchfield: Da, există unele lucruri interesante prin unele dintre cele mai mari industrii pe care le-am văzut, și ai menționat, puterea și utilitățile. Aviation trece prin acest boom în care unul dintre dispozitivele mele preferate de toate timpurile despre care vorbesc în mod regulat, Boeing 787 Dreamliner și, cu siguranță, echivalentul Airbus, A330 a parcurs același traseu. În 787, când a fost lansat pentru prima dată, au existat aproximativ șase mii de senzori și cred că acum vorbesc despre cincisprezece mii de senzori în noua versiune a acestuia. Și lucrul curios despre a vorbi cu unii dintre oamenii care se află în acea lume a fost că ideea de a pune senzori în aripi și așa mai departe, iar lucrul uimitor despre 787 într-o platformă de design este că, știți, au reinventat totul în avionul. Ca și aripile, de exemplu, atunci când avionul decolează aripile se flexează până la doisprezece metri și jumătate. Dar, în extreme, aripile se pot flexa la vârf până la 25 de metri. Chestia asta arată ca o pasăre care se prăbușește. Însă ceea ce nu au avut timp să se rezolve a fost tehnica analiticii tuturor acestor date, așa că au senzori care fac ca LED-urile să clipească verde și roșu dacă se întâmplă ceva rău, dar nu ajung de fapt cu idei profunde timp real. De asemenea, nu au rezolvat problema modului în care se poate muta volumul de date, deoarece în spațiul aerian intern din SUA sunt zilnic 87.400 de zboruri. Atunci când fiecare avion primește cu rambursările unui Dreamliner de 787, este vorba de 43 de petabite pe zi, deoarece aceste avioane creează în prezent aproximativ jumătate de terabyte de date. Și când înmulțiți cele 87.400 de zboruri pe zi în SUA cu punct de cinci sau jumătate de terabyte, ajungeți la 43, 5 petabytes de date. Fizic nu putem muta asta. Așadar, prin proiectare, trebuie să împingem analitica în dispozitiv.
Dar unul dintre lucrurile care este interesant atunci când mă uit la această întreagă arhitectură - și sunt dornic să văd ce credeți despre acest lucru - este că ne-am îndreptat către gestionarea principală a datelor, un fel de, primele principii ale gestionării datelor, tragerea totul într-o locație centrală. Avem lacuri de date și apoi creăm mici bălți de date, dacă doriți, extrase din cele pe care le realizăm analitice, dar distribuind până la margine, unul dintre lucrurile care continuă să apară, în special de la oamenii de bază și managerii de date sau oamenii care se ocupă de gestionarea informațiilor, ce se întâmplă când am o mulțime de lacuri mici de date în miniatură distribuite? Ce fel de lucruri s-au aplicat acestei gândiri în ceea ce privește analizele de margine din soluția dvs., prin faptul că, în mod tradițional, totul ar veni central cu lacul de date, acum vom termina cu aceste puțuri de date de pretutindeni și chiar dacă putem efectuați analize pe ele la nivel local pentru a obține informații locale, care sunt unele dintre provocările cu care v-ați confruntat și cum ați rezolvat asta, având acel set de date distribuit și, în special, când obțineți microcosmosul lacurilor de date și a zonelor distribuite?
Shawn Rogers: Cred că asta este una dintre provocări, nu? În timp ce ne îndepărtăm, știi, transportând toate datele înapoi în locația centrală sau exemplul principal de analiză pe care l-am oferit, iar apoi facem versiunea distribuită este că vei termina cu toate aceste mici silozuri, nu? La fel cum ai descris, nu? Ei fac un pic de muncă, unele analize sunt difuzate, dar cum le aduceți înapoi? Și cred că cheia va fi orchestrarea pe toate acestea și cred că voi sunteți de acord cu mine, dar sunt fericit dacă nu, cred că am urmărit această evoluție destul de mult ceva timp.
Revenind la zilele prietenilor noștri, domnul Inmon și domnul Kimball, care au ajutat pe toată lumea cu arhitectura investițiilor din depozitul de date timpuriu, ideea fiind că am plecat de la acel model centralizat de multă vreme. Am adoptat această nouă idee de a permite datelor să-și demonstreze gravitatea în cazul în care ar trebui să rezidă cel mai bine în interiorul ecosistemului dvs. și de a alinia datele cu cea mai bună platformă posibilă pentru cel mai bun rezultat posibil. Și am început să cheltuim, cred, o abordare mai orchestrată a ecosistemului nostru ca un fel de mod de a face lucrurile, cum este acela în care încercăm să aliniem toate acele piese simultan. Ce tip de analiză sau lucrare voi face cu datele, ce tip de date este, care va ajuta să dicteze unde ar trebui să trăiască. Unde se produce și ce tip de gravitate au datele?
Știți, vedem o mulțime de exemple mari de date în care oamenii vorbesc despre faptul că au lacuri de date cu 10 și 15 petabyte. Ei bine, dacă aveți un lac de date care este atât de mare, este foarte practic să-l mutați și, astfel, trebuie să puteți aduce analitice la acesta. Dar atunci când faceți acest lucru, în centrul întrebării dvs., cred că ridică o mulțime de noi provocări pentru toată lumea să orchestreze mediul și să aplice guvernanța și securitatea și să înțeleagă ce trebuie făcut cu aceste date pentru a le trata și obține cea mai mare valoare din ea. Și să fiu sincer cu tine - mi-ar plăcea să vă aud părerea aici - cred că suntem zile de început acolo și cred că există încă multă muncă bună de făcut. Cred că programe precum Statistica se concentrează pe oferirea accesului mai multor persoane la date. Cu siguranță ne-am concentrat pe aceste noi persoane, precum oamenii de știință de date cetățenești, care doresc să conducă analitice predictive în locuri din cadrul organizației pe care poate nu ar fi fost până acum. Și cred că acestea sunt unele dintre primele zile în jurul acestui lucru, dar cred că arcul de maturitate va trebui să demonstreze un nivel ridicat sau orchestrare și aliniere între aceste platforme și o înțelegere a ceea ce există pe ele și de ce. Și aceasta este o problemă de vârstă pentru toți oamenii de date.
Dez Blanchfield: Într-adevăr, este și sunt complet de acord cu tine în acest sens și cred că mare lucru pe care îl auzim astăzi este cel puțin capătul problemei de a capta datele de fapt, cred, la nivel de poartă la margine. a rețelei și capacitatea de a face analize în acel moment este esențial rezolvată acum. Și acum ne eliberează pentru a începe de fapt să ne gândim la următoarea provocare, care este distribuirea lacurilor de date. Mulțumesc foarte mult pentru asta, a fost o prezentare fantastică. Apreciez foarte mult șansa de a discuta cu tine despre asta.
O să trec acum la Robin pentru că știu că are, și atunci Rebecca a primit și o lungă listă de întrebări grozave din partea publicului după Robin. Robin?
Dr. Robin Bloor: Bine. Shawn, aș dori să spui ceva mai mult și nu încerc să îți ofer șansa de a-l face publicitate, dar de fapt este foarte importantă. Mă interesează să știu în ce moment Statistica a generat efectiv capacitatea de export a modelului. Dar și eu, aș dori să spuneți ceva despre Boomi, deoarece tot ce ați spus până acum despre Boomi este că este ETL și este într-adevăr ETL. Dar este de fapt un ETL destul de capabil și pentru tipurile de timp despre care vorbim, iar unele dintre situațiile pe care le discutăm aici, acesta este un lucru foarte important. Ați putea vorbi despre aceste două lucruri pentru mine?
Shawn Rogers: Sigur, da, chiar pot. Știi, mișcarea noastră în această direcție a fost cu siguranță iterativă și a fost un fel de proces pas cu pas. Ne pregătim abia săptămâna viitoare pentru a lansa versiunea 13.2 a Statistica. Și are cele mai noi actualizări ale tuturor capabilităților despre care vorbim astăzi. Revenind însă la versiunea 13, cu un an în urmă, în octombrie, am anunțat capacitatea noastră de a exporta modele de pe platforma noastră și am numit-o NDAA la acea vreme. Acronimul a reprezentat Native Distributed Analytics Architecture. Ceea ce am făcut este să punem mult timp, energie și să ne concentrăm asupra deschiderii platformei noastre cu posibilitatea de a o folosi ca centru central de comandă pentru analizele dvs. avansate, dar și de a ne deplasa de acolo. Și primele locuri, Robin, pe care le-am desfășurat am făcut o completare cu adevărat grozavă a platformei din jurul învățării automate. Și, astfel, am avut capacitatea de a ne detașa de la Statistica în Azure Cloud de Microsoft pentru a folosi puterea Azure pentru a alimenta mașinile de învățare, după cum știți, este foarte intens și este o modalitate excelentă de a utiliza tehnologiile cloud. Și așa a fost primul bit.
Acum, aici exportam modelele noastre în Azure și foloseam Azure pentru a le rula și apoi am trimis datele sau rezultatele, înapoi la platforma Statistica. Și apoi am trecut la alte limbi pe care am vrut să le putem exporta și, desigur, una dintre ele fiind Java ne deschide ușa pentru ca noi să începem acum să exportăm modelele noastre către alte locații precum Hadoop, așa că atunci a dat și noi o joacă acolo.
Și, în sfârșit, ne-am concentrat pe posibilitatea de a ne putea sorta modelele cu această versiune în baze de date. Și așa a fost prima iterație și să fim sinceri cu tine, jocul final a fost IoT, dar încă nu eram încă acolo cu versiunea 13 din octombrie trecută. De atunci am ajuns acolo și asta are legătură cu capacitatea de a face toate lucrurile pe care tocmai le-am menționat, dar apoi să avem un fel de dispozitiv de transport. Și revenind la întrebarea lui Dez, știi, care este provocarea și cum facem asta când avem toate aceste analize care circulă? Ei bine, folosim Boomi ca un fel de hub de distribuție și așa pentru că este în cloud și pentru că este atât de puternic, așa cum am menționat anterior, este o platformă de integrare a datelor, dar este și o platformă de integrare a aplicațiilor și folosește JVM-uri pentru a ne permite să parchezi și să lucrezi oriunde să poți ateriza o mașină virtuală Java. Asta a deschis cu adevărat ușa pentru toate aceste gateway-uri și platforme de calcul edge și servere de margine, pentru că toate au calculul și platforma care este disponibilă pentru a rula un JVM. Și pentru că putem rula JVM oriunde, Boomi s-a transformat va fi o distribuție minunată și, folosind cuvântul meu de mai devreme, un dispozitiv de orchestrare.
Și acest lucru devine cu adevărat important pentru că avem toți, știți, cred că scenariul avionului de acum un minut a fost unul grozav și am menționat, știți, producători precum Shire, care au zece mii de senzori într-una din fabricile lor, trebuie să înceapă să abordeze un fel de abordare centrală a analizelor avansate la un moment dat. A fi ad hoc despre asta nu mai funcționează cu adevărat. Obișnuiam când volumul de modele și algoritmi pe care îi rulam era minim, dar acum este la maxim. Sunt mii dintre ei într-o organizație. Așadar, o parte din platforma noastră este bazată pe server, iar atunci când aveți software-ul nostru de întreprindere, aveți, de asemenea, capacitatea de a regla și marca și a gestiona modelele dvs. în mediul ambiant. Și asta face parte și din acel lucru de orchestrare. Aveam nevoie să avem un strat, Robin, în locul care nu numai că îți permitea să obții un model acolo, dar, de asemenea, îți oferea o conduită pentru a modela modelele și a le înlocui în mod continuu de câte ori ai nevoie, pentru că nu este ceva ce poți face manual. Nu puteți să vă plimbați în jurul unei rafinării cu un drive cu degetul mare încercând să încărcați modele pe gateway-uri. Trebuie să aveți un sistem de transport și de gestiune între acesta, iar combinația dintre Statistica și Boomi le oferă clienților noștri.
Dr. Robin Bloor: Da. Ei bine, voi fi foarte sumar, dar, știți, această afirmație care a fost făcută anterior cu privire la lacul de date și ideea de a acumula petabytes într-un loc dat și faptul că are gravitație. Știi, când ai început să vorbesc despre orchestrare, tocmai a început să mă gândesc la faptul foarte simplu că, să știi, să pui un lac de date care este foarte mare într-un singur loc, înseamnă că trebuie să îl faci înapoi și probabil că înseamnă oricum trebuie să mutați o mulțime de date. Știi, arhitectura de date reală este mult mai mult, în opinia mea, mult mai mult în direcția despre care vorbești. Ceea ce este să-l distribuiți în locuri sensibile, este probabil lucrul pe care l-aș spune. Și se pare că ai o capacitate foarte bună de a face acest lucru. Adică, sunt bine informat despre Boomi, așa că este cam, într-un fel sau altul, aproape nedrept că îl pot vedea și poate că publicul nu poate. Însă, Boomi este atât de esențial, din punctul meu de vedere, în ceea ce privește ceea ce faci, deoarece are capacități de aplicare. Și, de asemenea, adevărul este că nu faceți aceste calcule analitice fără să doriți să acționați ceva undeva dintr-un motiv sau altul. Și Boomi joacă un rol în asta, nu?
Shawn Rogers: Da, absolut. Și așa cum știți din conversațiile anterioare, Statistica are un motor complet de reguli de afaceri. Și cred că asta este cu adevărat important atunci când ne descurcăm de ce facem asta. Știi, am glumit în față că nu există niciun motiv să faci IoT deloc dacă nu vei analiza, utiliza datele pentru a lua decizii mai bune sau a lua măsuri. Și deci, pe ce ne-am concentrat nu a fost doar să putem să punem modelul acolo, ci să putem eticheta împreună cu acesta, un set de reguli. Și pentru că Boomi este atât de robust în capacitățile sale de a muta lucrurile dintr-un loc în altul, în cadrul unui atom Boomi putem încorpora și capacitatea de a declanșa, de a alerta și de a lua măsuri.
Și de aceea începem să obținem un fel de vedere sofisticată a datelor IoT în care spunem: „Bine, aceste date merită ascultate.” Dar, într-adevăr, știi, știind că „lumina este aprinsă, lumina este aprinsă, lumina este aprinsă, lumina este aprinsă ”nu este la fel de interesantă când se stinge lumina sau când se stinge detectorul de fum sau când se întâmplă orice se întâmplă cu procesul nostru de fabricație. Când se întâmplă asta vrem să putem acționa imediat. Iar datele devin aproape secundare în acest moment. Deoarece nu este atât de important încât le-am salvat pe toate, „este în regulă, este în regulă, este în regulă”, ceea ce este important este că observăm „Hei, este rău” și am luat măsuri imediate. Indiferent dacă este vorba despre trimiterea unui e-mail către cineva sau putem implica expertiză în domeniu, sau dacă punem la cale sau nu o serie de alte procese pentru a lua măsuri imediate, indiferent dacă acestea sunt corective sau ca răspuns la informații. Și cred că de aceea trebuie să aveți această părere orchestrată asupra acesteia. Nu vă puteți concentra doar pe tratarea algoritmilor dvs. peste tot. Trebuie să le puteți coordona și orchestra. Trebuie să puteți vedea cum sunt performanțele. Și într-adevăr, cel mai important, vreau să spun, de ce dracu ai face asta dacă nu poți adăuga ocazia de a lua măsuri imediate împotriva datelor?
Dr. Robin Bloor: Bine, Rebecca, cred că ai întrebări din partea publicului?
Rebecca Jozwiak: Da. Am o mulțime de întrebări de audiență. Shawn, știu că nu ai vrut să stai prea mult timp în vârful orei. Tu ce crezi?
Shawn Rogers: Sunt fericit. Dați-i drumul. Pot răspunde la câteva.
Rebecca Jozwiak: Să vedem. Știu că unul dintre lucrurile pe care le-ați menționat a fost că IoT este în primele zile și are un grad de maturitate care va trebui să aibă loc și un fel de vorbă la această întrebare pe care a pus-o un participant. Dacă cadrul IPv6 va fi suficient de robust pentru a acoperi creșterea IoT în următorii cinci sau zece ani?
Shawn Rogers: O să-l las pe Dez să răspundă din răspunsul meu, deoarece cred că este mai aproape de acest tip de informații. Dar am fost întotdeauna de gândul că suntem pe o cale foarte rapidă pentru a îndoi și rupe majoritatea cadrelor pe care le avem în loc. Și deși cred că adăugarea acelui nou tip de spec sau direcția pe care mergem cu cadrele IPv6 este importantă și ne deschide ușa pentru a avea mult mai multe dispozitive și pentru a putea oferi tot ceea ce noi doresc să dau o adresă. Cred că tot ce citesc și văd cu clienții și numărul de adrese care sunt necesare, cred că la un moment dat va provoca o altă schimbare în acel peisaj. Dar eu nu sunt cu adevărat un expert în rețele, așa că nu pot spune sută la sută că o să o rupem la un moment dat. Dar experiența mea îmi spune că vom distruge acel model la un moment dat.
Rebecca Jozwiak: Nu m-ar mira. Cred că cadrele se încalcă sub greutatea tuturor tipurilor de lucruri. Și asta e logic, nu? Adică, nu poți trimite un e-mail cu o mașină de scris. Un alt participant se întreabă: „Poți folosi un cadru Hadoop?”, Dar cred că aș putea schimba asta, spunând, cum ai folosi un cadru Hadoop pentru analitice distribuite?
Shawn Rogers: Ei bine, Robin mi-a făcut favoarea de a-mi pune o întrebare istorică și așa, din versiunea 13 acum un an pentru Statistica, am avut capacitatea de a alunga modele din sistemul nostru și în Hadoop. Și lucrăm foarte strâns cu toate aromele mari ale Hadoop. Avem povești de succes foarte mari în jurul capacității de a lucra cu Cloudera ca una dintre principalele distribuții Hadoop cu care lucrăm. Dar, deoarece putem ieși în Java, ne oferă această capacitate de a fi deschiși și de a plasa analitica oriunde. Plasarea lor într-un cluster Hadoop este un lucru pe care îl facem în mod normal și regulat și zilnic pentru mulți dintre clienții noștri. Răspunsul scurt este da, absolut.
Rebecca Jozwiak: Excelent. Și o să vă mai arunc încă unul și să vă las să plecați mai departe în vacanță. Un alt participant se întreabă, cu analize IoT plus învățare automată, credeți că toate datele trebuie stocate în scopuri istorice și cum va avea acest impact arhitectura soluției?
Shawn Rogers: Ei bine, nu cred că trebuie stocate toate datele. Dar cred că este foarte interesant să ai capacitatea de a distra, de a asculta orice sursă de date pe care o dorim în cadrul organizației noastre, de oriunde provine. Și cred că schimbările pe care le-am văzut pe piață în ultimii ani ne-au permis să abordăm toate aceste date și se pare că ar fi cu adevărat plătitori. Dar va fi diferit pentru fiecare companie și fiecare caz de utilizare. Știi, când analizăm datele privind sănătatea, acum există o mulțime de probleme de reglementare, multe probleme de conformitate care trebuie să fie preocupate și asta ne face să salvăm date despre care alte companii ar putea să nu înțeleagă de ce trebuie să fie salvate, nu. ? În procesele de fabricație, pentru mulți dintre clienții noștri producători, există un adevărat dezavantaj pentru a putea examina istoric procesele dvs. și pentru a putea privi înapoi cantități mari din aceste date pentru a afla de la ea și pentru a construi modele mai bune din acestea.
Cred că vor trebui păstrate o mulțime de date și cred că avem soluții care să facă acest lucru mai economic și scalabil astăzi. Dar, în același timp, cred că fiecare companie va găsi valoare în date pe care nu trebuie să le păstreze la nivel atomic, dar vor dori să analizeze într-un fel real modul și să ia decizii cu privire la aceasta pentru a stimula inovația în interior compania lor.
Rebecca Jozwiak: Bine bine. Nu, audiență, nu am ajuns la întrebările tuturor astăzi, dar le voi transmite către Shawn, pentru ca el să ajungă direct la tine și să răspundă la aceste întrebări. Dar mulțumesc tuturor că ați participat. Mulțumesc mult Shawn Rogers de la Dell Statistica și tuturor analiștilor noștri, Dez Blanchfield și Dr. Robin Bloor. Puteți găsi arhiva aici la interioranalysis.com, SlideShare, am început să ne punem lucrurile din nou acolo și reînnoim YouTube-ul nostru, așa că căutați și acolo. Mulțumesc multă lume. Și cu asta o să-ți iau rămas bun și ne vom revedea data viitoare.