De personalul Techopedia, 25 august 2016
Take away : Gazda Rebecca Jozwiak discută despre fenomenul analizelor încorporate și al oamenilor de știință al datelor cetățenilor cu Dr. Robin Bloor, Dez Blanchfield și David Sweenor.
Pentru a vizualiza videoclipul trebuie să vă înregistrați la acest eveniment. Înregistrați-vă pentru a vedea videoclipul.
Rebecca Jozwiak: Doamnelor și domnilor, salut și bun venit la Hot Technologies. „Încorporați pretutindeni: Activarea oamenilor de știință a datelor” este subiectul nostru astăzi. Am completat pentru gazda dvs. obișnuită, aceasta este Rebecca Jozwiak completând pentru Eric Kavanagh. Da, anul acesta este fierbinte. În special, termenul de „om de știință” a atras multă atenție, chiar dacă obișnuiam să le numim nume plictisitoare precum „statisticist” sau „expert în analiză”, abordând aproape același tip de activități, dar are un nume nou și sexy. obținând multă atenție. Sunt de dorit să aibă parte de locul de muncă, benefic pentru organizație și fiecare își dorește unul. Dar sunt: 1) scumpe, 2) greu de găsit. Știi, au fost peste toate știrile despre deficiența de abilități a oamenilor de știință de date, da, dar totuși oferă o valoare extraordinară organizației, iar oamenii sunt un pic clamorați pentru a-și da seama cum să obțină acea valoare fără a fi nevoiți să renunțe la dime, deci vorbi.
Dar veștile bune sunt că vedem că instrumente și software ies la iveală, care compensează acest deficit. Avem automatizare, învățare automată, analize încorporate, despre ceea ce vom învăța astăzi și este un fel de naștere la acest nou termen, „om de știință al cetățenilor” și ce înseamnă asta? Nu, nu este omul de știință pregătit în date, ar putea fi utilizatorul dvs. de afaceri, expertul dvs. în BI, cineva din IT, cineva care are cunoștințe de fond, dar poate nu neapărat expertiza. Dar ceea ce face, aceste instrumente și software, este faptul că le oferă mai multor oameni acces la acele soluții inteligente, chiar dacă nu ar putea cunoaște codificarea profundă. Dar ajută doar la îmbunătățirea performanței în general atunci când oferi tuturor acces mai puțin la acea gândire analitică. Nu trebuie să aveți pregătirea în mod necesar pentru a avea tipul de curiozitate care poate duce la perspective bune pentru compania dvs.
Discutând despre noi astăzi este propriul nostru Robin Bloor, analist șef la Bloor Group, unul dintre însuși oamenii de știință de date evazivi, apelând Dez Blanchfield, iar apoi îl avem pe David Sweenor de la Dell Statistica care ne va prezenta astăzi. Și cu asta o voi transmite lui Robin Bloor.
Robin Boor: Bine, mulțumesc pentru introducerea respectivă. M-am gândit la asta într-un context istoric. Ceea ce ne uităm de fapt aici este unul dintre design-urile lui Leonardo da Vinci pentru un fel de planor pe care un bărbat l-ar putea pune pe spate. Nu am idee dacă ar funcționa de fapt. Nu aș intra în ea, trebuie să spun. Cu toate acestea, da Vinci, de câte ori mă gândesc la da Vinci, mă gândesc la el ca unul dintre cei mai interesanți și analitici oameni care au existat vreodată. Și este clar dacă te uiți doar la acest planor că este conceput pe baza aripii unei păsări și el a studiat într-un fel sau altul zborurile păsărilor pentru a-l construi.
Dacă luăm perspectiva istorică - am privit de fapt acest lucru - analiza este poate cea mai veche aplicație a matematicii. Există recensământuri care datează cel puțin din vremurile babiloniene. Știm despre acest lucru, deoarece există, practic, câteva tablete cuneiforme care au date ca acestea. Nu se știe dacă s-a întors ceva mai devreme. Însă, evident, este că te-ai însuși o civilizație cu o populație mare de oameni, de fapt necesită planificare și merită să știi pentru ce planifici și care sunt cerințele acelor oameni.
Și asta este locul în care a început și este și locul unde a început calcularea, deoarece calculatoarele timpurii, calculatoarele mecanice timpurii, au fost de fapt, cred că primul a fost recensământul creat de Hollerith, care a devenit IBM, cred. Toate acestea au avansat. A existat un fel de interludie între anii '70 și astăzi, unde există un număr mare de alte aplicații și analize, ați putea spune, au ocupat un loc în spate. Da, existau analize - se întâmpla în organizații mari, în special bănci și companii de asigurări, și de fapt General Electric și telco și așa ceva - dar nu a fost folosit în general în întreprinderi și acum începe să se obișnuiască în general pe tot parcursul Afaceri. Și a schimbat jocul, într-adevăr. Primul lucru la care am crezut că voi atrage atenția este piramida de date, care îmi place în mod deosebit. Aceasta este, vreau să spun, am desenat unul dintre acești 20 de ani în urmă - cel puțin 20 de ani în urmă - pentru a încerca să înțeleg, într-adevăr, la vremea respectivă, încercam să înțeleg BI și o parte din mineritul de date timpuriu care se făcea. Ceea ce am definit aici este ideea de date, iar exemplele sunt semnale, măsurători, înregistrări, evenimente, tranzacții, calcule, agregări, puncte individuale de informații. S-ar putea să vă gândiți la ele ca molecule de informație, dar sunt puncte individuale. Devine informație de îndată ce capătă context. Date conexe, date structurate, baze de date, vizualizare de date, comploturi, schemeri și ontologii - toate se califică în mintea mea ca informații, deoarece ceea ce ați făcut este cumulat multă varietate împreună și a creat ceva mult mai mult decât un punct de date, ceva care are de fapt o formă, o formă matematică.
Mai presus de asta avem cunoștințe. Putem, examinând informații, să aflăm că există diverse modele și putem folosi aceste tipare formulând reguli, politici, linii directoare, proceduri și apoi ia forma cunoștințelor. Și aproape toate programele de calculator, orice fac, sunt cunoștințe de acest fel, deoarece lucrează împotriva datelor și le aplică reguli. Avem aceste trei straturi și există o rafinare din ce în ce mai continuă între straturi. Și în partea stângă a acestei diagrame vi se afișează date noi, astfel încât o mulțime de aceste lucruri sunt statice. Datele se acumulează, informațiile se acumulează și cunoștințele sunt potențial în creștere. În partea de sus, avem „Înțelegere” și aș păstra, deși este un argument filosofic, că înțelegerea rezidă numai în ființele umane. Dacă greșesc în legătură cu asta, atunci vom fi înlocuiți de calculatoare la un moment dat. Dar mai degrabă decât să am dezbaterea, voi trece la diapozitivul următor.
Când m-am uitat la acest lucru, lucru interesant, acesta este ceva recent, lucru interesant a fost să încerc să descopăr care sunt de fapt analitice. Și, în cele din urmă, desenând diverse diagrame și încheind una care arăta astfel, am ajuns la concluzia, de fapt, dezvoltarea analiticii este într-adevăr doar o dezvoltare de software cu o cantitate groaznică de formule matematice. Explorarea analitică este puțin diferită de dezvoltarea de software, în sensul că ai lua de fapt multe, multe modele diferite și le vei cerceta pentru a genera cunoștințe noi despre date. Dar, odată ce l-ați generat, acesta este pus în aplicare fie în ceea ce cred eu ca suport de decizie pasivă, care este informația doar alimentată de un utilizator; suport de decizie interactiv, care este cum ar fi OLAP, în cazul în care utilizatorului i se oferă un set structurat de date pe care le poate investiga și deduce lucrurile pentru sine folosind diferitele instrumente disponibile. Multă vizualizare este așa. Și atunci avem automatizare dacă puteți transforma doar informații analitice pe care le-ați adunat într-un set de reguli care pot fi implementate, nu aveți nevoie neapărat de o ființă umană care să fie implicată. Acesta este felul în care l-am privit când am făcut toate astea. Și diverse lucruri au început să mi se întâmple. Odată ce un domeniu de activitate, ar trebui să spunem, odată ce un domeniu de date este de fapt extras, minat complet, explorat în profunzime prin toate direcțiile posibile, în cele din urmă, acesta devine doar BI-ul cristalizat. Cunoașterea inventată începe să devină cunoștințe care informează diverși utilizatori în diverse moduri și le crește capacitatea, sperăm, de a efectua munca pe care o fac.
Unul dintre lucrurile pe care le-am observat și pe care le-am privit analitice predictive de aproximativ cinci ani, dar analitica predictivă devine BI, în sensul că se transformă doar în informații utile pentru a le alimenta oamenilor și așa cum am subliniat deja, există raportări BI automate, explorare BI, BI, gradări foarte diferite ale acesteia și analize predictive merge de fapt în toate cele trei direcții. Și procesul analitic așa cum am subliniat nu este atât de diferit de dezvoltarea de software, ci doar de diferite persoane cu abilități ușor diferite. Presupun că ar trebui să subliniez că abilitățile necesare pentru a face un om de știință de date cu adevărat bun durează ani de acumulare. Nu sunt ușor dobândite și nu un număr mare de oameni o pot face, dar asta se datorează faptului că implică înțelegerea matematicii la un nivel foarte sofisticat pentru a ști ce este valid și ce nu este valabil. Evoluții analitice, descoperire de cunoștințe noi, implantare de analize, este vorba de a face operațională cunoașterea. Acesta este genul de fundal pe care îl văd întregii analitice. Este o zonă uriașă și există multe, multe dimensiuni, dar cred că generalizarea se aplică la orice.
Apoi apare întreruperea afacerii, după cum am menționat că există o serie de organizații, companiile farmaceutice este alta, care au ADN-ul lor au analize. Dar există multe organizații care nu îl au într-adevăr în ADN-ul lor, iar acum au capacitatea, acum software-ul și hardware-ul sunt mult mai ieftine decât era, acum au capacitatea de a-l exploata. Aș spune o serie de lucruri. Primul lucru este că analizele sunt, în multe cazuri, cercetare și dezvoltare. S-ar putea să aplicați doar analitice într-o anumită zonă a organizației și s-ar putea părea banal faptul că sunteți într-un fel sau altul analizând din nou comenzile clienților din diverse perspective, alăturându-i-o cu alte date. Dar analizele creează de fapt posibilitatea de a privi organizația în ansamblul său și de a analiza practic orice activitate particulară care se desfășoară în cadrul organizației și lanțuri întregi de activități. Dar, odată ce te-ai muta în acea zonă, aș susține că este vorba de cercetare și dezvoltare. Și există o întrebare care mi-a fost pusă de câteva ori, care este: „Cât ar trebui să cheltuiască o companie pentru analiză?” Și cred că cel mai bun mod de a gândi să ofere un răspuns la asta este să gândești analitice ca R&D și întreabă-ți doar „Păi cât ai cheltui în cercetare și dezvoltare în domeniul eficienței afacerii?”
Iar afacerile care nu sunt analitice, există o mulțime de lucruri pe care nu le știu. În primul rând, nu știu cum să o facă. În mod normal, dacă de fapt vor merge într-un fel sau altul, adoptă analitice în cadrul organizației - chiar nu prea au altă opțiune decât să meargă la o consultanță care să-i poată ajuta în realizarea acestui lucru deoarece, pentru majoritatea ar fi imposibil sau foarte dificil întreprinderile să angajeze de fapt un om de știință de date, să găsească unul, să plătească pentru unul și să aibă încredere în ele să facă ceea ce doriți să facă. Foarte dificil. Majoritatea întreprinderilor nu știu cum să angajeze sau să educe personal pentru a efectua acest lucru, iar motivul pentru care este făcut este pur și simplu că nu este încă în ADN-ul lor, deci nu face parte din procesele lor naturale de afaceri. Acest lucru se introduce în următorul punct. Nu știu cum să-l facă un proces de afaceri. Cel mai bun mod de a face acest lucru, apropo, este de a copia ceea ce companiile farmaceutice și companiile de asigurări, doar uită-te, și unele companii din centrul de sănătate, doar uitați la modul în care utilizează analitice și să-l copieze. Pentru că este un proces de afaceri. Nu știu cum să o polițiști sau să o auditezi. Asta chiar, mai ales acum, că o mulțime de companii de software au creat produse care automatizează o mulțime de analize. Ideea despre audit este importantă, atunci când aveți o consultanță sau o persoană pe site care poate fi de încredere pentru a înțelege care sunt rezultatele oricărui calcul analitic, acesta este un fel de alegere pe care trebuie să o faceți, dar dacă puneți instrumente analitice cu adevărat puternice mâinile oamenilor care nu înțeleg corect analitica, probabil că vor ajunge la concluzii care ar putea să nu fie corecte. Și cum spuneam, companiile nu știu cum să-și facă bugetul.
Acestea sunt arome ale analizelor, le voi trece prin ele. Analiza statistică și modelarea statistică diferă semnificativ de analiza predictivă, cea mai mare parte fiind potrivită cu curba. Învățarea mașină este diferită de acele lucruri, analiza căilor și seriile de timp, care se face practic pe fluxurile de stare sunt din nou diferite. Analiza grafică este din nou diferită, iar analiza textului și cea semantică sunt din nou diferite. Acesta subliniază doar că este un lucru foarte multi-gen. Nu este, nu începi să faci analize, începi să te uiți la problemele pe care le ai și să cauți diferitele instrumente și diverse arome ale analitice care să li se potrivească. Și în final, netul net. Din cauza evoluției hardware-ului și software-ului, în opinia mea, analitica este la început. Au mai rămas multe, multe altele și vom vedea că se desfășoară în următorii ani. Cred că pot trece mingea lui Dez acum.
Dez Blanchfield: Da, vorbesc despre un act greu de urmat, Robin. Voi vizita pe scurt acest subiect dintr-unul din unghiurile mele preferate, care este unghiul umanului. Există atât de multe schimbări în viața noastră de zi cu zi. Una dintre cele mai mari perturbări din viața noastră de zi cu zi, în opinia mea, este doar munca de zi cu zi. Începeți să lucrați și să încercați să faceți treaba pe care o angajați și așteptările crescânde de la o persoană de zi cu zi la un super-erou și cantitatea de informații care curge în jurul organizațiilor și care emite foarte, foarte repede, este o provocare semnificativă și din ce în ce mai mult trebuie să oferim instrumente din ce în ce mai bune oamenilor pentru a încerca să facă față fluxului de cunoștințe și informații, așa că m-am gândit că voi încerca să vin din asta dintr-un unghi de distracție . Însă, întotdeauna mă atrage atenția asupra modului în care avem această minte mare sau flash mob-uri și așa mai departe, care ne determină să ne orientăm spre ceea ce vorbim ca analitice, dar despre ceea ce vorbim este să punem la dispoziția oamenilor informații și permițându-le să interacționeze cu ea și să o facă în așa fel încât să fie natural și să se simtă normal.
Și, de fapt, îmi amintește de un videoclip pe YouTube al unui copil mic, micuț, stând pe podea și stă acolo jucându-se cu un iPad și se prăbușește, ciugulește și stoarce și scoate imaginile și se joacă cu ecranul, datele de acolo. Și apoi părintele ia iPad-ul și pune o poză, o revistă tipărită pe poala copilului. Și probabil că acest copil nu are mai mult de doi ani. Copilul începe să încerce să alunece cu ecranul revistei și să înțepe și să strângă și revista nu răspunde. Copilul ridică degetul în sus și îl privește și se gândește: „Hmm, nu cred că degetul meu funcționează” și se înfige în braț și se gândește: „Ah nu, degetul meu funcționează pot să simt brațul și asta arată bine ”, și degește degetul, iar degetul ridează și răspunde. Da. Apoi încearcă din nou să interacționeze cu revista și scade și nu vede că nu ciupește și nu strânge și defilează. Apoi iau revista departe și pun iPad-ul înapoi în poală și, dintr-o dată, totul funcționează. Așadar, iată un bebeluș care a venit și a fost instruit să utilizeze un instrument de analiză sau un instrument de transmisie live pentru divertisment și nu se poate descoperi cum ar trebui să funcționeze o revistă și cum să plutească paginile.
Și acesta este un concept interesant în sine. Dar, când mă gândesc la mișcarea cunoștințelor în jurul organizațiilor și la modul în care curg datele și la modul în care oamenii se comportă, mă gândesc adesea la acest concept despre ceea ce oamenii au învățat să fie flash mob, care este un eveniment în care și pe care face social media acest lucru este și mai ușor de făcut, o idee ca atare, care este în acest moment și data și acțiunea, sau video și învață aceste dansuri, sau purta această pălărie colorată și îndreaptă spre nord la ora unu. Și împingeți acest lucru prin rețeaua dvs. și, în mod invariabil, o întreagă încărcătură de oameni, sute de oameni, se întoarce în același loc în același timp, faceți același lucru și există acest factor wow, de exemplu, „vacă sfântă, care a fost într-adevăr impresionant! ”Dar de fapt este o idee foarte simplă, iar un concept simplu este pur și simplu împins prin rețelele noastre și obținem acest rezultat care este un lucru vizual uimitor și impresionant. Și atunci când vă gândiți la o organizație, la modul în care dorim să se comporte oamenii și la modul în care dorim ca aceștia să se ocupe de sisteme informaționale și clienți, este adesea atât de simplu, este o idee sau un concept sau o trăsătură culturală sau comportamentală pe care încercăm să o transmitem prin și abilitare cu instrumente și informații.
Și stăpânesc tot ce este această mantră pe care am avut-o de mai bine de două decenii și jumătate și adică, dacă personalul tău nu poate găsi ceea ce trebuie să își facă treaba, fie că este vorba despre instrumente sau informații, invariabil vor reinventa roata. Și deci aceasta este o provocare din ce în ce mai mare acum, în care avem o mulțime de cunoștințe și multe informații și lucruri care se mișcă foarte repede, încât vrem să oprim oamenii să reinventeze roata. Și când ne gândim la mediul nostru de lucru, revenind la unghiul oamenilor, care este unul dintre preferatele mele, am fost uimit când am fost surprinși că cubiculele nu sunt un mediu propice pentru rezultate bune sau că am aliniat lucrurile așa groaznice. imagini aici și nu s-a schimbat prea mult, doar a coborât pereții și i-a numit spații de lucru deschise. Dar la mijloc, cu bucla galbenă în jurul lor, există două persoane care fac schimb de cunoștințe. Și totuși, dacă te uiți la restul camerei, ei stau cu toții acolo bătând cu atenție, introducând informații într-un ecran. Și, de cele mai multe ori, nu schimbăm cu adevărat cunoștințe și date și există o serie de motive pentru asta. Dar interacțiunea din mijlocul podelei din stânga acolo, în cercul galben, există două persoane care vorbesc acolo, schimbând cunoștințe și, probabil, încearcă să găsească ceva, încercând să spună: „Știi unde este acest raport, unde eu pot găsi aceste date, ce instrument folosesc pentru a face acest lucru? ”Și, probabil, nu a funcționat așa că nu au nimic, și au rătăcit prin podea, au încălcat regula spațiului de birou din cabină și au făcut-o personal.
Și am avut medii similare în jurul biroului la care ne glumim în glumă, dar realitatea este că sunt destul de puternice și eficiente. Și unul dintre favoriții mei este platforma de analiză mobilă sau fixă numită cooler de apă, unde oamenii se ridică acolo și chit-chat pe acolo și schimbă cunoștințe, și compar idei și realizează analize în timp ce stau la răcitor de apă, schimbând idei. Sunt concepte foarte puternice atunci când te gândești la ele. Și dacă le poți traduce în sistemele și instrumentele tale, obții un rezultat uimitor. Și avem favoritul de toate timpurile, care este în esență cel mai puternic hub de distribuție de date al biroului, altfel cunoscut sub denumirea de recepție. Și dacă nu găsești ceva, unde te duci? Ei bine, mergeți în fața biroului și mergeți la recepție și spuneți: „Știți unde este x, y, z?” Și îndrăznesc pe cineva să îmi spună că nu au făcut asta cel puțin o dată într-o nouă slujbă sau la un moment dat când pur și simplu nu pot găsi ceva. Și trebuie să vă întrebați, de ce este cazul? Ar trebui să fie undeva pe intranet sau un instrument sau orice altceva. Ar trebui să fie ușor de găsit.
Și, atunci când vine vorba despre date și analize și instrumentele pe care le-am oferit personalului nostru pentru a-și face treaba și modul în care oamenii interacționează cu locurile de muncă, am considerat că înainte de apariția recentă a instrumentelor de analiză și a platformelor de date mari sau „prelucrarea datelor”, precum și o numesc în școala veche, raportarea și schimbul de cunoștințe erau departe de a fi dinamice sau colaborative sau deschise, iar când te gândești la tipul de sisteme cu care ne așteptăm ca oamenii să își facă treaba, aveam clasic, cu ce oamenii apelează la moștenire acum, dar realitatea este că doar moștenirea s-a întâmplat și este încă aici astăzi și, prin urmare, nu este moștenire. Dar sistemele tradiționale de resurse umane și sistemele ERP - managementul resurselor umane, planificarea resurselor întreprinderii, gestionarea datelor despre întreprinderi și sisteme pe care le folosim pentru a gestiona informațiile pentru a conduce o companie. Este invariabil tăcut. Și din capătul de sus, platforme simple precum intranetele departamentale, care încearcă să comunice unde sunt lucrurile și cum să le obții și cum să interacționezi cu cunoștințele din jurul locului. Îl deschidem pe intranet. Este la fel de bun ca oamenii care fac timp și efort pentru a pune asta acolo, altfel doar rămâne în capul tău. Sau aveți date care stau la tot pasul în partea de jos a lanțului alimentar, la SAN-urile corporative și tot ce este între ele, deci rețelele de spații de stocare sunt pline de fișiere și date, dar cine știe unde să o găsească.
De cele mai multe ori, am construit aceste platforme de date închise sau sisteme închise, astfel încât oamenii au revenit la plăcile foilor de calcul și PowerPoints pentru a transmite informații în jurul locului. Dar a fost un lucru interesant care a avut loc recent, în mintea mea, și acela a fost faptul că dispozitivele mobile și internetul în general funcționează în așa fel încât ideea că lucrurile ar putea fi mai bune. Și predominant în spațiul de consum. Și este un lucru interesant că viața de zi cu zi am început să avem lucruri precum serviciile de internet banking. Nu a trebuit să mergem fizic la o bancă efectivă pentru a interacționa cu ei, o puteam face telefonic. Inițial, a fost neplăcut, dar internetul a venit și am avut un site web. Știi și de câte ori ai fost de fapt la banca ta în ultima vreme? De fapt nu pot, am avut o discuție despre asta în ziua trecută și de fapt nu-mi amintesc ultima dată când am fost la banca mea, de care am fost destul de șocat, am crezut că trebuie să pot să-mi amintesc acest lucru, dar a fost atât de lung acum nu-mi aduc aminte când am fost acolo. Și astfel avem acum aceste dispozitive în mână sub formă de telefoane mobile și telefoane, tablete și laptopuri, avem rețele și acces la instrumente și sisteme, iar spațiul consumatorului am aflat că lucrurile pot fi mai bune, dar pentru că al schimbării rapide în spațiul consumatorilor, care a fost o schimbare mai letargică și glaciară în cadrul întreprinderii și mediilor, nu am luat întotdeauna această schimbare la viața de zi cu zi.
Și îmi place să mă distrez să mă bucur de faptul că nu puteți transmite fluxuri de date pe suport de hârtie. În această imagine, aici există o persoană care stă uitându-se la niște analize care au fost efectuate și există un grafic frumos, produs de cineva care probabil plătește mulți bani ca statisticist sau actuar și stă acolo încercând să facă analitice pe o copie tare și tragându-l. Dar iată ce este înfricoșător pentru mine: acești oameni din această sală de ședințe, de exemplu, și voi folosi acest lucru ca exemplu, interacționează cu datele acum istorice. Și este la fel de vechi de când a fost produs și apoi a fost tipărit, așa că poate este un raport vechi de o săptămână. Acum iau decizii cu privire la datele nu atât de rele, ci la datele vechi, care invariabil pot fi date rele. Astăzi iau o decizie bazată pe ceva istoric, care este un loc cu adevărat rău. Am reușit să înlocuim acea copie tare cu plăcintele și telefoanele, deoarece am lucrat foarte repede în spațiul pentru consumatori, iar acum am lucrat-o în spațiul întreprinderii, faptul că timpul real este informații este valoarea în timp real.
Și devenim din ce în ce mai buni. Și mă aduce la punctul pe care Robin l-a ridicat mai devreme, acesta a fost conceptul de om de știință al datelor cetățenești și impulsul acestui concept. Pentru mine, un om de știință în domeniul cetățenilor este doar oameni obișnuiți, cu instrumente și informații potrivite despre like-urile unui iPad. Nu trebuie să facă matematicile, nu trebuie să cunoască algoritmii, nu trebuie să știe să aplice algoritmii și să ruleze datele, ci trebuie să știe cum să folosească interfața. Și asta mă readuce la introducerea mea și la conceptul de copil care stă acolo cu un iPad versus o revistă, versus un iPad. Copilul poate învăța foarte repede, intuitiv, cum să folosească interfața unui iPad pentru a te afunda în informații și pentru a interacționa cu aceasta, deși poate un joc sau un material multimedia sau un videoclip. Dar nu se poate obține același răspuns sau interacțiune dintr-o bară de reviste și doar o clipă intermitentă pagină după pagină, ceea ce nu este foarte interesant, mai ales dacă ești un copil care a crescut cu iPads. Invariabil, ființele umane pot privi și învăța foarte repede cum să conducă instrumente și lucruri care, doar dacă le oferim și dacă le oferim o interfață precum dispozitivele mobile și, în special, tablete și smartphone-uri cu ecrane suficient de mari, și în special dacă puteți interacționa ei la atingere, cu mișcări ale degetului, dintr-o dată veți obține acest concept de om de știință a datelor cetățenești.
Cineva care poate aplica știința datelor cu instrumentele potrivite, dar fără a fi nevoie să știe cum să o facă. Și în mintea mea o mare parte din acestea, așa cum am spus, au fost determinate de influența consumatorilor, care s-au mutat și s-au transformat în cerere și întreprindere. Câteva exemple foarte rapide. Noi, mulți dintre noi am începe să facem lucruri cu blogurile și site-urile noastre web, cum ar fi să facem reclame mici sau să ne uităm la urmărire și mișcare, am folosit instrumente precum Google Analytics și am fost treziți de faptul că în blogurile noastre și în site-urile mici, am putea pune niște bucăți de cod acolo și Google ne-ar oferi informații în timp real despre cine vizitează site-ul, când și unde și cum. Și, în timp real, puteam vedea oameni care lovesc site-ul, trec prin pagini și apoi dispar. Și a fost destul de uimitor. Îmi place să fac asta în continuare, atunci când încerc să le explic oamenilor analitice în timp real, le dau jos doar pentru a le arăta un site web cu Google Analytics conectat și de fapt văd interacțiunea live cu oamenii care lovește site-urile web și îi întreb: „Imaginează-ți dacă ai avut aceste informații în timp real asupra afacerii tale. "
Luați un exemplu de vânzare cu amănuntul și poate un produs farmaceutic, cred că îl numiți un magazin de medicamente din America, o farmacie unde mergeți și cumpărați totul, de la comprimate pentru dureri de cap până la cremă solară și pălării. Încercarea de a conduce acea organizație fără informații în timp real este un concept înfricoșător, acum știm ce știm. De exemplu, puteți măsura traficul de picioare, puteți pune dispozitive în jurul magazinului cu o față zâmbitoare pe o parte a ecranului, deoarece sunteți fericiți și un roșu nefericit în extrema dreaptă și câteva nuanțe diferite la mijloc. Și există o platformă numită „Happy or Not” în aceste zile, în care vă plimbați într-un magazin și puteți bate o față fericită sau o față tristă, în funcție de feedback-ul sentimentului viu al clienților. Și asta poate fi interactiv în timp real. Puteți obține prețuri directe bazate pe cerere. Dacă există o mulțime de oameni acolo, puteți ridica prețurile puțin, și puteți face disponibilități de stoc și spuneți oamenilor, de exemplu - companiile aeriene, de exemplu, le vor spune oamenilor câte locuri sunt disponibile acum pe site-ul dvs. atunci când rezervați un zbor, nu doar formați la întâmplare și sper să vă puteți întoarce și să primiți un zbor. Datele în direct de resurse umane, puteți să vă spuneți când oamenii pornesc și pleacă. Achiziții, dacă sunteți în achiziții și aveți date în direct, puteți face lucruri precum așteptați o oră și vă protejați prețul dolarului american pentru a vă cumpăra următoarea încărcătură de stoc și a avea o camionetă de lucruri.
Când le arăt oamenilor Google Analytics și transmit acest tip de anecdotă, acest moment eureka, acest moment „a-ha!”, Acest bec se stinge în mintea lor ca: „Hmm, pot vedea o mulțime de locuri în care aș putea face asta . Dacă aș avea doar instrumentele și dacă aș avea acces doar la aceste cunoștințe. ”Și acum vedem asta în social media. Oricine este un utilizator de socializare priceput, în afară de a arăta doar imagini cu micul dejun, are tendința de a privi câți placere obțin și cât de mult trafic obțin și câți prieteni primesc și fac asta odată cu îi place, să zicem, Twitter ca instrument de analiză. Puteți accesa Twitter.com pentru a utiliza instrumentul, dar tastați în Google com Google Analytics punct com, sau faceți clic pe butonul din dreapta sus și trageți în jos meniul și faceți acest lucru, obțineți aceste grafice frumoase, live, care vă spun câte tweet-uri pe care le faci tu și câte interacțiuni cu ei. Și analize în timp real doar pe rețelele de socializare personale. Imaginează-ți dacă am avea like-uri Google Analytics și Facebook, LinkedIn și Twitter, statisticile eBay vin la tine, dar în mediul de lucru.
Acum avem la îndemână un fel de web și mobil, acesta devine un concept de putere. Și, astfel, mă atrage concluzia mea, și este faptul că invariabil am descoperit că organizațiile care folosesc instrumentele și tehnologia din timp, câștigă un avantaj atât de important față de concurenții lor, încât concurenții ar putea să nu ajungă niciodată la capăt. Și vedem asta acum cu conflictul oamenilor de știință de date cetățenești. Dacă putem lua oameni cu abilități, cunoștințele pentru care le-am angajat și le putem oferi instrumentele potrivite, în special capacitatea de a vedea datele în timp real și de a descoperi date și de a ști unde se află, fără să ne plimbăm prin cabine și puneți întrebări cu voce tare, trebuind să mergeți și să stați la răcitorul de apă pentru a face niște analize comparative cu oamenii sau mergeți și întrebați recepția unde se află indicele. Dacă pot face asta la îndemâna lor și o pot duce la întâlnirile cu ei și se pot așeza într-o cameră de consiliere care trece prin ecrane în timp real, mai degrabă decât o copie pe suport, dintr-o dată ne-am împuternicit personalul care nu are nevoie să fie real oamenii de știință de date, dar pentru a utiliza de fapt știința datelor și pentru a genera rezultate uimitoare pentru organizații. Și cred că acest punct de basculare am trecut de fapt acum, în care consumatorul este orientat către întreprindere, provocarea este cum oferim acea întreprindere și asta este tema pe care cred că am avut-o în discuția de astăzi. Și cu asta, îmi voi înfășura bucata și predau pentru a auzi cum am putea rezolva asta. David, peste tine.
David Sweenor: Bine, mulțumesc atât de mult băieți, și mulțumesc Robin. Știi, Robin, sunt de acord cu evaluarea inițială. Procesul analitic, nu este cu adevărat diferit de dezvoltarea de software. Cred că provocarea din cadrul unei organizații este într-adevăr, știi, poate lucrurile nu sunt la fel de bine definite, poate există o componentă exploratorie și o componentă creativă pentru aceasta. Și Dez, știi, sunt de acord cu tine, este foarte mult să reinventezi roata și știi, nu există o organizație în care să intru astăzi, întrebă, bine, de ce o faci în acest fel? De ce funcționează afacerea în acest fel? Și este ușor de pus la îndoială și de multe ori când sunteți în cadrul unei organizații, este greu de schimbat. Ador analogia, consumarea lucrurilor. Și deci nu mai când merg la aeroport și vreau să-mi schimb locul - o fac pe telefonul mobil. Nu trebuie să mă duc la agentul de la cabină și să mă uit la agentul care introduce ceva pe un monitor monocrom timp de 15 minute pentru a-mi schimba locul. Prefer doar s-o fac pe telefon și deci este o dezvoltare interesantă.
Astăzi, vom vorbi puțin despre inteligența colectivă. Pentru cei care nu sunt conștienți, Statistica este o platformă de analiză de vârf, de aproximativ 30 de ani. Dacă te uiți la oricare dintre publicațiile existente în industria analiștilor, aceasta apare întotdeauna ca unul dintre cele mai intuitive și ușor de utilizat pachet software avansat de analiză. Așa că am petrecut ultimii ani lucrând la un concept numit inteligență colectivă și îl ducem la nivelul următor. Am vrut să încep această conversație cu: cum se realizează munca în organizația dvs.?
Și aici sunt două imagini. Cea din stânga este o imagine din anii ’60 și nu mi-am început cariera în anii ’60, dar imaginea din dreapta este - asta este o fabrică de semiconductori unde am început să lucrez. Și am lucrat în clădirea aceea neagră, pe acoperișul negru în stânga sus. Dar au făcut chestii cu semiconductor. Aceasta este o imagine recentă din Google Images. Dar când te întorci la imaginea din anii ’60 din stânga, este foarte interesant. Aveți aceste persoane așezate într-o linie și creează, știți, circuite integrate și semiconductori. Dar există o standardizare, există un mod standard de a face lucrurile și a existat un proces bine definit. Știți, poate, din moment ce acești oameni stau cu toții într-un mediu deschis, poate a existat o oarecare colaborare. Cred că am pierdut un pic din asta în forța de muncă a cunoștințelor.
Când am stat în clădirea din stânga sus, dacă vreau să colaborez cu cineva, nu era deschis. Existau aceste birouri, poate o parte din echipă era la distanță sau poate că trebuia să călătoresc prin acest campus; a fost o plimbare de 25 de minute și ar trebui să merg să vorbesc cu cineva din clădirea din extrema dreaptă. Cred că am pierdut ceva pe parcurs. Și așa, știi, am avut același gând este, de ce oamenii - câți oameni continuă să reinventeze roata în cadrul organizației tale? Cred că, știți, organizațiile în ansamblu au făcut o treabă bună în anii 1990 și 2000 cu CRM și depozitare de date și, într-o măsură, BI. Din anumite motive, analitica a rămas puțin. Au fost investiții semnificative în depozitarea datelor, în standardizarea și normalizarea datelor dvs. și toate acestea și în CRM, dar analitica a rămas dintr-un anumit motiv. Și mă întreb de ce. Poate există o reclamă - poate că procesul tău nu este bine definit, poate că nu știi ce decizie sau pârghie încearcă să transformi lucrurile, știi, în afacerea ta pentru a schimba lucrurile. Când intrăm în organizații astăzi, există o mulțime de oameni care fac lucrurile foarte manual în foile de calcul.
Și știi, m-am uitat la o statistică în această dimineață, cred că a spus că 80, 90 la sută dintre foile de calcul au erori, iar unele dintre acestea pot fi foarte importante. Ca și cel din Whale, în cazul în care JPMorgan Chase a pierdut miliarde și miliarde de dolari din cauza erorilor din foaia de calcul. Așa că am premisa cred că trebuie să existe o modalitate mai bună de a duce lucrurile la bun sfârșit. Și după cum am menționat, avem acești oameni de știință de date. Acești tipi sunt scumpi și sunt greu de găsit. Și uneori sunt o rață ciudată. Dar cred, știi, dacă ar trebui să rezum ceea ce este un om de știință de date, este probabil cineva care înțelege datele. Cred că este cineva care înțelege matematica, cineva care înțelege problema. Și într-adevăr, cineva care poate comunica rezultatele. Și dacă sunteți un om de date, sunteți foarte norocos chiar acum, deoarece salariul dvs. s-a dublat probabil în ultimii ani.
Dar adevărul este spus, o mulțime de organizații, nu au acești oameni de știință în date, dar organizația dvs. are oameni deștepți. Ai o organizație, ai foarte mulți oameni deștepți și folosesc foi de calcul. Știți, statisticile și matematica nu sunt treaba lor principală, dar folosesc date pentru a conduce afacerea înainte. Într-adevăr, provocarea pe care o abordăm este, cum să luați, dacă aveți norocul să aveți un om de știință de date sau un statistician sau doi, cum puteți să le luați și cum puteți îmbunătăți colaborarea dintre acei oameni alte persoane din organizația dvs.? Dacă aruncăm o privire la felul în care este structurată organizația noastră, voi începe și voi merge de la dreapta la stânga. Știu că acest lucru este înapoi, dar avem această linie de utilizatori de afaceri.
Aceasta este cea mai mare parte a populației de lucrători în cunoștințe și, pentru acești oameni, trebuie să încorporați analitice în linia dvs. de aplicații de afaceri. Poate că văd ieșiri analitice pe ecranul unui centru de apel sau ceva de genul acesta și le spune următoarea cea mai bună ofertă pe care să o acorde unui client. Poate este un consumator sau furnizor de pe un portal web și le oferă instantaneu credit sau lucruri de genul acesta. Dar ideea este că consumă analize. Dacă mergem la mijloc, aceștia sunt acești lucrători ai cunoașterii. Acestea sunt persoanele care fac lucrurile cu foile de calcul astăzi, dar foile de calcul sunt predispuse la erori și, la un moment dat, rămân fără gaz. Acești oameni de știință în domeniul cetățenilor, așa cum îi numim, știți, ceea ce încercăm să facem pentru ei este să creștem cu adevărat nivelul de automatizare.
Și auziți cu analitice că 80 - 90 la sută din lucrare se află în bucata de pregătire a datelor și nu este matematica propriu-zisă, ci este pregătirea datelor. Încercăm să automatizăm asta, indiferent dacă faceți acest lucru, și avem vrăjitori și șabloane și lucruri reutilizabile și nu trebuie să aveți cu adevărat cunoștințe despre infrastructura de bază din mediul dvs. Și atunci dacă ne uităm la extrema stângă, avem acești oameni de știință în date. Și așa cum am menționat, acestea au o ofertă redusă. Și ceea ce încercăm să facem pentru a le face mai productivi, este să le permitem să creeze lucruri pe care acești oameni de știință ai datelor cetățenilor le pot face. Gândiți-vă la acesta ca la un bloc Lego, astfel încât acești oameni de știință de date pot crea un atu reutilizabil pe care un om de știință al datelor cetățenilor îl poate utiliza. Construiți-l o dată, așa că nu trebuie să continuăm să reinventăm roata.
Și, de asemenea, acești tipi ar putea fi îngrijorați dacă putem face lucrurile în baza de date și vom folosi investițiile tehnologice existente pe care compania dvs. le-a făcut. Știți, nu are sens în această zi și vârstă să amestecați date din toate părțile lumii. Așadar, dacă ne uităm la Statistica, așa cum am menționat, este o platformă care este în jur de destul de mult timp. Și este un produs foarte inovator. Amestecare de date, nu a existat o sursă de date la care nu putem avea acces. Avem toate lucrurile de descoperire și vizualizare a datelor pe care le-ați aștepta; o putem face în timp real. Și probabil are - cred că există peste 16.000 de funcții analitice în cadrul instrumentului software, deci asta este mai mult matematică decât aș putea folosi sau înțelege vreodată, dar este acolo dacă aveți nevoie.
Avem capacitatea de a combina atât regulile de afaceri cât și fluxurile de lucru analitice pentru a lua cu adevărat o decizie de afaceri. Vei trece dincolo de doar, iată un algoritm, iată un flux de lucru, dar ai reguli de afaceri cu care trebuie să te ocupi întotdeauna. Suntem foarte siguri în guvernare. Suntem folosiți la mulți clienți farmaceutici, prin faptul că FDA are încredere în noi. Știi, doar dovezi în budinca că avem controalele și capacitatea de a fi acceptate de ei. Și, în sfârșit, știți, suntem deschise și flexibile și extensibile, deci trebuie să creați o platformă care este aceea, doriți ca oamenii de știință ai datelor dvs. să fie productivi, doriți ca oamenii de știință ai datelor pentru cetățeni să fie productivi, doriți să puteți pentru a implementa aceste rezultate analitice lucrătorilor din organizația dvs.
Dacă aruncăm o privire asupra acestuia, iată un exemplu al unor vizualizări. Dar să poți distribui rezultatele analitice către utilizatorii de linii de afaceri, deci primul exemplu din stânga, acesta este o diagramă analitică de rețea. Și poate că sunteți un investigator al fraudei și nu știți cum se realizează aceste conexiuni, iar acestea pot fi persoane, acestea pot fi entități, acestea pot fi contracte, orice este cu adevărat. Dar puteți manipula acest lucru cu mouse-ul și să interacționați cu acesta pentru a înțelege cu adevărat - dacă sunteți un investigator de fraudă, să înțelegeți o listă prioritară cu cine trebuie să cerceteze, nu, pentru că nu puteți vorbi cu toată lumea, așa că aveți a da prioritate.
Dacă ne uităm la imaginea din partea dreaptă acolo, pentru un tablou de bord de întreținere predictiv, aceasta este o problemă cu adevărat interesantă. Poate că sunteți proprietarul unui aeroport și aveți aceste scanere pentru corp acolo. Aceste scanere de corp, dacă mergeți la un aeroport, există unele componente acolo care au o durată de valabilitate de nouă luni. Și aceste lucruri sunt cu adevărat scumpe. Dacă am mai multe puncte de intrare, mai multe scanere în aeroportul meu, numărul 1 vreau să mă asigur că sunt echipat corespunzător la fiecare dintre porți și pentru piesele care se află în scanere, nu vreau să le comand devreme și vreau să le am înainte de a se descompune. Avem capacitatea, poate dacă dețineți un aeroport, pentru a putea prezice când aceste lucruri se vor rupe și prezice nivelurile de personal.
Dacă ne uităm la dreapta jos, aceasta este dacă vă aflați într-un mediu de fabricație, aceasta este doar o reprezentare grafică a fluxului de fabricație. Și este ușor de văzut, dar există semafoare roșii și verzi pe aceste diverse sectoare de proces, așa că, dacă sunt inginer, există acolo matematici foarte sofisticate, dar pot să mă descurc în acel sector de proces special și să mă uit parametrii și intrarea pe care, poate face ca acest lucru să fie scăpat de sub control. Dacă ne uităm la omul de știință al datelor despre cetățeni, obiectivul nostru este într-adevăr să-l ușureze pe omul de date al cetățenilor. Avem vrăjitori și șabloane, iar un lucru cred că este cu adevărat interesant, este că avem acest nod automat de verificare a stării de sănătate a datelor. Și, într-adevăr, ce face asta, are smart-uri încorporate.
Am menționat pregătirea datelor - este nevoie de mult timp, adică atât în agregarea datelor, cât și în pregătirea acestora. Dar să presupunem că am datele mele, le pot rula prin acest nod de verificare a stării de sănătate a datelor, și verifică invariabilitatea, spațialitatea și valorile exterioare, și toate aceste lucruri, completează valori care lipsesc și face multă matematică. Nu înțeleg, deci pot accepta setările implicite, sau dacă sunt puțin mai deștept, le pot schimba. Dar ideea este că vrem să automatizăm acest proces. Acest lucru face aproximativ 15 controale și rezultate diferite pe un set de date curățate. Ceea ce facem este să facem acest lucru mai ușor pentru oameni să creeze aceste fluxuri de lucru.
Aici vorbim despre colaborarea dintre oamenii de știință de date și oamenii de știință pentru date cetățenești. Dacă privim aceste imagini din dreapta, vedem acest flux de lucru pentru pregătirea datelor. Și poate asta este foarte sofisticat, poate acesta este sosul secret al companiei dvs., nu știu, dar știm că cineva din organizația dvs. poate accesa unul sau mai multe dintre aceste silozuri de date pe care le avem. Avem nevoie de o modalitate de a, numărul unu, de a le apuca și de a le coasa, și numărul doi, poate că avem nevoie de prelucrări speciale pe care vrem să le facem, că este dincolo de verificarea sănătății datelor noastre și acesta este sosul secret al companiei tale. Pot crea acest flux de lucru în cadrul organizației noastre și se prăbușește ca un nod. Vedeți săgeata orientată în jos, este doar un nod și putem avea o sută din aceste lucruri în cadrul unei organizații. Ideea este că avem oameni care știu ceva despre un anumit spațiu, pot crea un flux de lucru și altcineva poate reutiliza asta. Încercăm să reducem la minimum reinventarea roții.
Și putem face același lucru cu fluxurile de lucru de modelare analitică. În acest caz din dreapta, acest flux de lucru, poate există 15 algoritmi diferiți și vreau să-l aleg pe cel mai bun pentru sarcină. Și nu trebuie să înțeleg ca om de știință a datelor despre cetățean ce se întâmplă în acea încurcătură web de păianjen acolo, dar se prăbușește doar într-un nod și poate că acel nod spune pur și simplu, „calculați scorul de risc de credit”. „Calculați șansa a unei infecții la locul chirurgical ”, ce aveți. „Calculează probabilitatea ca ceva să fie o tranzacție frauduloasă.” În calitate de om de știință al datelor cetățenilor, pot folosi această matematică foarte sofisticată pe care a construit-o altcineva, poate unul dintre acești oameni de știință de date a construit în cadrul organizației mele.
Din perspectiva științei datelor, știți, am vorbit cu oamenii de știință care iubesc să scrie cod și am vorbit cu oamenii de știință de date care urăsc să scrie cod. Și este în regulă, așa că avem o interfață de utilizator foarte vizuală, grafică. Ne putem prelua datele, putem face verificarea automată a sănătății datelor noastre și poate vreau să scriu cod. Îmi place Python, îmi place R, dar ideea este că acești oameni de știință de date, au o ofertă redusă și le place codul într-un anumit limbaj. Nu avem în special o preferință pentru ce limbă doriți să codați, așa că dacă doriți să faceți R, faceți R; dacă vrei să faci Python, fă Python. Grozav. Dacă doriți să explodați analiza dvs. în Azure, izbucniți-vă analiza în cloud. Și, astfel, obiectivul de aici este de a oferi cu adevărat flexibilitate și opțiuni pentru a face oamenii de știință ai datelor la fel de productivi.
Acum oamenii de știință de date, sunt oameni destul de deștepți, dar poate nu sunt specialiști în toate, și poate există anumite lacune în ceea ce pot face. Și dacă vă uitați în interiorul industriei, există o mulțime de piețe analitice diferite care există acolo. Acesta este un exemplu de, poate că trebuie să fac recunoaștere de imagine și nu am această abilitate, bine că pot ieși în Algoritmia și obțin un algoritm de recunoaștere a imaginii. Poate ies la Apervita și obțin un algoritm de asistență medicală foarte special. Poate vreau să folosesc ceva în biblioteca de învățare a mașinilor Azure. Poate vreau să folosesc ceva în platforma natală Statistica.
Din nou, ideea de aici este că vrem să folosim comunitatea globală de analiză. Pentru că nu veți avea toate abilitățile în cei patru pereți, atunci cum putem crea software - și asta facem noi - asta permite oamenilor de știință de date să folosească algoritmi dintr-o varietate de piețe. O facem cu R și Python de multă vreme, dar aceasta extinde acest lucru la aceste piețe de aplicații care există acolo. Și același lucru pe care îl vedeți aici în partea de sus a acestuia, folosim H2O pe Spark, așa că există o mulțime de algoritmi analitici acolo. Nu trebuie să vă concentrați pe crearea acestora de la zero, să le reutilizăm pe cele care trăiesc în comunitatea open source și dorim ca acești oameni să fie cât mai productivi.
Următorul pas, după ce avem oamenii de știință ai datelor despre cetățeni și oamenii de știință ai datelor, este într-adevăr cum promovați și distribuiți aceste bune practici? Avem tehnologie în software-ul nostru care vă permite să distribuiți analitice oriunde. Și aceasta este mai mult o vedere a managementului modelului, dar nu mai sunt legată de cei patru pereți sau de o instalație specifică din Tulsa, Taiwan sau California sau ce aveți. Aceasta este o platformă globală și avem mulți, mulți clienți pe care este dislocată în utilizarea sa de mai multe site-uri.
Și, într-adevăr, lucrurile cheie sunt, dacă faci ceva în Taiwan și vrei să-l reproduci în Brazilia, este minunat. Intrați acolo, apucați șabloanele reutilizabile, apucați fluxurile de lucru pe care le doriți. Acest lucru încearcă să creeze aceste standarde și modul comun de a face lucrurile, așa că nu facem lucruri complet diferite peste tot. Iar cealaltă componentă cheie a acestui lucru, este că vrem să ducem matematica la locul în care trăiesc datele. Nu trebuie să întrerupeți date între, California, Tulsa și Taiwan și Brazilia. Avem o tehnologie care ne permite să ducem matematica la date și vom avea un alt webcast Hot Technology pe acest subiect.
Dar numim această arhitectură și iată o aruncare aruncată, Arhitectura Analitic Distribuit Nativ. Ideea cheie din spatele acestui lucru este că avem o platformă, Statistica și pot exporta un flux de lucru analitic ca atom. Și aș putea face un model sau un întreg flux de lucru, așa că nu contează. Dar pot să creez acest lucru și să îl pot exporta într-un limbaj adecvat platformei țintă. În partea stângă a acestui lucru, o mulțime de oameni fac acest lucru, dar fac notări în sistemul sursă. Este în regulă, putem face notări și putem face modelarea în baza de date, deci este interesant.
Și apoi pe partea dreaptă, avem Boomi. Aceasta este o tehnologie însoțitoare, lucrăm cu toate acestea. Dar putem lua și aceste fluxuri de lucru și, în esență, să le transportăm oriunde în lume. Orice lucru care are o adresă IP. Și nu trebuie să am instalat un Statistica pe cloud public sau privat. Orice poate rula un JVM, putem rula aceste fluxuri de lucru analitice, fluxuri de lucru de pregătire a datelor sau doar modele pe oricare dintre aceste platforme țintă. Fie că este în norul meu public sau privat, fie că este în tractorul meu, mașina mea, casa mea, becul meu, internetul lucrurilor, avem o tehnologie care vă permite să transportați acele fluxuri de lucru oriunde în lume.
Să recapitulăm. Știți, avem o linie de utilizatori de afaceri, așa că acești oameni, avem tehnologie, le permite să consume rezultate într-un format cu care sunt confortabili. Avem oameni de știință în domeniul cetățenilor, iar ceea ce încercăm să facem este să îmbunătățim colaborarea, să îi facem parte dintr-o echipă, nu? Și așa vrem ca oamenii să nu mai reinventeze roata. Și avem acești oameni de știință de date, ar putea exista un decalaj de competență acolo, dar pot codifica într-un limbaj pe care și-l doresc, pot merge pe piețele analitice și pot folosi algoritmi. Și tot cu asta, cum ai putea să nu crezi că totul este minunat cu asta? Acest lucru este perfect, asta facem. Construim fluxuri de lucru refolosibile, oferim instrucțiuni oamenilor, le oferim blocurile Lego, astfel încât să poată construi aceste castele puternice și orice vor. Pentru a rezuma, avem o platformă care permite abilității de utilizatori de afaceri, oameni de știință de date cetățenești, oameni de știință de date programatori, avem - putem aborda orice fel de caz de utilizare a analizelor de margine IoT și permitem această noțiune de inteligență colectivă. Cu asta, cred că probabil îl vom deschide pentru întrebări.
Robin Bloor: Bine bine. Cred că primul - vreau să fiu sincer, vreau să spun că am fost informat anterior de Dell Statistica și, sincer, sunt de fapt surprins de lucrurile pe care nu știam că le-ați prezentat în prezentare . Și trebuie să spun că singurul lucru, este ceva care a fost o problemă pentru mine în adoptarea analitice, este că, știi, să primești instrumentele nu-i așa, știi? Există o mulțime de instrumente groaznice, există instrumente open source și așa mai departe și așa mai departe, și există diverse, cum aș numi, semi-platforme. Dar cred că diferența pe care o aveți, am fost deosebit de impresionată de o parte din fluxul de lucru.
Dar diferența este că parcă oferiți sfârșit până la capăt. Este ca și cum analitica este un proces de afaceri sofisticat, care începe cu achiziția de date și apoi parcurge o serie întreagă de pași, în funcție de cât de lipsite de date sunt datele, apoi se pot ramifica într-o serie întreagă de atacuri matematice diferite la date. Și apoi rezultatele apar într-un fel sau altul și acestea trebuie să fie acțiuni. Am găsit o sumă imensă de analize în care s-au lucrat foarte multe, dar nu se pune în acțiune. Și se pare că aveți o mulțime de lucruri groaznice. Nu știu cât de cuprinzător este, dar este mult mai cuprinzător decât mă așteptam. Sunt incredibil de impresionat de asta.
Aș dori să comentați foile de calcul. Ați spus deja ceva, dar unul dintre lucrurile pe care le-am remarcat și pe care le-am remarcat de-a lungul anilor, dar pur și simplu a devenit din ce în ce mai evident, este că există o mulțime de foi de calcul care sunt sisteme de umbre și chiar cred foaia de calcul, vreau să spun, a fost un instrument minunat atunci când a fost introdus și a fost minunat de atunci, în mai multe moduri diferite, dar este un instrument generalizat, nu este într-adevăr potrivit pentru scop. Cu siguranță nu este foarte bun în contextul BI și cred că este groaznic în contextul analitic. Și m-am întrebat dacă aveți niște comentarii pe care să le faceți, să spunem, exemple în care, știți, Statistica s-a stins, utilizarea excesivă a foii de calcul sau orice comentariu ați dori să faceți despre asta?
David Sweenor: Da, cred că, puteți vedea greșeli celebre ale foii de calcul. Google sau orice alt motor de căutare pe care îl utilizați vor reveni cu o litanie de rezultate. Nu cred, știi, vom înlocui vreodată foile de calcul. Aceasta nu este intenția noastră, dar o mulțime de organizații la care merg, există câteva dintre aceste vrăjitoare sau ninja sau orice doriți să le numiți, dar au aceste foi de calcul foarte sofisticate și trebuie să vă gândiți, ce se întâmplă când acestea oamenii câștigă loto și nu se mai întorc? Și deci, ceea ce încercăm să facem este, știm că vor exista foi de calcul, astfel încât să le putem ingera, dar cred că ceea ce încercăm să dezvoltăm o reprezentare vizuală a fluxului de lucru, astfel încât să poată fi înțeles și împărtășit cu alte persoane . Fișele de calcul sunt destul de greu, destul de greu de distribuit. Și de îndată ce îmi transmiteți foaia de calcul pentru mine, am schimbat-o, iar acum nu mai avem sincronizare și obținem răspunsuri diferite. Ceea ce încercăm să facem este să punem niște balustrade în acest sens și să facem lucrurile un pic mai eficiente. Și foile de calcul sunt într-adevăr groaznice la combinarea mai multor seturi de date, știți? Ei cad acolo. Dar nu le vom înlocui, le ingerim și avem oameni care încep să se schimbe, deoarece dacă avem un nod care spune „calculează riscul”, asta încearcă să facă persoana care folosește tabelul. Deci, acestea au dispărut.
Robin Bloor: Da, adică, aș spune că, știi, dintr-una dintre perspectivele în care privesc lucrurile, aș spune că foile de calcul sunt grozave pentru crearea de informații. Sunt chiar grozave pentru crearea insulelor de cunoaștere, dar sunt foarte proaste pentru împărtășirea cunoștințelor. Nu au niciun mecanism pentru a face asta, și dacă transmiteți o foaie de calcul către cineva, nu este ca și cum puteți citi-o ca și cum ar fi un articol care a explicat exact ce fac. Doar că nu este acolo. Cred că, știi, lucrul care m-a impresionat cel mai mult în ceea ce privește prezentarea și despre capacitățile Statistica, pare a fi incredibil de agnostic. Dar acest thread trece prin el a fluxului de lucru. Am dreptate să presupun că ai putea să te uiți la un flux de lucru de la capăt la altul, știi, de la achiziția de date până la încorporarea rezultatelor în anumite aplicații BI sau chiar rularea aplicațiilor?
David Sweenor: Da, absolut. Și are această capacitate de la capăt la cap, iar unele organizații o folosesc în întregime, iar eu nu sunt deloc iluzioasă că o companie cumpărează în zilele noastre totul de la un furnizor. Avem un mix. Unii utilizează Statistica pentru orice, iar alții îl folosesc pentru modelarea fluxurilor de lucru, unii îl folosesc pentru fluxurile de pregătire a datelor. Unii oameni îl folosesc pentru a distribui sute de rapoarte de inginerie inginerilor. Și astfel avem totul între noi. Și este într-adevăr end-to-end și este, știți, o platformă agnostică, prin faptul că, dacă există algoritmi pe care doriți să-i utilizați în R sau Python, Azure, Apervita, orice, știți, folosiți-i. Este excelent, fii productiv, folosește ceea ce știi, folosește ceea ce ești confortabil și avem mecanisme pentru a ne asigura că acestea sunt controlate și audibile și tot felul de lucruri.
Robin Bloor: Îmi place în special aspectul acesta. Adică, nu știu dacă poți vorbi dincolo de ceea ce ai spus bogăției din ceea ce există. Adică, m-am uitat la acest lucru, dar nu l-am privit într-un mod cuprinzător și, cu siguranță, există o mare cantitate de biblioteci Python în bibliotecile noastre, dar puteți adăuga ceva la acea imagine? Deoarece cred că acesta este un lucru foarte interesant, știi, ideea că vei avea componente care erau de încredere, pentru că cunoșteai diverse persoane care le creaseră și diverse persoane care le foloseau pe care le puteți descărca. Știi, poți îmbogăți ceea ce ai spus deja despre asta?
David Sweenor: Da, cred că unele dintre piețele de aplicații, știți, algoritmele de pe piața care există. De exemplu, știi, Dr. John Cromwell de la Universitatea din Iowa, el a dezvoltat un model care va prezice, care este folosit în timp real, în timp ce suntem operați, vă va oferi un scor dacă veți obține un infecție la locul chirurgical. Și dacă acest scor este suficient de mare, vor lua o intervenție chiar în sala de operație. Este foarte interesant. Poate că există un alt spital care nu este la fel de mare. Ei bine, Apervita este o piață de aplicații pentru sănătate pentru analitice. Puteți merge fie să găsiți una din multele piețe de aplicații, puteți merge să le găsiți și să le reutilizați, iar tranzacția este între dvs. și cine deține asta, dar puteți merge să găsiți una, sau puteți spune: „Iată ceea ce am nevoie. Cred că valorifică acea comunitate globală, deoarece toată lumea este un specialist în aceste zile și nu poți ști totul. Cred că R și Python sunt un lucru, dar această idee de „Vreau să fac această funcție, să pun un specimen acolo pe una dintre aceste locuri de piață de aplicații și să-l dezvolte pe cineva pentru tine.” Și pot monetiza asta, cred este foarte interesant și foarte diferit decât modelul pur sursă deschisă.
Robin Bloor: Bine. Oricum, voi trece mingea lui Dez. Ți-ar plăcea să te scufunzi, Dez?
Dez Blanchfield: Absolut și mi-ar plăcea să rămân pe foaia de calcul doar pentru o clipă, deoarece cred că a surprins ideea corectă a multor lucruri despre care vorbim aici. Și ai făcut un comentariu, Robin, cu privire la trecerea de la un fel de foi de calcul vechi în forma lor fizică la forma electronică. Am avut loc un lucru interesant în care, știi, când foile de calcul erau inițial un lucru, erau doar coli de hârtie cu rânduri și coloane și scriai manual lucrurile, apoi le vei scrie și le vei calcula, fie făcând este în partea de sus a capului sau cu un alt dispozitiv. Dar avem încă oportunitatea ca erorile să se încadreze cu greșeli de scriere de mână sau dislexie, iar acum am înlocuit-o cu dactilografii. Riscul este că, cu foile de calcul, profilul de risc este mai rapid și mai mare, dar cred că instrumentele precum Statistica inversează piramida de risc.
De multe ori desenez această imagine pe o tablă albă a unei figuri a unui om în partea de sus, ca o singură persoană, și apoi o colecție de ele în partea de jos, să zicem, să ne imaginăm zece dintre ele în partea de jos a acelei tablă și am desenat un piramida unde punctul piramidei este la persoana singură și piciorul piramidei este colectia de oameni. Și eu folosesc acest lucru pentru a vizualiza ideea că dacă o persoană din partea de sus face o foaie de calcul face o greșeală și o împărtășește cu zece persoane, iar acum avem zece copii ale erorii. Fii foarte atent la macro-urile tale și fii foarte atent la Visual Basic dacă vei trece la asta. Pentru că atunci când construim instrumente electronice precum foile de calcul este foarte puternic, dar este puternic și într-un mod bun și rău.
Cred că instrumente precum Statistica aduc abilitatea de a inversa acel profil de risc și că acum puteți ajunge la punctul în care ați obținut o mulțime de instrumente care sunt disponibile pentru fiecare persoană în parte, iar acestea pleacă de la o mulțime de instrumente din partea de sus a piramida și apoi în jos, chiar unde punctul piramidei care este acum inversat este instrumentul real, dacă avem o echipă de oameni care construiesc acele instrumente și acei algoritmi. Și oamenii de știință de date nu trebuie să fie un specialist în analiza regresivă a datelor lor. S-ar putea să folosească instrumentul, dar s-ar putea să aveți cinci sau șase statistiști și un actuar și un om de știință de date și unii matematicieni care lucrează la acel instrument, acel modul, acel algoritm, acel plug-in și așa în limbajul foii de calcul, deci imaginați-vă că fiecare foaie de calcul publicată pe care ați putea fi utilizată a fost scrisă de fapt de specialiști care au testat macro-urile, au testat Visual Basic, s-au asigurat că algoritmii funcționează, așa că atunci când ați obținut-o puteți să introduceți date în ea, dar nu puteți efectiv să o spargeți și, prin urmare, a fost mai bine să controlezi.
Cred că multe dintre instrumentele de analiză fac asta. Bănuiesc că, ajungând la acest aspect, vedeți că acum pe teren, vedeți tranziția de la foile de calcul care ar putea împiedica erori, greșeli și riscuri, până la punctul în care instrumentele pe care le construiți cu dvs. platforme acum, descoperirea datelor fiind exactă în timp real, iar persoanele care construiesc modulele și algoritmii elimină sau reduc profilul respectiv de risc? Serviciul clienți vede asta într-un sens real sau credeți că asta se întâmplă doar și nu își dau seama?
David Sweenor: Știi, cred că există câteva modalități de a răspunde la asta. Dar ceea ce vedem este, știți, în orice organizație și am menționat că analizele cred că a rămas poate din perspectiva investițiilor corporative, genul de ceea ce am făcut cu stocarea de date și CRM. Dar ceea ce vedem, deci este nevoie de multe pentru a schimba o organizație, pentru a trece peste acea inerție organizațională. Dar ceea ce vedem este că oamenii își iau foile de calcul, își iau fluxurile de lucru și am menționat securitatea și guvernanța, „Ei bine, poate am o foaie de calcul”, „Ei bine, pot bloca acest lucru și pot să-l controlez.” vedem o mulțime de organizații, poate că încep doar de acolo. Și dacă se schimbă, există un flux de lucru și sfârșesc să merg, numărul unu, totuși, cine l-a schimbat? De ce au schimbat-o. Când au schimbat-o. Și, de asemenea, pot configura un flux de lucru astfel încât să nu introduc această nouă foaie de calcul în producție decât dacă este validată și verificată de una, două, trei, oricâte părți doriți să le definiți în fluxul de lucru. Cred că oamenii încep să facă și organizațiile încep să facă pași acolo, dar probabil aș sugera că avem un drum lung de parcurs.
Dez Blanchfield: Într-adevăr și cred că, având în vedere că vă construiți atât în controalele de securitate, cât și în guvernanța de acolo, atunci volumul de lucru poate face o abordare automată a acestui lucru și totul până la ofițerul de risc, care acum este un lucru. Puteți începe să controlați modul în care sunt accesate acele instrumente și sisteme și cine face ce face cu ele, deci este foarte puternic. Cred că celelalte lucruri care vin în acest sens sunt că tipurile de instrumente pe care le oferiți, pentru mine, acordă mai mult comportamentului uman decât foilor de calcul tradiționale despre care vorbim, în condițiile în care, dacă am o cameră plină de oameni cu același tablou de bord și acces la aceleași date pe care le pot obține de fapt o viziune diferită și, ca urmare, pot obține informații ușor diferite din aceleași informații, care se potrivesc nevoilor lor, astfel încât să poată colabora. Avem apoi o viziune și o interacțiune mai umană cu afacerea și procesul de luare a deciziilor, spre deosebire de toate mergând la aceeași întâlnire cu același PowerPoint și sunt tipărite aceleași foi de calcul, toate aceleași date fixe.
Vedeți o tranziție a comportamentului și a culturii în organizații care vă ocupă de instrumente acum, unde văd că se întâmplă, unde nu sunt ca cinci persoane din cameră care privesc aceeași foaie de calcul care încearcă să o verbalizeze și să ia note pe ea, dar acum interacționează de fapt cu tablourile de bord și instrumentele în timp real, cu vizualizarea și analiza la îndemâna lor și obțin un flux complet diferit asupra conversației și interacțiunii, nu doar la întâlniri, ci doar colaborarea generală în jurul organizației? Pentru că o pot face în timp real, pentru că pot pune întrebări și obține un răspuns real. Este o tendință pe care o vedeți în acest moment sau nu s-a întâmplat încă deloc?
David Sweenor: Nu, cred că s-a pornit definitiv pe acea cale și cred că lucrul foarte interesant este, știi, dacă luăm exemplul unei fabrici, de exemplu. Poate că cineva care deține un anumit sector de proces din fabrica respectivă dorește să privească și să interacționeze cu aceste date într-un anumit mod. Și poate eu, trecând cu vederea toate procesele, poate acesta pe partea de jos, poate vreau să mă uit la toate. Cred că ceea ce vedem este, numărul unu, oamenii încep să folosească un set comun de vizualizări sau vizualizări standard în cadrul organizațiilor lor, dar este adaptat și la rolul în care sunt. Dacă sunt inginer de proces, poate aceasta este o viziune foarte diferită de cineva care o privește din perspectiva lanțului de aprovizionare și cred că este grozav pentru că trebuie adaptată și trebuie privită prin obiectivul pe care trebuie să-l îndeplinești.
Dez Blanchfield: Cred că procesul decizional scade, în timp și rapid, pentru a lua decizii inteligente și precise crește rapid și tu, nu-i așa? Pentru că, dacă ai analize în timp real, tablouri de bord în timp real, dacă ai instrumentele Statistica la îndemână, nu trebuie să alergi peste podea pentru a merge și să întrebi pe cineva despre ceva, ai primit în copie. Puteți colabora, interacționa și lua de fapt decizii din mers și obțineți rezultatul imediat. Ceea ce cred că unele dintre companii chiar nu au înțeles, dar când vor face acest lucru va fi acest moment eureka care, da, putem rămâne în cabinele noastre și să lucrăm acasă, dar putem interacționa și colabora și aceste decizii. facem pe măsură ce colaborăm să ne transformăm instantaneu în rezultate. Uite, cred că a fost fantastic să aud ce ai de spus până acum și aștept cu nerăbdare să văd unde merge. Și știu că avem o mulțime de întrebări în întrebări și întrebări, așa că o să mă întorc în Rebecca pentru a parcurge unele dintre acestea, astfel încât să putem ajunge la cele cât de repede poți. Mulțumesc foarte mult.
Rebecca Jozwiak: Mulțumesc Dez, și da, Dave, avem destul de multe întrebări din partea publicului. Și mulțumesc Dez și Robin pentru ideile tale, de asemenea. Știu că acest anumit participant a trebuit să renunțe la începutul orei, dar este cam întrebător, vedeți că departamentele de sisteme de informații pun mai multă prioritate asupra controalelor sofisticate de date, și nu sunt confortabile în furnizarea de instrumente pentru lucrătorii cunoașterii? Adică, este asta - mergi mai departe.
David Sweenor: Da, cred că depinde de organizație. Cred că o bancă, o companie de asigurări, poate au priorități și moduri diferite de a face lucrurile, față de o organizație de marketing. Bănuiesc că ar trebui să spun că depinde doar de industria și funcția pe care o analizați. Industrii diferite au focus și accent diferite.
Rebecca Jozwiak: Bine, asta are sens. Și apoi un alt participant a dorit să știe, care este motorul din spatele Statistica? Este C ++ sau lucrurile proprii?
David Sweenor: Ei bine, nu știu dacă pot să mă ocup de asta cu faptul că asta a trecut de 30 de ani și a fost dezvoltat înainte de vremea mea, dar există o bibliotecă de bază a algoritmilor analitici care sunt algoritmi statistica care funcționează. Și ai văzut aici că, de asemenea, putem rula R, putem rula Python, putem exploda până la Azure, putem rula pe Spark la H2O, deci cred că ar trebui să răspund la această întrebare în ceea ce privește, este o varietate de motoare. Și în funcție de algoritmul pe care îl alegeți, dacă este unul Statistica, acesta rulează astfel, dacă alegeți unul pe H2O și Spark, îl folosește și deci este o varietate de ele.
Rebecca Jozwiak: Bine bine. Un alt tip de participanți a întrebat care indică în mod special acest diapozitiv, dorind să știe, ce fel de știință de date despre cetățean știe ce șabloane reutilizabile să folosească? Și cred că voi face o întrebare mai largă din asta. Asta, ce vezi când utilizatorii de linii de afaceri sau analiștii de afaceri vin și vor să utilizeze aceste instrumente, cât de ușor este pentru ei să ridice și să meargă la rulare?
David Sweenor: Bănuiesc că aș răspunde și, dacă poți folosi, dacă ești familiar cu Windows, aceasta este o platformă bazată pe Windows, așa că am tăiat partea de sus a acestor capturi de ecran, dar are panglică Windows. Dar de unde știu ce flux de lucru să folosească? Arată ca Windows Explorer, deci există o structură de arbore și o puteți configura și configura, oricum organizația dvs. dorește să o configureze. Dar poate fi, ai avea doar aceste foldere și ai introduce aceste șabloane reutilizabile în aceste dosare. Și cred că există probabil o nomenclatură pe care ar putea-o adopta compania dvs., spuneți aici „calculați profilul de risc”, iată „obțineți date din aceste surse” și le numiți orice doriți. Este doar un folder gratuit, pur și simplu trageți notele chiar pe panza dvs. Deci, destul de ușor.
Rebecca Jozwiak: Bine bine. Poate o demo data viitoare. Apoi, un alt tip de participant a apărut, și despre ceea ce tu și Robin și Dez vorbeau în ceea ce privește inexactitățile, în special pe o foaie de calcul, dar gunoiul din / gunoiul îl vede și el este și mai critic când vine vorba. la analitice. Un fel de menționare a faptului că, știți, utilizarea necorespunzătoare a datelor poate duce cu adevărat la unele decizii nefericite. Și se întreabă care sunt părerile dvs. despre dezvoltarea mai multor algoritmi de siguranță, cred că, el folosește cuvântul, „excesiv” de analiză. Știi, cineva vine, se entuziasmează, vor să facă aceste analize avansate, vor să ruleze acești algoritmi avansați, dar poate nu sunt destul de siguri. Deci, ce faci pentru a proteja împotriva acestui lucru?
David Sweenor: Da, deci cred că voi răspunde la acest lucru cât pot de bine, dar cred că totul se rezumă la oameni, proces și tehnologie. Avem o tehnologie care ajută la activarea oamenilor și ajută la activarea oricărui proces pe care doriți să îl implementați în organizația dvs. În exemplul de a trimite un cupon către cineva, poate că nu este la fel de critic și, dacă este digital, nu costă cu adevărat, poate există un nivel de controale de securitate și poate nu ne pasă. Dacă prezic infecții la locul chirurgical, poate vreau să fiu puțin mai atent la asta. Sau dacă prezic calitatea și siguranța drogurilor și lucruri de genul acesta, poate vreau să fiu puțin mai atent la asta. Ai dreptate, gunoiul / gunoiul, deci ceea ce încercăm să facem este să oferim o platformă care să vă permită adaptarea la orice proces dorește să adopte organizația dvs.
Rebecca Jozwiak: Bine bine. Mai am câteva întrebări, dar știu că am trecut destul de mult peste oră și vreau doar să le spun prezentatorilor noștri, asta a fost minunat. Și vrem să mulțumim atât de mult lui Dave Sweenor de la Dell Statistica. Desigur, dr. Robin Bloor și Dez Blanchfield, vă mulțumesc că ați fost analistii astăzi. Vom avea o altă transmisie web luna viitoare cu Dell Statistica. Știu că Dave a dat o idee despre acest subiect. Va fi vorba despre analize la margine, un alt subiect fascinant și știu că vor fi discutate câteva cazuri foarte convingătoare de utilizare pe acel webcast. Dacă ți-a plăcut ce ai văzut astăzi, revino pentru mai multe luna viitoare. Și cu asta, oameni buni, îți iau rămas bun. Multumesc mult. Pa! Pa.