Î:
De ce este important ca oamenii de știință să caute transparență?
A:Transparența este esențială în mod esențial în proiectele de știință a datelor și în programele de învățare automată, în parte datorită complexității și sofisticării care le conduce - pentru că aceste programe „învață” (generează rezultate probabilistice) și nu urmează instrucțiuni de programare liniare prestabilite și, ca urmare, poate fi greu de înțeles cum tehnologia ajunge la concluzii. Problema „cutiei negre” a algoritmilor de învățare a mașinilor care nu sunt pe deplin explicabile pentru factorii de decizie umani este una importantă în acest domeniu.
Având în vedere acest lucru, a fi capabil să stăpânească învățarea automată explicabilă sau „AI explicabilă” va fi probabil un accent principal în modul în care companiile urmăresc achiziția de talent pentru un om de știință de date. DARPA, instituția care ne-a adus internetul, finanțează un studiu multimilionar în AI explicabilă, încercând să promoveze abilitățile și resursele necesare pentru a crea tehnologii de învățare automată și inteligență artificială, transparente pentru om.
O modalitate de a gândi este faptul că există adesea o „etapă de alfabetizare” a dezvoltării talentelor și o „etapă de hiperliterafie”. Pentru un om de știință de date, etapa tradițională de alfabetizare ar fi cunoștințele despre cum să punem la cale programe de învățare automată și cum să construim algoritmi cu limbi precum Python; cum să construiți rețele neuronale și să lucrați cu ele. Etapa de hiperliterafie ar fi capacitatea de a stăpâni AI explicabilă, de a oferi transparență în utilizarea algoritmilor de învățare automată și de a păstra transparența pe măsură ce aceste programe își desfășoară obiectivele și obiectivele gestionarilor lor.
Un alt mod de a explica importanța transparenței în știința datelor este că seturile de date care sunt utilizate continuă să devină mai sofisticate și, prin urmare, mai potențial intruzive în viața oamenilor. Un alt factor important al învățării automate explicabile și al științei datelor este Regulamentul general european privind protecția datelor, care a fost implementat recent pentru a încerca să reducă utilizarea neetică a datelor cu caracter personal. Folosind GDPR ca un caz de test, experții pot vedea cum nevoia de a explica proiectele de știință a datelor se încadrează în problemele de confidențialitate și securitate, precum și etica în afaceri.