Acasă Audio De ce unele proiecte de învățare automată ar putea necesita un număr enorm de actori?

De ce unele proiecte de învățare automată ar putea necesita un număr enorm de actori?

Anonim

Î:

De ce unele proiecte de învățare automată ar putea necesita un număr enorm de actori?

A:

Când vă gândiți la învățarea mașinii, aveți tendința să vă gândiți la oameni de știință calificați care lucrează la tastaturi în sălile de calculatoare. Există un accent extrem pe analiză cantitativă și algoritmi. Nu există o mulțime de contexte reale din lumea reală pentru multe dintre aceste programe - cel puțin asta ar crede mulți.

Cu toate acestea, unele dintre cele mai cunoscute programe de învățare a mașinilor din ziua de azi folosesc adevărate armate de actori umani pe stradă, în magazine și oriunde, care pot modela activități umane de bază, cum ar fi mersul pe jos, munca sau cumpărăturile.

Descărcare gratuită: învățarea mașinii și de ce contează

Un articol cu ​​fir de la Tom Simonite ilustrează foarte bine acest lucru cu titlul apt „Pentru a face AI mai inteligentă, oamenii îndeplinesc sarcini cu rate reduse.

Folosind exemplul de videoclipuri scurte realizate într-un magazin alimentar Whole Foods, Simonite evidențiază tipurile de lucrări care vor ajuta la dezvoltarea unei etape a următoarei etape de învățare a mașinilor.

Acest lucru duce la întrebarea de ce toate aceste persoane se angajează să se filmeze în videoclipuri scurte și simple, care documentează acțiuni la fel de rudimentare precum mișcarea unui braț sau a unui picior.

Răspunsul aruncă o lumină asupra locului în care este învățarea automată și unde se întâmplă.

„Cercetătorii și antreprenorii vor să vadă AI-ul să înțeleagă și să acționeze în lumea fizică”, scrie Simonite, explicând de ce el și alții se plimbă cu camerele de filmat. „De aici nevoia lucrătorilor să facă scene în supermarketuri și case. Ei generează materialul de instruire pentru a învăța algoritmi despre lume și despre oamenii din ea. ”

După cum vor sublinia mulți experți, unele dintre cele mai mari frontiere ale învățării automate implică procesarea imaginilor și procesarea limbajului natural. Acestea sunt proceduri extrem de cantitative - cu alte cuvinte, nu există un spectru larg de intrări, precum există în medii reale „performante”. În schimb, programele de învățare automată folosesc date vizuale și audio în moduri foarte specifice pentru a construi modele. Odată cu procesarea imaginii, acesta alege funcții dintr-un câmp vizual (finit). Pentru NLP, este vorba de asamblarea fonemelor.

Trecerea dincolo de aceste categorii de inputuri specifice implică ceva pe care l-ai putea numi „gol și imagine și vorbire” - în a depăși lucruri precum procesarea imaginilor și recunoașterea vorbirii, te muti în zone în care calculatoarele trebuie să fie analitice în moduri diferite. Seturile de instruire vor fi fundamental diferite.

Intră în armata videografilor. În unele dintre aceste noi proiecte de învățare automată, cele mai mici idei ale activităților umane sunt seturile de instruire. În loc să fie instruiți să caute funcții și muchii și pixeli care compun sarcini de clasificare, computerele utilizează în schimb videoclipuri de instruire pentru a evalua cum arată diferitele tipuri de acțiuni.

Lucrul esențial este ceea ce pot face inginerii cu aceste date atunci când sunt agregate și încărcate și când computerul este instruit pe acestea. În curând veți vedea rezultatele în diferite domenii - de exemplu, acest lucru va face supravegherea extrem de eficientă. Calculatoarele vor putea „vedea” în câmpul vizual ceea ce fac oamenii și le vor aplica pe domenii precum marketing și vânzări sau, poate, în unele cazuri, lucrări ale agențiilor guvernamentale sau justiție penală.

Ramificările pun de asemenea o lumină asupra dezbaterii dintre beneficiile maxime și întrebările privind confidențialitatea. O mare parte din utilizarea acestor videoclipuri va construi modele de învățare automată care funcționează pentru supraveghere - dar ce se întâmplă cu persoanele care nu doresc să fie supravegheate? Când aceste noi programe de învățare automată sunt dislocate în spațiul public, care sunt drepturile individului și de unde este trasată această linie?

În orice caz, companiile folosesc aceste tipuri de resurse umane și video pentru a săpa într-adevăr câteva runde de progres de învățare a mașinilor, care vor permite de fapt computerelor să recunoască ceea ce se întâmplă în jurul lor, mai degrabă decât să clasifice imagini sau să lucreze cu fonemele din vorbire. Aceasta este o dezvoltare extrem de interesantă și controversată în domeniul inteligenței artificiale și care merită atenția sa în mediile tehnologice și nu numai.

De ce unele proiecte de învățare automată ar putea necesita un număr enorm de actori?