Acasă Software-ul Tehnologia de recunoaștere vocală: utilă sau dureroasă?

Tehnologia de recunoaștere vocală: utilă sau dureroasă?

Cuprins:

Anonim

Ați apelat vreodată la o companie pentru a obține ajutor sau pentru a vă plăti factura, pentru a fi întâmpinat doar de o voce plăcută înregistrată care vrea să aibă o conversație cu dvs. - dar nu puteți înțelege jumătate din ceea ce spuneți? Sau poate că deții un iPhone și, în timp ce Siri părea mai întâi ca un aliat bun, ai ajuns să realizezi că uneori (OK, hai să fim sinceri, de multe ori) pur și simplu nu o primește? Tehnologia de recunoaștere vocală (VRT), cunoscută și sub denumirea de vorbire la text, se încadrează într-o capcană comună: are potențialul de a fi incredibil de mișto (și băiete, ne înrădăcinăm pentru asta), dar mai des, este o măcinare a dinților exercitarea în frustrare.


Odată o idee care a aparținut în domeniul științei ficțiunii, recunoașterea vocală a crescut de la începutul anilor '50, când sistemul Audrey Bell Laboratories a fost proiectat pentru a recunoaște cifrele rostite cu o singură voce, la rețeaua modernă de electronice conversaționale cu care interacționăm acum. zilnic - cu rezultate mixte.

Pentru a vorbi cu un om, vă rugăm să apăsați 0

Multe dintre afacerile de astăzi folosesc sisteme numite răspuns vocal interactiv (IVR) pentru a gestiona apelurile de servicii pentru clienți. Cea mai obișnuită utilizare este pentru meniurile cu voce vocală, dar unele companii folosesc sisteme IVR care pot accesa informațiile despre contul clienților și răspunde la întrebări minore. Programul de meniu IVR are de obicei un vocabular limitat, care poate fi limitat la „da”, „nu” și la numere. Sisteme mai complicate pot recunoaște cuvinte și expresii specifice companiei.


Aceste sisteme sunt din ce în ce mai populare - cel puțin pentru companii - dintr-un simplu motiv: sunt rentabile. Conform unui raport din 2010 al Wall Street Journal, un apel tipic pentru clienți care ajunge la un agent costă între 3 și 9 dolari, în timp ce un apel gestionat printr-un sistem automat costă doar cinci până la șapte centi. Și, desigur, programele de calculator nu se obosesc, apelează la bolnavi și nu se frustrează cu clienții (deși clienții cu siguranță devin frustrați cu ei!).


Din fericire, acest lucru nu înseamnă întotdeauna că IVR scoate locuri de muncă de la oameni - sau cel puțin faptul că toți oamenii dispar din centrele de apel. Acești ajutoare activate prin voce permit repetării serviciilor umane pentru a fi mai productivi prin dirijarea apelurilor și răspunsul la întrebări simple.


Desigur pentru utilizatorii umani care interacționează cu aceste tehnologii, nu este întotdeauna o navigare lină. Tehnologia contribuie la îmbunătățirea problemelor comune în tehnologia IVR, cum ar fi problemele cu accentele, dar prinderea sistemelor automatizate este încă o temă comună online. Vedeți acest schit de comedie despre un elevator echipat cu recunoaștere vocală, care evidențiază frustrarea pe care o pot produce defecțiunile din sistemele IVR.

Aplicații telefonice personale: Siri, Google Now

Majoritatea oamenilor sunt familiarizați cu recunoașterea vocală pentru smartphone-uri. În timp ce majoritatea ultimelor modele de telefoane vin cu VR, popularitatea și notorietatea lor s-au umflat atunci când Apple a introdus Siri, „asistentul personal” ușor sarcastic, activat vocal pentru iPhone 4S în 2011. Google a creat curând un concurent direct: Google Acum pentru Android Jelly Bean OS. Ambele sisteme prezintă voci feminine și caracteristici sofisticate de recunoaștere, care permit utilizatorilor „să vorbească” cu telefoanele lor folosind un limbaj casual.


Dar, în timp ce aceste sisteme sunt considerabil mai sofisticate și funcționale decât predecesorii lor, acestea arată, de asemenea, că tehnologia are încă mult de parcurs. Glumele despre eșecul lui Siri au devenit un meme popular pe Internet. Un bărbat chiar a dat în judecată Apple pentru reclame false cu privire la capacitățile lui Siri.


Poate tocmai de aceea, în timp ce Apple a creat Siri pentru a fi avansat și informativ, software-ul VR este, de asemenea, puțin pe partea penibilă. De exemplu, dacă vorbiți despre una dintre cele mai infame linii de tehnologie a informațiilor din istoria cinematografului din filmul din 1968 „2001: A Space Odyssey” - „deschide ușile podului” - Siri va răspunde fie cu linia de răspuns din film, ” Îmi pare rău (numele tău), mi-e teamă că nu pot face asta, sau mai sarcastic, „agenții de informații nu vom trăi niciodată așa jos, se pare”.


Să te suni pe nume este doar una dintre funcțiile care încearcă să-l facă pe Siri mai ușor de iubit și ceva mai uman. Asistentul VR poate urmări comenzile vocale pentru a efectua apeluri, a lua dictare și trimite texte, a căuta informații pe Internet, a găsi magazine în apropiere, a oferi indicații de conducere și multe altele, fără a fi nevoie să atingeți nimic. Răspunsurile sunt simultan rostite de telefon și afișate pe ecran.


Google Now, porțiunea VR a platformei Android Jelly Bean, este foarte similară cu Siri. Sistemul oferă aceleași abilități de recunoaștere extinsă prin traducerea vorbirii ocazionale în comenzi care permit utilizatorilor să efectueze apeluri, să trimită texte, să efectueze căutări, să efectueze calcule și conversii, să ia definiții de cuvinte, să stabilească alarme, să cânte melodii și să obțină hărți și direcții.


Cu asistenți vocali personali precum Siri și Google Now, beneficiile sunt evidente. Totul, de la apeluri și mesaje, până la căutare și divertisment, este mai rapid și mai ușor. Doar spuneți ce doriți și (de cele mai multe ori) aplicația VR o apucă pentru dvs. Tehnologia hands-off a VR este deosebit de utilă în timpul conducerii. Și în timp ce mulți oameni au decretat defectele lui Siri, iar scriitorii au susținut că abilitatea Google Now de a rula în mod esențial viața utilizatorilor este atât de înspăimântătoare, cât mai insultătoare, majoritatea oamenilor consideră că aceste tehnologii futuriste sunt destul de cool.


Desigur, aplicațiile de telefon personal precum Siri și Google Now sunt departe de a fi perfecte - deși arată unde ar putea fi îndreptată această tehnologie în viitor. Asta înseamnă că, chiar și atunci când Siri va da un răspuns greșit, este probabil să râdem și să o iertăm, știind că următoarea versiune va fi mult mai bună.

În cazul în care VR se încadrează

Dacă ați întâlnit vreodată un IVR când ați apelat la o afacere, este posibil să fi observat anumite bariere în calea comunicării. Unele programe folosesc o voce robotizată text-vorbire care pronunță greșit cuvintele și face lucrurile dificil de înțeles. Alții au probleme de sensibilitate care au ca rezultat faptul că software-ul nu poate prelucra ceea ce spui dacă ești prea tare, prea moale sau nu enunți cu atenție.


În plus, mulți oameni încă nu se simt confortabil vorbind cu o mașină. Dacă efectuați câteva căutări pe IVR, veți întâlni liste cu care oamenii au pus la cale modalități de a ocoli sistemele IVR și de a ajunge la o „persoană reală”. Această soluție variază de la „continuați să apăsați 0 pentru un operator”, până la „înjură la mașină până când prinde o ființă umană”. Drept urmare, o mare parte a dezvoltării recente în sistemele de IVR a gravitat în jurul valorii de a le face mai plăcute pentru oameni; făcând vocile mai simpatice și mai puțin robotizate, făcând sistemul să fie mai ușor de navigat și anunțând apelanții cât de mult va dura toată perioada de la început până la sfârșit. Asta sugerează că tehnologia mai bună este doar jumătate din bătălie aici; cealaltă jumătate este ca utilizatorii la bord să vorbească cu o mașină.

Ce ne rezerva viitorul

În ciuda acestor provocări, tehnologia de recunoaștere a vocii se îmbunătățește tot timpul. Aplicații precum Siri și Google Now - defecte și toate - sunt în continuare extraordinar de impresionante în performanțele lor, iar mai multe companii extind capabilitățile VR către alte aplicații.


De exemplu, Nuance, creatorii software-ului vocal-text Dragon NaturallySpeaking, a dezvoltat deja controale vocale pentru televizoare și automobile, iar versiunile acestei tehnologii sunt încorporate în unele televizoare Samsung și sistemele de divertisment SYNC utilizate în anumite vehicule Ford.


Și cum Google și Apple continuă să găsească noi utilizări pentru tehnologiile lor de recunoaștere vocală, este probabil să vorbim din ce în ce mai mult cu toate tipurile de mașini de zi cu zi, de la televizoarele noastre până la prăjitoarele noastre. Și, încă o dată, se pare că știința-ficțiunea avea dreptate. Va trebui doar să sperăm că acești scriitori deștepți au greșit cu privire la un lucru. Dacă aceste mașini preiau, ai putea avea multe probleme data viitoare când îi ceri lui Siri „să deschidă ușile din pod.”

Tehnologia de recunoaștere vocală: utilă sau dureroasă?