Ce este Recunoașterea vorbelor?

Utilizarea vocii dvs. ca metodă de introducere

Recunoașterea vorbelor este o tehnologie care permite introducerea de vorbe în sisteme. Vorbești cu computerul, telefonul sau dispozitivul și folosește ceea ce spui ca intrare pentru a declanșa anumite acțiuni. Tehnologia este utilizată pentru a înlocui alte metode de introducere, cum ar fi tastarea, clicul sau selectarea în alte moduri. Este un mijloc de a face dispozitivele și software-ul mai ușor de utilizat și de a crește productivitatea.

Există o mulțime de aplicații și domenii în care recunoașterea vorbirii este utilizată, inclusiv armata, ca ajutor pentru persoanele cu deficiențe (imaginați-vă o persoană cu paralizie sau fără mâini sau degete), în domeniul medical, în robotică etc. În viitorul apropiat, aproape toată lumea va fi expusă recunoașterii vorbirii datorită propagării sale în rândul dispozitivelor comune precum computerele și telefoanele mobile.

Anumite telefoane inteligente utilizează în mod interesant recunoașterea vorbirii. Dispozitivele iPhone și Android sunt exemple de acest lucru. Prin intermediul acestora, puteți iniția un apel către un contact, prin intermediul unor instrucțiuni de vorbit precum "Call office". Alte comenzi pot fi de asemenea distractive, cum ar fi "Porniți Bluetooth".

Probleme cu recunoașterea vorbelor

Recunoașterea vorbelor, în versiunea sa cunoscută sub numele de Speech to Text (STT), a fost folosită de mult timp pentru a traduce cuvintele rostite în text. "Vorbești, se tipă", așa cum ar spune ViaVoice pe cutia sa. Dar există o problemă cu STT așa cum o știm. Mai mult de 10 ani în urmă, am încercat ViaVoice și nu a durat o săptămână pe calculatorul meu. De ce? A fost greșit inexactă și am ajuns să petrec mai mult timp și energie vorbind și corectând decât tastând totul. ViaVoice este unul dintre cei mai buni din industrie, imaginați-vă restul. Tehnologia sa maturizat și îmbunătățit, dar vorbirea în text încă îi face pe oameni să pună întrebări. Una dintre principalele sale dificultăți este imensa variație în rândul oamenilor în pronunțarea cuvintelor.

Nu toate limbile sunt presupuse în recunoașterea vorbirii, iar cele care nu sunt de obicei acceptate, precum și engleza. Ca rezultat, majoritatea dispozitivelor care rulează software-ul de recunoaștere vocală funcționează în mod rezonabil numai cu engleza.

Un set de cerințe hardware face dificilă implementarea recunoașterii vocale în anumite cazuri. Aveți nevoie de un microfon suficient de inteligent pentru a filtra zgomotul din fundal, dar în același timp suficient de puternic pentru a capta vocea în mod natural.

Vorbind despre zgomotul din mediul înconjurător, poate provoca eșecul întregului sistem. Ca urmare, recunoașterea vorbirii nu reușește în multe cazuri din cauza zgomotelor care sunt în afara controlului utilizatorului.

Recunoașterea vorbelor se dovedește a fi mai bună ca metodă de introducere a noilor telefoane și tehnologii de comunicare, cum ar fi VoIP, decât ca un instrument de productivitate pentru introducerea în masă a textului.

Aplicații ale recunoașterii vorbelor

Tehnologia câștigă popularitate în multe domenii și a avut succes în următoarele domenii:

- Controlul dispozitivului. Doar spunând "OK Google" pe un telefon Android va deschide un sistem care este toate urechile voastre comenzi vocale.

- Sisteme Bluetooth pentru mașină. Multe mașini sunt echipate cu un sistem care conectează mecanismul său radio la telefonul smartphone prin Bluetooth. Apoi, puteți efectua și primi apeluri fără să atingeți telefonul smartphone și puteți chiar forma numere doar prin a le spune.

- Transcriere vocală. În zonele în care oamenii trebuie să scrie multe, unele programe inteligente captează cuvintele lor vorbite și le transcriu în text. Acest lucru este actual în anumite programe de procesare de text. Transcrierea vocii funcționează și cu mesageria vocală vizuală .