Acasă Dezvoltare Ce este text-vorbire (tts)? - definiție din techopedia

Ce este text-vorbire (tts)? - definiție din techopedia

Cuprins:

Anonim

Definiție - Ce înseamnă Text to Speech (TTS)?

Text la vorbire (TTS) este un proces de modelare a limbajului natural care necesită schimbarea unităților de text în unități de vorbire pentru prezentarea audio. Acesta este opusul vorbirii față de text, unde o tehnologie preia cuvintele rostite și încearcă să le înregistreze cu exactitate ca text. Textul în vorbire este acum comun în tehnologiile care încearcă să redea ieșirea audio din textul digital pentru a-i ajuta pe cei care nu pot citi sau pentru alte tipuri de utilizări.

Techopedia explică textul în vorbire (TTS)

Dezvoltarea capacității text-vorbire include câteva provocări unice. Mai ales în limba engleză, unde un număr mare de omonime au pronunții variate, programele de calculator se bazează pe modelarea probabilităților pentru a ghici pronunția dorită a unui cuvânt în textul digital. De asemenea, programul trebuie să transforme unitățile de text în foneme, cele mai mici unități de pronunție a vorbirii. Rezultatul este că multe tehnologii text-to-speech sunt mai puțin decât infailibile, deși dezvoltatorii au făcut progrese vaste în aceste tehnologii de-a lungul mai multor ani.


De-a lungul timpului, experții au observat câteva bune practici pentru dezvoltarea TTS. Acestea includ bazele fonemelor și abordările concatenative cu analitice predictive. Cele mai bune programe sunt de asemenea capabile să funcționeze cu cerințe minime de memorie și sunt ușor de configurat. Dezvoltatorii continuă să lucreze la resursele TTS pentru orice limbă dată, lucrând prin provocările majore ale ambiguității și a altor obstacole în calea redării mai precise.

Ce este text-vorbire (tts)? - definiție din techopedia