Tänapäeval on väga palju
erinevaid infotehnoloogilisi riist- ja tarkvaralahendusi, mis võimaldavad puuetega
inimestel arvuteid ja muid seadmeid kasutada. Täpsemalt räägiksin kõnesünteesist.
Kõnesüntees on sisuliselt inimkõne imiteerimine tehnilise seadme poolt ehk
loomulikul keelel põhineva teksti konverteermine kõneks. Esmalt konverteeritakse
sümbolitel põhinev tekst võrdväärseteks välja kirjutatud sõnadeks ning seejärel
toimub teksti lingvistiline töötlus kasutades foneetilist transkriptsiooni, mis
tagab sõnade, sõnaühendite ja lausete korrektse häälduse. Kõnesüntees on
ennekõike oluline nägemis- ja kõnepuudega inimestele, kuid sellest on abi ka
teistel arvutikasutajatel.
Paljudel operatsioonisüsteemidel on kõnesüntees juba mingil kujul sisse
ehitatud, nt Windows MS Narrator ning iOS VoiceOver. Ka Interneti tarbimiseks
on mitmeid rakendusi, pluginad ja vidinaid, mis võimaldavad lugeda teksti näiteks
otse e-mailidest, veebilehtedelt, RSS feedist või ka tööriistaribalt.
Küllaltkti eesrindlik kõnesünteesil põhinevate rakenduste loomisel on taaskord Google
– näiteks Google Play raamatute ettelugemiseks, Google Translate tõlgete ette
lugemiseks ja Google Talkbacks täies mahus tagasiside saamiseks. Google
Talkback on Androidil põhinevatesse seadmetesse eelinstalleeritud teenus, mis
aitab vaegnägijatel ja pimedatel oma seadmetega paremini suhelda. See kasutab
ette loetavaid tekste, vibratsioone ja muid audiol põhinevaid tagasiside vorme,
mis aitavad kasutajal aru saada, mis parasjagu on ekraanil kuvatud, millel kasutaja
parasjagu vajutab ja mida valitav tegevus teha võimaldab.
Kui rääkida üldistest avatud lähtekoodil põhinevatest kõnesünteesi programmidest,
mis suudavad opereerida erinevatel operatsioonisüsteemidel, siis mainiksin ära
eSpeak’i. eSpeak on kompaktne ja avatud lähtekoodiga kõnesüntesaator Windowsile
ja Linuxile, mis pakub küllaltki laias valikus erinevaid keeli, mh eesti keelt.
eSpeak’i saab kasutada käsurea programmina, aga ka jagatud teegina. Suur osa
eSpeak'i keeltest põhineb Wikipediast leitud informatsioonil ja tagasisidel
emakeelena rääkijatelt. Enamik inimesi, kes on aidanud kõnesüntesaatorit täiendada on olnud nägemispuudega. Tänu oma väiksusele ja suurele keelevalikule on eSpeak
olnud vaikimisi ekraanilugeja Windowsil ja Ubuntul ning Linuxi paigaldusplaatidel.
Muuhulgas on eSpeaks programm olnud kasutusel ka Google Translate projektis.
Peab aga tõdema, et erinevate keelte kvaliteet on väga erinev. Mõndade keelte
osas on tehtud märgatavalt enam tööd või saadud rohkem tagasisidet emakeelena
kõnelejatelt. Seega arenguruumi kindlasti on.
Kokkuvõtvalt võib öelda, et kõnesüntees on tänapäeval leidnud väga suurel hulgal kasutust erinevate arvutite ja nutiseadmete rakendustes. Kuna inimkõne jäljendamine on väga keerukas protsess, siis on aga selles vallas kindlasti veel probleeme – korrektsed hääldused, rõhud jms. Ennekõike on probleem just väiksemate ja vähem levinud keelte puhul. Sellest hoolimata on tegemist tehnoloogiaga, mis kindlasti hõlbustab puuetega inimeste arvutikasutust.
Viited: