pühapäev, 20. detsember 2015

XI - Teistmoodi IT

Tänapäeval on väga palju erinevaid infotehnoloogilisi riist- ja tarkvaralahendusi, mis võimaldavad puuetega inimestel arvuteid ja muid seadmeid kasutada. Täpsemalt räägiksin kõnesünteesist.
 
Kõnesüntees on sisuliselt inimkõne imiteerimine tehnilise seadme poolt ehk loomulikul keelel põhineva teksti konverteermine kõneks. Esmalt konverteeritakse sümbolitel põhinev tekst võrdväärseteks välja kirjutatud sõnadeks ning seejärel toimub teksti lingvistiline töötlus kasutades foneetilist transkriptsiooni, mis tagab sõnade, sõnaühendite ja lausete korrektse häälduse. Kõnesüntees on ennekõike oluline nägemis- ja kõnepuudega inimestele, kuid sellest on abi ka teistel arvutikasutajatel.
 
Paljudel operatsioonisüsteemidel on kõnesüntees juba mingil kujul sisse ehitatud, nt Windows MS Narrator ning iOS VoiceOver. Ka Interneti tarbimiseks on mitmeid rakendusi, pluginad ja vidinaid, mis võimaldavad lugeda teksti näiteks otse e-mailidest, veebilehtedelt, RSS feedist või ka tööriistaribalt. Küllaltkti eesrindlik kõnesünteesil põhinevate rakenduste loomisel on taaskord Google – näiteks Google Play raamatute ettelugemiseks, Google Translate tõlgete ette lugemiseks ja Google Talkbacks täies mahus tagasiside saamiseks. Google Talkback on Androidil põhinevatesse seadmetesse eelinstalleeritud teenus, mis aitab vaegnägijatel ja pimedatel oma seadmetega paremini suhelda. See kasutab ette loetavaid tekste, vibratsioone ja muid audiol põhinevaid tagasiside vorme, mis aitavad kasutajal aru saada, mis parasjagu on ekraanil kuvatud, millel kasutaja parasjagu vajutab ja mida valitav tegevus teha võimaldab.
 
Kui rääkida üldistest avatud lähtekoodil põhinevatest kõnesünteesi programmidest, mis suudavad opereerida erinevatel operatsioonisüsteemidel, siis mainiksin ära eSpeak’i. eSpeak on kompaktne ja avatud lähtekoodiga kõnesüntesaator Windowsile ja Linuxile, mis pakub küllaltki laias valikus erinevaid keeli, mh eesti keelt. eSpeak’i saab kasutada käsurea programmina, aga ka jagatud teegina. Suur osa eSpeak'i keeltest põhineb Wikipediast leitud informatsioonil ja tagasisidel emakeelena rääkijatelt. Enamik inimesi, kes on aidanud kõnesüntesaatorit täiendada on olnud nägemispuudega. Tänu oma väiksusele ja suurele keelevalikule on eSpeak olnud vaikimisi ekraanilugeja Windowsil ja Ubuntul ning Linuxi paigaldusplaatidel. Muuhulgas on eSpeaks programm olnud kasutusel ka Google Translate projektis. Peab aga tõdema, et erinevate keelte kvaliteet on väga erinev. Mõndade keelte osas on tehtud märgatavalt enam tööd või saadud rohkem tagasisidet emakeelena kõnelejatelt. Seega arenguruumi kindlasti on.
 
Kokkuvõtvalt võib öelda, et kõnesüntees on tänapäeval leidnud väga suurel hulgal kasutust erinevate arvutite ja nutiseadmete rakendustes. Kuna inimkõne jäljendamine on väga keerukas protsess, siis on aga selles vallas kindlasti veel probleeme korrektsed hääldused, rõhud jms. Ennekõike on probleem just väiksemate ja vähem levinud keelte puhul. Sellest hoolimata on tegemist tehnoloogiaga, mis kindlasti hõlbustab puuetega inimeste arvutikasutust.
 
Viited:
 
 
 
 
 
 

Kommentaare ei ole:

Postita kommentaar