Nainen kuulokkeet päässä, tekee muistiinpanoja aukinaisesta kirjasta postit-lappuun.

Koneäänet ja puheentunnistus vahvistavat saavutettavuutta

Toukokuun kolmantena torstaina vietetään Kansainvälistä saavutettavuuspäivää, tänä vuonna jo yhdettätoista kertaa. Päivän tarkoituksena on puhua, ajatella, jakaa ja oppia digitaalisesta saavutettavuudesta ja sen huomioimisesta. Tässä artikkelissa perehdytään oman osaamisalamme, puheteknologian, mahdollistamiin ratkaisuihin saavutettavuuden suhteen. Minkälaista digitaalista käytettävyyttä koneäänet ja puheentunnistus käytännössä luovat?

Saavutettavat sähköiset palvelut luovat tasavertaisuutta

Saavutettavuudella tarkoitetaan yleensä sähköisten palveluiden käytettävyyttä. Sitä, miten helposti kuka tahansa ihminen pystyy niitä käyttämään. Esimerkiksi näkövammaiselle visuaalisuuteen ja näkökykyyn perustuvissa verkkosivuissa ja mobiilisovelluksissa saavutettavuuden huomioiminen on välttämätöntä, jotta niitä pystyy ylipäätänsä käyttämään.

Saavutettavuus ei koske vain näkövammaisia, vaan myös niitä, joilla on kuulovamma, motorisia vaikeuksia, hahmottamisen vaikeuksia, heikko kielitaito, taikka jokin väliaikainen toimintarajoite kuten käsi- tai silmäleikkauksesta toipuminen.

Näkökykyyn perustuvien palvelujen saavutettavuuden rajoituksia voi kuka tahansa kokea esimerkiksi kirkkaassa auringonpaisteessa tai liikkuvassa ajoneuvossa matkustaessaan. Muutkin vastaavanlaiset, arkiset asiat rajoittavat ruudulta lukemisen mahdollisuutta.

Sähköistä palvelua pitäisi siis pystyä käyttämään itsenäisesti, vaikka jokin seuraavista toiminnoista olisi rajoittunut:

  • Näkökyky
  • Kyky erottaa värejä
  • Kuulokyky
  • Puheentuotto
  • Hienomotoriikka, käsivoimat, ulottuvuus
  • Hahmottamiskyky

Saavutettavuus-termin yhteydessä puhutaan myöskin esteettömyydestä. Esteettömyys-termillä tarkoitetaan mahdollisimman helppoa liikkumista ja toimimista fyysisessä ympäristössä, kuten liikenteessä ja rakennuksissa. Sekä saavutettavuus että esteettömyys mahdollistavat ihmisen omatoimisuuden ja toimimisen helppouden erilaisissa tilanteissa.

Saavutettavuuden lisääminen verkkosivuille

Suomen digipalvelulain mukaan julkisten toimijoiden, kuten viranomaisten, kuntien ja monien järjestöjen, täytyy ylläpitää saavutettavia verkkosivuja ja mobiilisovelluksia.

Digisisältöjen saavutettavuus muodostuu:

  • helppokäyttöisyydestä
  • teknisestä toteutuksesta
  • kognitiivisesta saavutettavuudesta eli sisältöjen ymmärrettävyydestä

Konkreettisesti nämä tarkoittavat muun muassa: tekstivastineita äänisisällöille, tekstityksiä, kuvailutulkkauksia, viittomakielen huomiointia, audion kontrollointimahdollisuutta, virheilmoitusten äänimerkkejä, värien käyttöä ja niiden kontrastia, fontin koon suurentamisen mahdollisuutta, visuaalisten elementtien esitystapaa, sivuston responsiivisuutta eli skaalautumista näyttökoon mukaan, käytettävyyttä näppäimistöllä ilman hiirtä, käytettävyyttä apuvälineohjelmilla, sivuston aikakatkaisua ja uudelleentunnistautumista, johdonmukaista navigointia, lohkojen ohittamista, sivuotsikoita ja osioiden otsikoita, nimettyjä linkkejä, tekstin ja kielen ymmärrettävyyttä sekä hakutoimintomahdollisuutta.

Saavutettavuuden lisääminen koostuu siis monesta osasesta. Edellä olevasta pitkästä listastakin jo huomaa, että verkkosivut ja sovellukset on helpointa tehdä saavutettaviksi jo niiden suunnittelu- ja toteutusvaiheessa. Olemassa olevan sivun muokkaaminen täysin saavutettavaksi voi olla todella vaikeaa, mutta yksittäisten asioiden, esimerkiksi verkkosivulukijan lisääminen valmiille sivuille on suhteellisen helppoa. Verkkosivuilla valmiiksi olevat verkkosivulukijat ovat käteviä, sillä niiden kanssa kuka tahansa voi kuunnella verkkosivutekstit ääneen.

Koneäänet luovat saavutettavuutta

Mitä useammat sisällöt voidaan tarjota helposti kuunneltavassa muodossa, sitä paremmaksi muuttuu kyseisen median saavutettavuus.

Koneäänillä on nimenomaan määrään liittyviä hyötyjä ihmislukijaan verrattuna: niillä voidaan lukea ääneen rajaton määrä digitaalista sisältöä. Suurin etu koneäänten käytössä ihmiseen verrattuna onkin äänisisältöjen luomisen kustannustehokkuus, ihmiseen verrattuna noin kuusinkertainen lukunopeus ja mahdollisuus muokata sisältöjä helposti jälkeenpäin. Esimerkiksi päivän digilehden artikkelit saadaan koneäänellä hyvin kätevästi ja nopeasti kuunneltavaan muotoon.

Erityisesti modernien, koneoppimismenetelmiin perustuvien koneäänten käyttömahdollisuudet ovat laajat. Koska koneääni oppii jäljittelemään puhetta sille koulutusvaiheessa syötetystä datasta, on lopputulos todella luonnollisen kuuloinen koneääni. Yleisimpiin käyttökohteisiin kuuluu digi- ja äänikirjat, koulutusmateriaalit, lehtisisällöt, verkkosivulukijat, virtuaaliavustajat sekä erilaiset sovellukset ja ohjelmistot.

Kehittämäämme Ilona-koneääntä on käytetty tähän mennessä eniten digi- ja äänikirjoissa, lehtiartikkeleissa ja verkkosivulukijoissa. Äänikirjoja on tehty esimerkiksi Celialle, joka on nimenomaan saavutettavan kirjallisuuden ja julkaisemisen asiantuntijakeskus. Äänikirjoissa koneääni sopii etenkin tietopainotteisiin kirjoihin selkeän lausumisensa ansiosta. Ilona on lukenut eri kustantamoille kuunneltavaan muotoon muun muassa anatomian oppikirjan, kirkkohistorian tietokirjan ja oikeustieteen kurssikirjoja.

Puheentunnistus ja saavutettavuus

Puheentunnistuksellakin luodaan laaja-alaista saavutettavuutta. Sitä voidaan käyttää niin tekstityksien tekemiseen kuin verkkopalvelussa liikkumiseen.

Puheentunnistusohjelmilla saadaan tehtyä automaattiset tekstitykset suoriin lähetyksiin ja tallennettuihin videoihin sekä litteroitua äänisisältöjä, kuten haastatteluja. Tekstitykset ovat kuuroille ja huonokuuloisille oleellinen osa saavutettavuuden lisäämisessä. Tekstityksistä hyötyvät myös ihmiset, jotka ovat meluisassa ympäristössä tai haluavat katsoa videota äänettömällä. Esimerkiksi LinkedInissä olevat videot ovat automaattisesti oletuksena äänettömällä eli puhesisältö menee ohi ilman tekstityksiä. Automaattinen tekstitys voisi olla hyvä lisä tämänkaltaisiin videoihin.

Puheentunnistusta voidaan käyttää myös haastattelujen, kokousten, sanelujen ja podcastien muuttamiseen tekstiksi. Tämä nopeuttaa huomattavasti tekstivastineen tekemistä.

Saavutettavuutta luodessa on kuitenkin hyvä muistaa, etteivät tekstityksetkään ole aina täydellinen ratkaisu. Kuurojen äidinkieli on nimittäin viittomakieli, eli suomen kieltä voi olla hankalaa ymmärtää vaikeiden sanojen tai sanajärjestysten osalta.

Näkövammainen henkilö tai motorisia vaikeuksia omaava voi käyttää puheentunnistusta hieman toisin päin: puheentunnistuksella ja puheen automaattisella litteroinnilla voidaan helpottaa tällaisten ihmisten tekstin tuottamista. Puheentunnistimen avulla tällaiset henkilöt voivat sanella tekstiksi asiakirjoja, dokumentteja ja raportteja. Täydellisen virheetöntä tekstiä näillä on toistaiseksi kuitenkin hankala saada aikaan.

Puheentunnistuksen avulla voidaan myös liikkua verkkosivuilla ja sovelluksissa. Kirjoitimme tästä aiemmin artikkelissa Puheohjatut ostokset. Älykaiuttimien ja virtuaaliavustajien, kuten Sirin, Google Assistantin tai Alexan avulla digitaalinen saavutettavuus kasvaa huimasti, kun netistä saa tarkistettua asiat nopeasti puheella kysyen. Kirjoitimme myös tästä aiemmin artikkelin Älykoti ja puheohjaus – Ihmiset ja koneet vuorovaikutuksessa.

Kiinnostuitko? Ota Yhteyttä!

Jaa artikkeli

Nainen makoilee sängyllä kuulokkeet päässä, katselee vieressä olevaa kulhollista hedelmiä.
29.9.2023
Käydään läpi digiaudiotutkimusta, jossa syvennytään suomalaisten kuuntelutottumuksiin. Vastauksissa näkyy, miten digiaudion kuuntelusta on tullut valtavirtaa.
Nainen istuu kesällä puutarhassa taidemaalaustarvikkeiden kanssa. Päässä on kuulokkeet.
14.9.2023
Yhdysvalloissa parhaillaan käynnissä olevassa näyttelijöiden ja käsikirjoittajien lakossa on kysymys myös tekoälyn käytöstä. Huolenaiheet koskevat muun muassa työpaikkoja ja taiteellista luovuutta.
Mies istuu selkä kuvaajaa päin laiturilla korituolissa kuulokkeet päässä. Vieressä on pino kirjoja ja niiden päällä älypuhelin , josta lähtee piuha kuulokkeisiin.
8.8.2023
Alkuvuodesta Apple Books ja kesäkuussa Storytel ilmoittivat ottavansa äänikirjapalveluihinsa koneäänet osaksi äänikirjalukijavaihtoehtojaan. Storytel laajentaa tätä vaihtoehtoa Voice Switcher -ominaisuudella, joka mahdollistaa kuulijan vaihtaa lukijaääntä.
Selko Digitalin logo, jossa silmä ja teksti Selko Digital.
19.6.2023
Saavutettavuuteen erikoistunut yhteistyökumppanimme Selko Digital avaa vieraskynäblogissa koneäänien ja puheentunnistuksen vaikutusta digimaailman yhdenvertaisuuteen.
Keskellä lukee toukokuun ääniuutiset. Taustalla kuva kuulokkeista kirjapinon päällä, kuulokkeiden vieressä on juomalasi, jossa sitruunaviipale ja kukkiva omenapuun oksa.
31.5.2023
Toukokuun ääniuutisten aiheina Google Bard, Metan uusi kielimalli, Applen uudet saavutettavuusominaisuudet, kielivähemmistöille suunnattu chatbot ja älykkäät NPC:t.
Nainen istuu auton etupenkillä kuulokkeet päässä ja pädi sylissä.
17.5.2023
Tekoäly ja kieliteknologia mahdollistavat uudenlaisia ja kiinnostavampia tapoja oppia uusia kieliä. Esimerkiksi kieltenoppimissovellukset hyödyntävät luonnollisen kielen käsittelyä.