Nainen kuulokkeet päässä, tekee muistiinpanoja aukinaisesta kirjasta postit-lappuun.

Koneäänet ja puheentunnistus vahvistavat saavutettavuutta

Toukokuun kolmantena torstaina vietetään Kansainvälistä saavutettavuuspäivää, tänä vuonna jo yhdettätoista kertaa. Päivän tarkoituksena on puhua, ajatella, jakaa ja oppia digitaalisesta saavutettavuudesta ja sen huomioimisesta. Tässä artikkelissa perehdytään oman osaamisalamme, puheteknologian, mahdollistamiin ratkaisuihin saavutettavuuden suhteen. Minkälaista digitaalista käytettävyyttä koneäänet ja puheentunnistus käytännössä luovat?

Saavutettavat sähköiset palvelut luovat tasavertaisuutta

Saavutettavuudella tarkoitetaan yleensä sähköisten palveluiden käytettävyyttä. Sitä, miten helposti kuka tahansa ihminen pystyy niitä käyttämään. Esimerkiksi näkövammaiselle visuaalisuuteen ja näkökykyyn perustuvissa verkkosivuissa ja mobiilisovelluksissa saavutettavuuden huomioiminen on välttämätöntä, jotta niitä pystyy ylipäätänsä käyttämään.

Saavutettavuus ei koske vain näkövammaisia, vaan myös niitä, joilla on kuulovamma, motorisia vaikeuksia, hahmottamisen vaikeuksia, heikko kielitaito, taikka jokin väliaikainen toimintarajoite kuten käsi- tai silmäleikkauksesta toipuminen.

Näkökykyyn perustuvien palvelujen saavutettavuuden rajoituksia voi kuka tahansa kokea esimerkiksi kirkkaassa auringonpaisteessa tai liikkuvassa ajoneuvossa matkustaessaan. Muutkin vastaavanlaiset, arkiset asiat rajoittavat ruudulta lukemisen mahdollisuutta.

Sähköistä palvelua pitäisi siis pystyä käyttämään itsenäisesti, vaikka jokin seuraavista toiminnoista olisi rajoittunut:

  • Näkökyky
  • Kyky erottaa värejä
  • Kuulokyky
  • Puheentuotto
  • Hienomotoriikka, käsivoimat, ulottuvuus
  • Hahmottamiskyky

Saavutettavuus-termin yhteydessä puhutaan myöskin esteettömyydestä. Esteettömyys-termillä tarkoitetaan mahdollisimman helppoa liikkumista ja toimimista fyysisessä ympäristössä, kuten liikenteessä ja rakennuksissa. Sekä saavutettavuus että esteettömyys mahdollistavat ihmisen omatoimisuuden ja toimimisen helppouden erilaisissa tilanteissa.

Saavutettavuuden lisääminen verkkosivuille

Suomen digipalvelulain mukaan julkisten toimijoiden, kuten viranomaisten, kuntien ja monien järjestöjen, täytyy ylläpitää saavutettavia verkkosivuja ja mobiilisovelluksia.

Digisisältöjen saavutettavuus muodostuu:

  • helppokäyttöisyydestä
  • teknisestä toteutuksesta
  • kognitiivisesta saavutettavuudesta eli sisältöjen ymmärrettävyydestä

Konkreettisesti nämä tarkoittavat muun muassa: tekstivastineita äänisisällöille, tekstityksiä, kuvailutulkkauksia, viittomakielen huomiointia, audion kontrollointimahdollisuutta, virheilmoitusten äänimerkkejä, värien käyttöä ja niiden kontrastia, fontin koon suurentamisen mahdollisuutta, visuaalisten elementtien esitystapaa, sivuston responsiivisuutta eli skaalautumista näyttökoon mukaan, käytettävyyttä näppäimistöllä ilman hiirtä, käytettävyyttä apuvälineohjelmilla, sivuston aikakatkaisua ja uudelleentunnistautumista, johdonmukaista navigointia, lohkojen ohittamista, sivuotsikoita ja osioiden otsikoita, nimettyjä linkkejä, tekstin ja kielen ymmärrettävyyttä sekä hakutoimintomahdollisuutta.

Saavutettavuuden lisääminen koostuu siis monesta osasesta. Edellä olevasta pitkästä listastakin jo huomaa, että verkkosivut ja sovellukset on helpointa tehdä saavutettaviksi jo niiden suunnittelu- ja toteutusvaiheessa. Olemassa olevan sivun muokkaaminen täysin saavutettavaksi voi olla todella vaikeaa, mutta yksittäisten asioiden, esimerkiksi verkkosivulukijan lisääminen valmiille sivuille on suhteellisen helppoa. Verkkosivuilla valmiiksi olevat verkkosivulukijat ovat käteviä, sillä niiden kanssa kuka tahansa voi kuunnella verkkosivutekstit ääneen.

Koneäänet luovat saavutettavuutta

Mitä useammat sisällöt voidaan tarjota helposti kuunneltavassa muodossa, sitä paremmaksi muuttuu kyseisen median saavutettavuus.

Koneäänillä on nimenomaan määrään liittyviä hyötyjä ihmislukijaan verrattuna: niillä voidaan lukea ääneen rajaton määrä digitaalista sisältöä. Suurin etu koneäänten käytössä ihmiseen verrattuna onkin äänisisältöjen luomisen kustannustehokkuus, ihmiseen verrattuna noin kuusinkertainen lukunopeus ja mahdollisuus muokata sisältöjä helposti jälkeenpäin. Esimerkiksi päivän digilehden artikkelit saadaan koneäänellä hyvin kätevästi ja nopeasti kuunneltavaan muotoon.

Erityisesti modernien, koneoppimismenetelmiin perustuvien koneäänten käyttömahdollisuudet ovat laajat. Koska koneääni oppii jäljittelemään puhetta sille koulutusvaiheessa syötetystä datasta, on lopputulos todella luonnollisen kuuloinen koneääni. Yleisimpiin käyttökohteisiin kuuluu digi- ja äänikirjat, koulutusmateriaalit, lehtisisällöt, verkkosivulukijat, virtuaaliavustajat sekä erilaiset sovellukset ja ohjelmistot.

Kehittämäämme Ilona-koneääntä on käytetty tähän mennessä eniten digi- ja äänikirjoissa, lehtiartikkeleissa ja verkkosivulukijoissa. Äänikirjoja on tehty esimerkiksi Celialle, joka on nimenomaan saavutettavan kirjallisuuden ja julkaisemisen asiantuntijakeskus. Äänikirjoissa koneääni sopii etenkin tietopainotteisiin kirjoihin selkeän lausumisensa ansiosta. Ilona on lukenut eri kustantamoille kuunneltavaan muotoon muun muassa anatomian oppikirjan, kirkkohistorian tietokirjan ja oikeustieteen kurssikirjoja.

Puheentunnistus ja saavutettavuus

Puheentunnistuksellakin luodaan laaja-alaista saavutettavuutta. Sitä voidaan käyttää niin tekstityksien tekemiseen kuin verkkopalvelussa liikkumiseen.

Puheentunnistusohjelmilla saadaan tehtyä automaattiset tekstitykset suoriin lähetyksiin ja tallennettuihin videoihin sekä litteroitua äänisisältöjä, kuten haastatteluja. Tekstitykset ovat kuuroille ja huonokuuloisille oleellinen osa saavutettavuuden lisäämisessä. Tekstityksistä hyötyvät myös ihmiset, jotka ovat meluisassa ympäristössä tai haluavat katsoa videota äänettömällä. Esimerkiksi LinkedInissä olevat videot ovat automaattisesti oletuksena äänettömällä eli puhesisältö menee ohi ilman tekstityksiä. Automaattinen tekstitys voisi olla hyvä lisä tämänkaltaisiin videoihin.

Puheentunnistusta voidaan käyttää myös haastattelujen, kokousten, sanelujen ja podcastien muuttamiseen tekstiksi. Tämä nopeuttaa huomattavasti tekstivastineen tekemistä.

Saavutettavuutta luodessa on kuitenkin hyvä muistaa, etteivät tekstityksetkään ole aina täydellinen ratkaisu. Kuurojen äidinkieli on nimittäin viittomakieli, eli suomen kieltä voi olla hankalaa ymmärtää vaikeiden sanojen tai sanajärjestysten osalta.

Näkövammainen henkilö tai motorisia vaikeuksia omaava voi käyttää puheentunnistusta hieman toisin päin: puheentunnistuksella ja puheen automaattisella litteroinnilla voidaan helpottaa tällaisten ihmisten tekstin tuottamista. Puheentunnistimen avulla tällaiset henkilöt voivat sanella tekstiksi asiakirjoja, dokumentteja ja raportteja. Täydellisen virheetöntä tekstiä näillä on toistaiseksi kuitenkin hankala saada aikaan.

Puheentunnistuksen avulla voidaan myös liikkua verkkosivuilla ja sovelluksissa. Kirjoitimme tästä aiemmin artikkelissa Puheohjatut ostokset. Älykaiuttimien ja virtuaaliavustajien, kuten Sirin, Google Assistantin tai Alexan avulla digitaalinen saavutettavuus kasvaa huimasti, kun netistä saa tarkistettua asiat nopeasti puheella kysyen. Kirjoitimme myös tästä aiemmin artikkelin Älykoti ja puheohjaus – Ihmiset ja koneet vuorovaikutuksessa.

Kysymyksiä, ajatuksia tai mahdollinen yhteistyö?

18.10.2024
Suomen ensimmäistä tekoälyyn keskittyvää palkintogaalaa juhlitaan 23.10.2024 julkistamalla kunkin kategorian voittajat. a.i.mater on kolmen kärjessä asiakaskokemus-kategoriassa.
Kaksi henkilöä istuvat sohvalla läppärit sylissä. Kasvot on rajattu pois kuvasta.
9.9.2024
Digipalvelulaki ja esteettömyysdirektiivi laajenevat kesäkuussa 2025. Artikkelissa kerrotaan, keitä laki koskee myös jatkossa ja mitä saavutettavuusvaatimukset käytännössä ovat. Erityishuomiota kiinnitetään sähkö- ja äänikirjoihin.
Nainen istuu ulkona maalaustelineen kanssa ja katsoo juuri väripalettia kädessään. Taustalla on abstrakti maalaus. Valo tulee naisen takaa, joten hänen hiukset korostuvat muuten tummasta kuvasta. Naisella on kuulokkeet korvilla.
13.6.2024
Käsittelyssä kielimuurien häviäminen, henkilökohtaisemmat ääniassistentit, älykodit, äänikloonit, tekoälyllä tuotettava musiikki, median kulutus, terveyssovellukset, asiakaspalvelu, biometrinen tunnistautuminen ja smart city -ajatus.
Nainen istuu toimistotuolissa tietokoneen edessä ja katsoo näyttöä. Toinen käsi on näppäimistöllä. Taustalla on isot ikkunat.
16.5.2024
Sekä ruudunlukuohjelma että verkkosivulukija lukee verkkosivuja ääneen. Oleellisen ero on, että ruudunlukijat on tarkoitettu henkilöille, joilla on näkemisen tai motorisen tai kognitiivisen puolen kanssa rajoitteita, kun taas verkkosivulukija sopii paljon
Henkilö istuu lattialla kirjan edessä tekemässä muistiinpanoja. Hänellä on kuulokkeet päässä. Kuvaotettu ylhäältäpäin.
23.4.2024
Tietoa voidaan kuluttaa monin eri tavoin: tämä monimuotoisuus tulisi huomioida myös sisältöä tuottaessa. Ääni ja teksti tukevat toisiaan ja antavat sisällön kuluttajalle valinnanvaraa päättää.
Läppäri, jonka näppäimistön päällä on kuulokkeet. Läppärin näytössä on eepressin etusivu.
2.4.2024
Konenäköä ja puhesynteesiä yhdistäneessä projektissa kehitimme ePress-näköislehtipalvelulle pipelinen, joka pystyy tunnistamaan näköislehtien artikkelit ja toimittamaan niistä ääniversiot.