Nainen kuulokkeet päässä, tekee muistiinpanoja aukinaisesta kirjasta postit-lappuun.

Koneäänet ja puheentunnistus vahvistavat saavutettavuutta

Toukokuun kolmantena torstaina vietetään Kansainvälistä saavutettavuuspäivää, tänä vuonna jo yhdettätoista kertaa. Päivän tarkoituksena on puhua, ajatella, jakaa ja oppia digitaalisesta saavutettavuudesta ja sen huomioimisesta. Tässä artikkelissa perehdytään oman osaamisalamme, puheteknologian, mahdollistamiin ratkaisuihin saavutettavuuden suhteen. Minkälaista digitaalista käytettävyyttä koneäänet ja puheentunnistus käytännössä luovat?

Saavutettavat sähköiset palvelut luovat tasavertaisuutta

Saavutettavuudella tarkoitetaan yleensä sähköisten palveluiden käytettävyyttä. Sitä, miten helposti kuka tahansa ihminen pystyy niitä käyttämään. Esimerkiksi näkövammaiselle visuaalisuuteen ja näkökykyyn perustuvissa verkkosivuissa ja mobiilisovelluksissa saavutettavuuden huomioiminen on välttämätöntä, jotta niitä pystyy ylipäätänsä käyttämään.

Saavutettavuus ei koske vain näkövammaisia, vaan myös niitä, joilla on kuulovamma, motorisia vaikeuksia, hahmottamisen vaikeuksia, heikko kielitaito, taikka jokin väliaikainen toimintarajoite kuten käsi- tai silmäleikkauksesta toipuminen.

Näkökykyyn perustuvien palvelujen saavutettavuuden rajoituksia voi kuka tahansa kokea esimerkiksi kirkkaassa auringonpaisteessa tai liikkuvassa ajoneuvossa matkustaessaan. Muutkin vastaavanlaiset, arkiset asiat rajoittavat ruudulta lukemisen mahdollisuutta.

Sähköistä palvelua pitäisi siis pystyä käyttämään itsenäisesti, vaikka jokin seuraavista toiminnoista olisi rajoittunut:

  • Näkökyky
  • Kyky erottaa värejä
  • Kuulokyky
  • Puheentuotto
  • Hienomotoriikka, käsivoimat, ulottuvuus
  • Hahmottamiskyky

Saavutettavuus-termin yhteydessä puhutaan myöskin esteettömyydestä. Esteettömyys-termillä tarkoitetaan mahdollisimman helppoa liikkumista ja toimimista fyysisessä ympäristössä, kuten liikenteessä ja rakennuksissa. Sekä saavutettavuus että esteettömyys mahdollistavat ihmisen omatoimisuuden ja toimimisen helppouden erilaisissa tilanteissa.

Saavutettavuuden lisääminen verkkosivuille

Suomen digipalvelulain mukaan julkisten toimijoiden, kuten viranomaisten, kuntien ja monien järjestöjen, täytyy ylläpitää saavutettavia verkkosivuja ja mobiilisovelluksia.

Digisisältöjen saavutettavuus muodostuu:

  • helppokäyttöisyydestä
  • teknisestä toteutuksesta
  • kognitiivisesta saavutettavuudesta eli sisältöjen ymmärrettävyydestä

Konkreettisesti nämä tarkoittavat muun muassa: tekstivastineita äänisisällöille, tekstityksiä, kuvailutulkkauksia, viittomakielen huomiointia, audion kontrollointimahdollisuutta, virheilmoitusten äänimerkkejä, värien käyttöä ja niiden kontrastia, fontin koon suurentamisen mahdollisuutta, visuaalisten elementtien esitystapaa, sivuston responsiivisuutta eli skaalautumista näyttökoon mukaan, käytettävyyttä näppäimistöllä ilman hiirtä, käytettävyyttä apuvälineohjelmilla, sivuston aikakatkaisua ja uudelleentunnistautumista, johdonmukaista navigointia, lohkojen ohittamista, sivuotsikoita ja osioiden otsikoita, nimettyjä linkkejä, tekstin ja kielen ymmärrettävyyttä sekä hakutoimintomahdollisuutta.

Saavutettavuuden lisääminen koostuu siis monesta osasesta. Edellä olevasta pitkästä listastakin jo huomaa, että verkkosivut ja sovellukset on helpointa tehdä saavutettaviksi jo niiden suunnittelu- ja toteutusvaiheessa. Olemassa olevan sivun muokkaaminen täysin saavutettavaksi voi olla todella vaikeaa, mutta yksittäisten asioiden, esimerkiksi verkkosivulukijan lisääminen valmiille sivuille on suhteellisen helppoa. Verkkosivuilla valmiiksi olevat verkkosivulukijat ovat käteviä, sillä niiden kanssa kuka tahansa voi kuunnella verkkosivutekstit ääneen.

Koneäänet luovat saavutettavuutta

Mitä useammat sisällöt voidaan tarjota helposti kuunneltavassa muodossa, sitä paremmaksi muuttuu kyseisen median saavutettavuus.

Koneäänillä on nimenomaan määrään liittyviä hyötyjä ihmislukijaan verrattuna: niillä voidaan lukea ääneen rajaton määrä digitaalista sisältöä. Suurin etu koneäänten käytössä ihmiseen verrattuna onkin äänisisältöjen luomisen kustannustehokkuus, ihmiseen verrattuna noin kuusinkertainen lukunopeus ja mahdollisuus muokata sisältöjä helposti jälkeenpäin. Esimerkiksi päivän digilehden artikkelit saadaan koneäänellä hyvin kätevästi ja nopeasti kuunneltavaan muotoon.

Erityisesti modernien, koneoppimismenetelmiin perustuvien koneäänten käyttömahdollisuudet ovat laajat. Koska koneääni oppii jäljittelemään puhetta sille koulutusvaiheessa syötetystä datasta, on lopputulos todella luonnollisen kuuloinen koneääni. Yleisimpiin käyttökohteisiin kuuluu digi- ja äänikirjat, koulutusmateriaalit, lehtisisällöt, verkkosivulukijat, virtuaaliavustajat sekä erilaiset sovellukset ja ohjelmistot.

Kehittämäämme Ilona-koneääntä on käytetty tähän mennessä eniten digi- ja äänikirjoissa, lehtiartikkeleissa ja verkkosivulukijoissa. Äänikirjoja on tehty esimerkiksi Celialle, joka on nimenomaan saavutettavan kirjallisuuden ja julkaisemisen asiantuntijakeskus. Äänikirjoissa koneääni sopii etenkin tietopainotteisiin kirjoihin selkeän lausumisensa ansiosta. Ilona on lukenut eri kustantamoille kuunneltavaan muotoon muun muassa anatomian oppikirjan, kirkkohistorian tietokirjan ja oikeustieteen kurssikirjoja.

Puheentunnistus ja saavutettavuus

Puheentunnistuksellakin luodaan laaja-alaista saavutettavuutta. Sitä voidaan käyttää niin tekstityksien tekemiseen kuin verkkopalvelussa liikkumiseen.

Puheentunnistusohjelmilla saadaan tehtyä automaattiset tekstitykset suoriin lähetyksiin ja tallennettuihin videoihin sekä litteroitua äänisisältöjä, kuten haastatteluja. Tekstitykset ovat kuuroille ja huonokuuloisille oleellinen osa saavutettavuuden lisäämisessä. Tekstityksistä hyötyvät myös ihmiset, jotka ovat meluisassa ympäristössä tai haluavat katsoa videota äänettömällä. Esimerkiksi LinkedInissä olevat videot ovat automaattisesti oletuksena äänettömällä eli puhesisältö menee ohi ilman tekstityksiä. Automaattinen tekstitys voisi olla hyvä lisä tämänkaltaisiin videoihin.

Puheentunnistusta voidaan käyttää myös haastattelujen, kokousten, sanelujen ja podcastien muuttamiseen tekstiksi. Tämä nopeuttaa huomattavasti tekstivastineen tekemistä.

Saavutettavuutta luodessa on kuitenkin hyvä muistaa, etteivät tekstityksetkään ole aina täydellinen ratkaisu. Kuurojen äidinkieli on nimittäin viittomakieli, eli suomen kieltä voi olla hankalaa ymmärtää vaikeiden sanojen tai sanajärjestysten osalta.

Näkövammainen henkilö tai motorisia vaikeuksia omaava voi käyttää puheentunnistusta hieman toisin päin: puheentunnistuksella ja puheen automaattisella litteroinnilla voidaan helpottaa tällaisten ihmisten tekstin tuottamista. Puheentunnistimen avulla tällaiset henkilöt voivat sanella tekstiksi asiakirjoja, dokumentteja ja raportteja. Täydellisen virheetöntä tekstiä näillä on toistaiseksi kuitenkin hankala saada aikaan.

Puheentunnistuksen avulla voidaan myös liikkua verkkosivuilla ja sovelluksissa. Kirjoitimme tästä aiemmin artikkelissa Puheohjatut ostokset. Älykaiuttimien ja virtuaaliavustajien, kuten Sirin, Google Assistantin tai Alexan avulla digitaalinen saavutettavuus kasvaa huimasti, kun netistä saa tarkistettua asiat nopeasti puheella kysyen. Kirjoitimme myös tästä aiemmin artikkelin Älykoti ja puheohjaus – Ihmiset ja koneet vuorovaikutuksessa.

Kiinnostuitko? Ota Yhteyttä!

Jaa artikkeli

LinkedIn
Twitter
Facebook
Nainen istuu auton etupenkillä kuulokkeet päässä ja pädi sylissä.
Tekoäly ja kieliteknologia mahdollistavat uudenlaisia ja kiinnostavampia tapoja oppia uusia kieliä. Esimerkiksi kieltenoppimissovellukset hyödyntävät luonnollisen kielen käsittelyä.
Keskellä lukee huhtikuun ääniuutiset. Taustalla kuva henkilöstä kuulokkeet päässä ja avonaisesta kirjasta lattialla. Henkilö tekee muistiinpanoja postit-lappuun.
Kokosimme yhteen artikkeliin huhtikuun kiinnostavimmat puheteknologiauutiset maailmalta. Aiheina muun muassa AutoGPT, äänikloonien teko artistien äänistä, älysilmälasit ja tekoälyuutisankkurit.
Nainen makaa ylhäältäpäin otetussa valokuvassa sohvalla silmät kiinni, kuulokkeet päässä ja hymyilee.
Suomalaisten lukuharrastusta tutkittiin Kirjakauppaliiton ja Suomen Kustannusyhdistyksen teettämässä Suomi lukee 2023 -tutkimuksessa. Artikkelissa katsaus tutkimukseen ääni- ja sähkökirjojen osalta sekä Suomen Kustannusyhdistyksen todelliset myyntitilastot vuodelta 2022.
Aimaterin työntekijä Antti Virtanen kuvattuna ylhäältä, istumassa tietokoneen äärellä.
Mikä on GPT ja mihin sitä voidaan käyttää? Miten ChatGPT on kehitetty? a.i.materin koneoppimisinsinööri Antti Virtanen kirjoitti näistä kysymyksistä ja GPT:n kehityshistoriasta asiantuntija-artikkelin.
Artikkelissa maaliskuun ääniuutiset maailmalta. Aiheina muun muassa GPT-4, RadioGPT ja koneäänien käyttö muun muassa podcasteissa ja Spotifyssa.
Tekstinlouhinta on tekoälypohjainen menetelmä, jolla tekstimassoista löydetään niihin piiloutuvaa tietoa. Kuvassa mies istuu Excelin edessä ja takana vaaleat ruudukkoikkunat kesämaisemalla.
Tekoälypohjaisilla tekstinlouhinnan työkaluilla laajoista tekstimassoista löydetään tekstisisältöön piiloutuvia tärkeitä havaintoja. Parhaimmillaan nämä oivallukset voivat jopa lisätä niitä käyttävien yritysten kilpailuetua.