Kädet ovat ottamassa kuulokkeet rottinkiselta terassipöydältä. Pöydällä on myös siveltimiä lasipurkissa.

Esittelyssä suomenruotsalainen koneääni Amanda

Kehittämämme uusi, suomenruotsalainen koneääni Amanda on ensimmäinen toista kotimaista kieltä luonnollisesti puhuva koneääni. Artikkelin lopusta löytyvästä videosta pääset kuuntelemaan Amandan ääninäytteen.

Suomenruotsalaisen koneäänen kehittäminen

Ajatus oman suomenruotsalaisen koneäänen kehittämisestä lähti verkkosivulukijoista ja saavutettavuudesta; yleensä julkisten toimijoiden verkkosivuilla on sisältöä molemmilla kotimaisilla. Meitä kiinnosti koko paketin tarjoaminen, sillä suomenruotsin kuuleminen suomalaisilla verkkosivuilla on huomattavasti riikinruotsia mukavampaa.

Luonnollisen kuuloista suomenruotsalaista koneääntä ei myöskään markkinoilta vielä löytynyt, joten tässäkin mielessä oli mahdollisuus kehittää jotain uutta. 

Luonnollisen kuuloisessa koneäänessä tärkeintä on oikea ääntämys ja puheen prosodia. Neuroverkkopohjaisen koneäänen kehitys lähteekin aidosta ihmisäänestä. Prosessi aloitetaan keräämällä puhenäytteitä ja valitsemalla niistä sopivimman ja miellyttävimmän kuuloinen. Valmis koneääni ei kuitenkaan tule kuulostamaan täysin identtiseltä alkuperäiseen puheääneen verrattuna, mutta siinä on hyvin paljon samoja piirteitä.

Kun haluttu puheääni on löytynyt, kyseinen henkilö kutsutaan studioon lukemaan sillä kielellä koostettua tekstiä, josta koneääntä ollaan tekemässä. Nauhoitetun puheen tulee olla studiolaatuista, jotta koneäänestä tulee mahdollisimman hyvä.

Nauhoitusten jälkeen äänitetyt koulutusdatat laatutarkastetaan. Tähän kuuluu muun muassa tekstien ja puheen täsmäävyys keskenään. Tarkastetusta koulutusdatasta päästään kouluttamaan valmista koneoppimispohjaista koneääntä.

Ruotsinkielen haasteita

Suomenruotsilla tarkoitetaan ruotsin kielen Suomessa käytettyä kirja- ja puhekielen varianttia. Erot riikinruotsista suomenruotsiin ovat ääntämyksessä ja tietyissä sanoissa. Ne johtuvat suomen kielen vaikutuksesta ja ”vanhasta” ruotsin kielestä, joka on Ruotsissa harvinaistunut. Suomenruotsalaisesta sanastosta löytyy myös suoraan suomesta käännettyjä sanoja, joita ei Ruotsissa käytetä ollenkaan.

Suomenruotsalaisen koneäänen suurimpia eroja suomenkielisen koneäänen kehittämiseen verrattuna, on sanojen erilainen lausumistapa. Suomen kielessä sanat lausutaan samaan tapaan kuin ne kirjoitetaankin, kun taas suomenruotsissa sanojen lausuminen ja kirjoitusasu eroavat toisistaan. Vokaaleja saatetaan esimerkiksi venyttää ja kirjain ä ääntyä e:nä.

Nämä lausumisen ja kirjoitusasun eroavaisuudet aiheuttivat myös haasteita koneäänen kehittämisessä. Ongelma ratkaistiin koneoppimispohjaisella mallilla, joka luo lausumisohjeen siitä, miten ruotsinkielinen sana lausutaan suomenruotsissa. Tähän projektiin saimme Åbo Akademilta mukaan Alexander Ginlundin. Alexander oli mukana suomenruotsin fonetiikan asiantuntijan roolissa ja keskittyi koneoppimismallin kouluttamiseen ja arviointiin sekä käytetyn datan tuottamiseen.

Molemmat kotimaiset hallussa

Uusi suomenruotsalainen koneääni Amanda tulee vastaamaan hyvin muun muassa digitaalisten palveluiden saavutettavuusvaatimuksiin. Erityisesti julkisten toimijoiden tulee ottaa huomioon molemmat kotimaiset kielet. Koska meiltä löytyy nyt omasta takaa sekä suomen- että suomenruotsia puhuvat koneäänet, pystymme tarjoamaan esimerkiksi verkkosivulukijaan tarvittavan kokonaispaketin.

Suomenruotsalainen koneääni kiinnostaa, sillä Amandan kaltaista, luonnollisen kuuloista suomenruotsalaista koneääntä ei ole vielä ollut aiemmin olemassa. Yle Åboland kävi aiemmin keväällä haastattelemassa meitä silloin vielä kehitteillä olevasta koneäänestä. Haastattelussa kyseltiin myös tulevan koneäänen nimeä, joka oli kuitenkin vielä tässä vaiheessa pohdinnassa. Samoin Hufvudstadsbladet-sanomalehti kiinnostui asiasta ja haastatteli meitä asiantuntija-artikkeliin koneäänistä ja puheteknologiasta.

Haastattelut pääset lukemaan Meistä kirjoitettua-osiosta.

Suomenruotsalaisen Amanda-koneäänen ääninäyte:

Kysymyksiä, ajatuksia tai mahdollinen yhteistyö?

18.10.2024
Suomen ensimmäistä tekoälyyn keskittyvää palkintogaalaa juhlitaan 23.10.2024 julkistamalla kunkin kategorian voittajat. a.i.mater on kolmen kärjessä asiakaskokemus-kategoriassa.
Kaksi henkilöä istuvat sohvalla läppärit sylissä. Kasvot on rajattu pois kuvasta.
9.9.2024
Digipalvelulaki ja esteettömyysdirektiivi laajenevat kesäkuussa 2025. Artikkelissa kerrotaan, keitä laki koskee myös jatkossa ja mitä saavutettavuusvaatimukset käytännössä ovat. Erityishuomiota kiinnitetään sähkö- ja äänikirjoihin.
Nainen istuu ulkona maalaustelineen kanssa ja katsoo juuri väripalettia kädessään. Taustalla on abstrakti maalaus. Valo tulee naisen takaa, joten hänen hiukset korostuvat muuten tummasta kuvasta. Naisella on kuulokkeet korvilla.
13.6.2024
Käsittelyssä kielimuurien häviäminen, henkilökohtaisemmat ääniassistentit, älykodit, äänikloonit, tekoälyllä tuotettava musiikki, median kulutus, terveyssovellukset, asiakaspalvelu, biometrinen tunnistautuminen ja smart city -ajatus.
Nainen istuu toimistotuolissa tietokoneen edessä ja katsoo näyttöä. Toinen käsi on näppäimistöllä. Taustalla on isot ikkunat.
16.5.2024
Sekä ruudunlukuohjelma että verkkosivulukija lukee verkkosivuja ääneen. Oleellisen ero on, että ruudunlukijat on tarkoitettu henkilöille, joilla on näkemisen tai motorisen tai kognitiivisen puolen kanssa rajoitteita, kun taas verkkosivulukija sopii paljon
Henkilö istuu lattialla kirjan edessä tekemässä muistiinpanoja. Hänellä on kuulokkeet päässä. Kuvaotettu ylhäältäpäin.
23.4.2024
Tietoa voidaan kuluttaa monin eri tavoin: tämä monimuotoisuus tulisi huomioida myös sisältöä tuottaessa. Ääni ja teksti tukevat toisiaan ja antavat sisällön kuluttajalle valinnanvaraa päättää.
Läppäri, jonka näppäimistön päällä on kuulokkeet. Läppärin näytössä on eepressin etusivu.
2.4.2024
Konenäköä ja puhesynteesiä yhdistäneessä projektissa kehitimme ePress-näköislehtipalvelulle pipelinen, joka pystyy tunnistamaan näköislehtien artikkelit ja toimittamaan niistä ääniversiot.