Kehittämämme uusi, suomenruotsalainen koneääni Amanda on ensimmäinen toista kotimaista kieltä luonnollisesti puhuva koneääni. Artikkelin lopusta löytyvästä videosta pääset kuuntelemaan Amandan ääninäytteen.
Suomenruotsalaisen koneäänen kehittäminen
Ajatus oman suomenruotsalaisen koneäänen kehittämisestä lähti verkkosivulukijoista ja saavutettavuudesta; yleensä julkisten toimijoiden verkkosivuilla on sisältöä molemmilla kotimaisilla. Meitä kiinnosti koko paketin tarjoaminen, sillä suomenruotsin kuuleminen suomalaisilla verkkosivuilla on huomattavasti riikinruotsia mukavampaa.
Luonnollisen kuuloista suomenruotsalaista koneääntä ei myöskään markkinoilta vielä löytynyt, joten tässäkin mielessä oli mahdollisuus kehittää jotain uutta.
Luonnollisen kuuloisessa koneäänessä tärkeintä on oikea ääntämys ja puheen prosodia. Neuroverkkopohjaisen koneäänen kehitys lähteekin aidosta ihmisäänestä. Prosessi aloitetaan keräämällä puhenäytteitä ja valitsemalla niistä sopivimman ja miellyttävimmän kuuloinen. Valmis koneääni ei kuitenkaan tule kuulostamaan täysin identtiseltä alkuperäiseen puheääneen verrattuna, mutta siinä on hyvin paljon samoja piirteitä.
Kun haluttu puheääni on löytynyt, kyseinen henkilö kutsutaan studioon lukemaan sillä kielellä koostettua tekstiä, josta koneääntä ollaan tekemässä. Nauhoitetun puheen tulee olla studiolaatuista, jotta koneäänestä tulee mahdollisimman hyvä.
Nauhoitusten jälkeen äänitetyt koulutusdatat laatutarkastetaan. Tähän kuuluu muun muassa tekstien ja puheen täsmäävyys keskenään. Tarkastetusta koulutusdatasta päästään kouluttamaan valmista koneoppimispohjaista koneääntä.
Ruotsinkielen haasteita
Suomenruotsilla tarkoitetaan ruotsin kielen Suomessa käytettyä kirja- ja puhekielen varianttia. Erot riikinruotsista suomenruotsiin ovat ääntämyksessä ja tietyissä sanoissa. Ne johtuvat suomen kielen vaikutuksesta ja ”vanhasta” ruotsin kielestä, joka on Ruotsissa harvinaistunut. Suomenruotsalaisesta sanastosta löytyy myös suoraan suomesta käännettyjä sanoja, joita ei Ruotsissa käytetä ollenkaan.
Suomenruotsalaisen koneäänen suurimpia eroja suomenkielisen koneäänen kehittämiseen verrattuna, on sanojen erilainen lausumistapa. Suomen kielessä sanat lausutaan samaan tapaan kuin ne kirjoitetaankin, kun taas suomenruotsissa sanojen lausuminen ja kirjoitusasu eroavat toisistaan. Vokaaleja saatetaan esimerkiksi venyttää ja kirjain ä ääntyä e:nä.
Nämä lausumisen ja kirjoitusasun eroavaisuudet aiheuttivat myös haasteita koneäänen kehittämisessä. Ongelma ratkaistiin koneoppimispohjaisella mallilla, joka luo lausumisohjeen siitä, miten ruotsinkielinen sana lausutaan suomenruotsissa. Tähän projektiin saimme Åbo Akademilta mukaan Alexander Ginlundin. Alexander oli mukana suomenruotsin fonetiikan asiantuntijan roolissa ja keskittyi koneoppimismallin kouluttamiseen ja arviointiin sekä käytetyn datan tuottamiseen.
Molemmat kotimaiset hallussa
Uusi suomenruotsalainen koneääni Amanda tulee vastaamaan hyvin muun muassa digitaalisten palveluiden saavutettavuusvaatimuksiin. Erityisesti julkisten toimijoiden tulee ottaa huomioon molemmat kotimaiset kielet. Koska meiltä löytyy nyt omasta takaa sekä suomen- että suomenruotsia puhuvat koneäänet, pystymme tarjoamaan esimerkiksi verkkosivulukijaan tarvittavan kokonaispaketin.
Suomenruotsalainen koneääni kiinnostaa, sillä Amandan kaltaista, luonnollisen kuuloista suomenruotsalaista koneääntä ei ole vielä ollut aiemmin olemassa. Yle Åboland kävi aiemmin keväällä haastattelemassa meitä silloin vielä kehitteillä olevasta koneäänestä. Haastattelussa kyseltiin myös tulevan koneäänen nimeä, joka oli kuitenkin vielä tässä vaiheessa pohdinnassa. Samoin Hufvudstadsbladet-sanomalehti kiinnostui asiasta ja haastatteli meitä asiantuntija-artikkeliin koneäänistä ja puheteknologiasta.
Haastattelut pääset lukemaan Meistä kirjoitettua-osiosta.
Suomenruotsalaisen Amanda-koneäänen ääninäyte:
Sinua saattaisi kiinnostaa myös seuraavat artikkelit:
Yle.fi-verkkosivujen ja -sovelluksen uutisartikkelit nyt kuunneltavissa
Räätälöity koneääni osana yrityksesi audiobrändiä
Työmarkkinatorin verkkosivulukija