Kädet ovat ottamassa kuulokkeet rottinkiselta terassipöydältä. Pöydällä on myös siveltimiä lasipurkissa.

Esittelyssä suomenruotsalainen koneääni Amanda

Kehittämämme uusi, suomenruotsalainen koneääni Amanda on ensimmäinen toista kotimaista kieltä luonnollisesti puhuva koneääni. Artikkelin lopusta löytyvästä videosta pääset kuuntelemaan Amandan ääninäytteen.

Suomenruotsalaisen koneäänen kehittäminen

Ajatus oman suomenruotsalaisen koneäänen kehittämisestä lähti verkkosivulukijoista ja saavutettavuudesta; yleensä julkisten toimijoiden verkkosivuilla on sisältöä molemmilla kotimaisilla. Meitä kiinnosti koko paketin tarjoaminen, sillä suomenruotsin kuuleminen suomalaisilla verkkosivuilla on huomattavasti riikinruotsia mukavampaa.

Luonnollisen kuuloista suomenruotsalaista koneääntä ei myöskään markkinoilta vielä löytynyt, joten tässäkin mielessä oli mahdollisuus kehittää jotain uutta. 

Luonnollisen kuuloisessa koneäänessä tärkeintä on oikea ääntämys ja puheen prosodia. Neuroverkkopohjaisen koneäänen kehitys lähteekin aidosta ihmisäänestä. Prosessi aloitetaan keräämällä puhenäytteitä ja valitsemalla niistä sopivimman ja miellyttävimmän kuuloinen. Valmis koneääni ei kuitenkaan tule kuulostamaan täysin identtiseltä alkuperäiseen puheääneen verrattuna, mutta siinä on hyvin paljon samoja piirteitä.

Kun haluttu puheääni on löytynyt, kyseinen henkilö kutsutaan studioon lukemaan sillä kielellä koostettua tekstiä, josta koneääntä ollaan tekemässä. Nauhoitetun puheen tulee olla studiolaatuista, jotta koneäänestä tulee mahdollisimman hyvä.

Nauhoitusten jälkeen äänitetyt koulutusdatat laatutarkastetaan. Tähän kuuluu muun muassa tekstien ja puheen täsmäävyys keskenään. Tarkastetusta koulutusdatasta päästään kouluttamaan valmista koneoppimispohjaista koneääntä.

Ruotsinkielen haasteita

Suomenruotsilla tarkoitetaan ruotsin kielen Suomessa käytettyä kirja- ja puhekielen varianttia. Erot riikinruotsista suomenruotsiin ovat ääntämyksessä ja tietyissä sanoissa. Ne johtuvat suomen kielen vaikutuksesta ja ”vanhasta” ruotsin kielestä, joka on Ruotsissa harvinaistunut. Suomenruotsalaisesta sanastosta löytyy myös suoraan suomesta käännettyjä sanoja, joita ei Ruotsissa käytetä ollenkaan.

Suomenruotsalaisen koneäänen suurimpia eroja suomenkielisen koneäänen kehittämiseen verrattuna, on sanojen erilainen lausumistapa. Suomen kielessä sanat lausutaan samaan tapaan kuin ne kirjoitetaankin, kun taas suomenruotsissa sanojen lausuminen ja kirjoitusasu eroavat toisistaan. Vokaaleja saatetaan esimerkiksi venyttää ja kirjain ä ääntyä e:nä.

Nämä lausumisen ja kirjoitusasun eroavaisuudet aiheuttivat myös haasteita koneäänen kehittämisessä. Ongelma ratkaistiin koneoppimispohjaisella mallilla, joka luo lausumisohjeen siitä, miten ruotsinkielinen sana lausutaan suomenruotsissa. Tähän projektiin saimme Åbo Akademilta mukaan Alexander Ginlundin. Alexander oli mukana suomenruotsin fonetiikan asiantuntijan roolissa ja keskittyi koneoppimismallin kouluttamiseen ja arviointiin sekä käytetyn datan tuottamiseen.

Molemmat kotimaiset hallussa

Uusi suomenruotsalainen koneääni Amanda tulee vastaamaan hyvin muun muassa digitaalisten palveluiden saavutettavuusvaatimuksiin. Erityisesti julkisten toimijoiden tulee ottaa huomioon molemmat kotimaiset kielet. Koska meiltä löytyy nyt omasta takaa sekä suomen- että suomenruotsia puhuvat koneäänet, pystymme tarjoamaan esimerkiksi verkkosivulukijaan tarvittavan kokonaispaketin.

Suomenruotsalainen koneääni kiinnostaa, sillä Amandan kaltaista, luonnollisen kuuloista suomenruotsalaista koneääntä ei ole vielä ollut aiemmin olemassa. Yle Åboland kävi aiemmin keväällä haastattelemassa meitä silloin vielä kehitteillä olevasta koneäänestä. Haastattelussa kyseltiin myös tulevan koneäänen nimeä, joka oli kuitenkin vielä tässä vaiheessa pohdinnassa. Samoin Hufvudstadsbladet-sanomalehti kiinnostui asiasta ja haastatteli meitä asiantuntija-artikkeliin koneäänistä ja puheteknologiasta.

Haastattelut pääset lukemaan Meistä kirjoitettua-osiosta.

Suomenruotsalaisen Amanda-koneäänen ääninäyte:

Kysymyksiä, ajatuksia tai mahdollinen yhteistyö?

Henkilö istuu lattialla kirjan edessä tekemässä muistiinpanoja. Hänellä on kuulokkeet päässä. Kuvaotettu ylhäältäpäin.
23.4.2024
Tietoa on monia tapoja kuluttaa, ja meidän tulisi huomioida tämä monimuotoisuus sisältöä tuottaessa. Ääni ja teksti tukevat toisiaan ja antavat sisällön kuluttajalle valinnanvaraa päättää.
Läppäri, jonka näppäimistön päällä on kuulokkeet. Läppärin näytössä on eepressin etusivu.
2.4.2024
Konenäköä ja puhesynteesiä yhdistäneessä projektissa kehitimme ePress-näköislehtipalvelulle pipelinen, joka pystyy tunnistamaan näköislehtien artikkelit ja toimittamaan niistä ääniversiot.
Kuulokkeet tietokonepöydän päällä.
14.3.2024
Yle on ottanut käyttöön a.i.materin kehittämän kuuntelumahdollisuuden uutissivuilleen. Kuunteluominaisuus parantaa palvelun digitaalista saavutettavuutta.
Aimaterin työntekijät Roope ja Niko tutkivat työpöydän edessä tietokoneelta jotain. Roope juuri osoittaa kädellään näyttöä.
28.2.2024
Artikkelissa esitellään ja vertaillaan verkkosivulukijaa ja äänirajapintaa: miten ne toimivat ja mikä tapa sopii mihinkin tarkoitukseen.
Educa-messujen 2024 logo
29.1.2024
a.i.mater oli mukana Educa-messuilla näytteilleasettajan roolissa. Paljon kiinnostavia kohtaamisia, keskusteluja mahdollisten uusien asiakkaiden kanssa, sekä nykyisten asiakkaiden ja yhteistyökumppanien tapaamisia.
10.1.2024
Digiaudion kulutus kasvaa edelleen, ääni on yhä tärkeämpi osa brändistrategiaa ja ääniklooneja voi hyödyntää muuhunkin kuin hupailuun. Muun muassa näihin voi hyödyntää moderneja koneääniä kuluvana vuonna.