Kädet ovat ottamassa kuulokkeet rottinkiselta terassipöydältä. Pöydällä on myös siveltimiä lasipurkissa.

Esittelyssä suomenruotsalainen koneääni Amanda

Kehittämämme uusi, suomenruotsalainen koneääni Amanda on vasta toinen toista kotimaista kieltä puhuva koneääni. Artikkelin lopusta löytyvästä videosta pääset kuuntelemaan Amandan ääninäytteen.

Suomenruotsalaisen koneäänen kehittäminen

Ajatus oman suomenruotsalaisen koneäänen kehittämisestä lähti verkkosivulukijoista ja saavutettavuudesta; yleensä julkisten toimijoiden verkkosivuilla on sisältöä molemmilla kotimaisilla. Meitä kiinnosti koko paketin tarjoaminen, sillä suomenruotsin kuuleminen suomalaisilla verkkosivuilla on huomattavasti riikinruotsia mukavampaa.

Luonnollisen kuuloista suomenruotsalaista koneääntä ei myöskään markkinoilta vielä löytynyt, joten tässäkin mielessä oli mahdollisuus kehittää jotain uutta. 

Luonnollisen kuuloisessa koneäänessä tärkeintä on oikea ääntämys ja puheen prosodia. Neuroverkkopohjaisen koneäänen kehitys lähteekin aidosta ihmisäänestä. Prosessi aloitetaan keräämällä puhenäytteitä ja valitsemalla niistä sopivimman ja miellyttävimmän kuuloinen. Valmis koneääni ei kuitenkaan tule kuulostamaan täysin identtiseltä alkuperäiseen puheääneen verrattuna, mutta siinä on hyvin paljon samoja piirteitä.

Kun haluttu puheääni on löytynyt, kyseinen henkilö kutsutaan studioon lukemaan sillä kielellä koostettua tekstiä, josta koneääntä ollaan tekemässä. Nauhoitetun puheen tulee olla studiolaatuista, jotta koneäänestä tulee mahdollisimman hyvä.

Nauhoitusten jälkeen äänitetyt koulutusdatat laatutarkastetaan. Tähän kuuluu muun muassa tekstien ja puheen täsmäävyys keskenään. Tarkastetusta koulutusdatasta päästään kouluttamaan valmista koneoppimispohjaista koneääntä.

Ruotsinkielen haasteita

Suomenruotsilla tarkoitetaan ruotsin kielen Suomessa käytettyä kirja- ja puhekielen varianttia. Erot riikinruotsista suomenruotsiin ovat ääntämyksessä ja tietyissä sanoissa. Ne johtuvat suomen kielen vaikutuksesta ja ”vanhasta” ruotsin kielestä, joka on Ruotsissa harvinaistunut. Suomenruotsalaisesta sanastosta löytyy myös suoraan suomesta käännettyjä sanoja, joita ei Ruotsissa käytetä ollenkaan.

Suomenruotsalaisen koneäänen suurimpia eroja suomenkielisen koneäänen kehittämiseen verrattuna, on sanojen erilainen lausumistapa. Suomen kielessä sanat lausutaan samaan tapaan kuin ne kirjoitetaankin, kun taas suomenruotsissa sanojen lausuminen ja kirjoitusasu eroavat toisistaan. Vokaaleja saatetaan esimerkiksi venyttää ja kirjain ä ääntyä e:nä.

Nämä lausumisen ja kirjoitusasun eroavaisuudet aiheuttivat myös haasteita koneäänen kehittämisessä. Ongelma ratkaistiin koneoppimispohjaisella mallilla, joka luo lausumisohjeen siitä, miten ruotsinkielinen sana lausutaan suomenruotsissa. Tähän projektiin saimme Åbo Akademilta mukaan Alexander Ginlundin. Alexander oli mukana suomenruotsin fonetiikan asiantuntijan roolissa ja keskittyi koneoppimismallin kouluttamiseen ja arviointiin sekä käytetyn datan tuottamiseen.

Molemmat kotimaiset hallussa

Uusi suomenruotsalainen koneääni Amanda tulee vastaamaan hyvin muun muassa digitaalisten palveluiden saavutettavuusvaatimuksiin. Erityisesti julkisten toimijoiden tulee ottaa huomioon molemmat kotimaiset kielet. Koska meiltä löytyy nyt omasta takaa sekä suomen- että suomenruotsia puhuvat koneäänet, pystymme tarjoamaan esimerkiksi verkkosivulukijaan tarvittavan kokonaispaketin.

Suomenruotsalainen koneääni kiinnostaa, sillä Amandan kaltaista, luonnollisen kuuloista suomenruotsalaista koneääntä ei ole vielä ollut aiemmin olemassa. Yle Åboland kävi aiemmin keväällä haastattelemassa meitä silloin vielä kehitteillä olevasta koneäänestä. Haastattelussa kyseltiin myös tulevan koneäänen nimeä, joka oli kuitenkin vielä tässä vaiheessa pohdinnassa. Samoin Hufvudstadsbladet-sanomalehti kiinnostui asiasta ja haastatteli meitä asiantuntija-artikkeliin koneäänistä ja puheteknologiasta.

Haastattelut pääset lukemaan Mediassa-osiostamme.

Suomenruotsalaisen Amanda-koneäänen ääninäyte:

Kiinnostuitko? Ota Yhteyttä!

Jaa artikkeli

LinkedIn
Twitter
Facebook
Nainen istuu kesällä puutarhassa taidemaalaustarvikkeiden kanssa. Päässä on kuulokkeet.
Yhdysvalloissa parhaillaan käynnissä olevassa näyttelijöiden ja käsikirjoittajien lakossa on kysymys myös tekoälyn käytöstä. Huolenaiheet koskevat muun muassa työpaikkoja ja taiteellista luovuutta.
Mies istuu selkä kuvaajaa päin laiturilla korituolissa kuulokkeet päässä. Vieressä on pino kirjoja ja niiden päällä älypuhelin , josta lähtee piuha kuulokkeisiin.
Alkuvuodesta Apple Books ja kesäkuussa Storytel ilmoittivat ottavansa äänikirjapalveluihinsa koneäänet osaksi äänikirjalukijavaihtoehtojaan. Storytel laajentaa tätä vaihtoehtoa Voice Switcher -ominaisuudella, joka mahdollistaa kuulijan vaihtaa lukijaääntä.
Selko Digitalin logo, jossa silmä ja teksti Selko Digital.
Saavutettavuuteen erikoistunut yhteistyökumppanimme Selko Digital avaa vieraskynäblogissa koneäänien ja puheentunnistuksen vaikutusta digimaailman yhdenvertaisuuteen.
Keskellä lukee toukokuun ääniuutiset. Taustalla kuva kuulokkeista kirjapinon päällä, kuulokkeiden vieressä on juomalasi, jossa sitruunaviipale ja kukkiva omenapuun oksa.
Toukokuun ääniuutisten aiheina Google Bard, Metan uusi kielimalli, Applen uudet saavutettavuusominaisuudet, kielivähemmistöille suunnattu chatbot ja älykkäät NPC:t.
Keskellä lukee huhtikuun ääniuutiset. Taustalla kuva henkilöstä kuulokkeet päässä ja avonaisesta kirjasta lattialla. Henkilö tekee muistiinpanoja postit-lappuun.
Kokosimme yhteen artikkeliin huhtikuun kiinnostavimmat puheteknologiauutiset maailmalta. Aiheina muun muassa AutoGPT, äänikloonien teko artistien äänistä, älysilmälasit ja tekoälyuutisankkurit.
Nainen makaa ylhäältäpäin otetussa valokuvassa sohvalla silmät kiinni, kuulokkeet päässä ja hymyilee.
Suomalaisten lukuharrastusta tutkittiin Kirjakauppaliiton ja Suomen Kustannusyhdistyksen teettämässä Suomi lukee 2023 -tutkimuksessa. Artikkelissa katsaus tutkimukseen ääni- ja sähkökirjojen osalta sekä Suomen Kustannusyhdistyksen todelliset myyntitilastot vuodelta 2022.