Kädet ovat ottamassa kuulokkeet rottinkiselta terassipöydältä. Pöydällä on myös siveltimiä lasipurkissa.

Esittelyssä suomenruotsalainen koneääni Amanda

Kehittämämme uusi, suomenruotsalainen koneääni Amanda on vasta toinen toista kotimaista kieltä puhuva koneääni. Artikkelin lopusta löytyvästä videosta pääset kuuntelemaan Amandan ääninäytteen.

Suomenruotsalaisen koneäänen kehittäminen

Ajatus oman suomenruotsalaisen koneäänen kehittämisestä lähti verkkosivulukijoista ja saavutettavuudesta; yleensä julkisten toimijoiden verkkosivuilla on sisältöä molemmilla kotimaisilla. Meitä kiinnosti koko paketin tarjoaminen, sillä suomenruotsin kuuleminen suomalaisilla verkkosivuilla on huomattavasti riikinruotsia mukavampaa.

Luonnollisen kuuloista suomenruotsalaista koneääntä ei myöskään markkinoilta vielä löytynyt, joten tässäkin mielessä oli mahdollisuus kehittää jotain uutta. 

Luonnollisen kuuloisessa koneäänessä tärkeintä on oikea ääntämys ja puheen prosodia. Neuroverkkopohjaisen koneäänen kehitys lähteekin aidosta ihmisäänestä. Prosessi aloitetaan keräämällä puhenäytteitä ja valitsemalla niistä sopivimman ja miellyttävimmän kuuloinen. Valmis koneääni ei kuitenkaan tule kuulostamaan täysin identtiseltä alkuperäiseen puheääneen verrattuna, mutta siinä on hyvin paljon samoja piirteitä.

Kun haluttu puheääni on löytynyt, kyseinen henkilö kutsutaan studioon lukemaan sillä kielellä koostettua tekstiä, josta koneääntä ollaan tekemässä. Nauhoitetun puheen tulee olla studiolaatuista, jotta koneäänestä tulee mahdollisimman hyvä.

Nauhoitusten jälkeen äänitetyt koulutusdatat laatutarkastetaan. Tähän kuuluu muun muassa tekstien ja puheen täsmäävyys keskenään. Tarkastetusta koulutusdatasta päästään kouluttamaan valmista koneoppimispohjaista koneääntä.

Ruotsinkielen haasteita

Suomenruotsilla tarkoitetaan ruotsin kielen Suomessa käytettyä kirja- ja puhekielen varianttia. Erot riikinruotsista suomenruotsiin ovat ääntämyksessä ja tietyissä sanoissa. Ne johtuvat suomen kielen vaikutuksesta ja ”vanhasta” ruotsin kielestä, joka on Ruotsissa harvinaistunut. Suomenruotsalaisesta sanastosta löytyy myös suoraan suomesta käännettyjä sanoja, joita ei Ruotsissa käytetä ollenkaan.

Suomenruotsalaisen koneäänen suurimpia eroja suomenkielisen koneäänen kehittämiseen verrattuna, on sanojen erilainen lausumistapa. Suomen kielessä sanat lausutaan samaan tapaan kuin ne kirjoitetaankin, kun taas suomenruotsissa sanojen lausuminen ja kirjoitusasu eroavat toisistaan. Vokaaleja saatetaan esimerkiksi venyttää ja kirjain ä ääntyä e:nä.

Nämä lausumisen ja kirjoitusasun eroavaisuudet aiheuttivat myös haasteita koneäänen kehittämisessä. Ongelma ratkaistiin koneoppimispohjaisella mallilla, joka luo lausumisohjeen siitä, miten ruotsinkielinen sana lausutaan suomenruotsissa. Tähän projektiin saimme Åbo Akademilta mukaan Alexander Ginlundin. Alexander oli mukana suomenruotsin fonetiikan asiantuntijan roolissa ja keskittyi koneoppimismallin kouluttamiseen ja arviointiin sekä käytetyn datan tuottamiseen.

Molemmat kotimaiset hallussa

Uusi suomenruotsalainen koneääni Amanda tulee vastaamaan hyvin muun muassa digitaalisten palveluiden saavutettavuusvaatimuksiin. Erityisesti julkisten toimijoiden tulee ottaa huomioon molemmat kotimaiset kielet. Koska meiltä löytyy nyt omasta takaa sekä suomen- että suomenruotsia puhuvat koneäänet, pystymme tarjoamaan esimerkiksi verkkosivulukijaan tarvittavan kokonaispaketin.

Suomenruotsalainen koneääni kiinnostaa, sillä Amandan kaltaista, luonnollisen kuuloista suomenruotsalaista koneääntä ei ole vielä ollut aiemmin olemassa. Yle Åboland kävi aiemmin keväällä haastattelemassa meitä silloin vielä kehitteillä olevasta koneäänestä. Haastattelussa kyseltiin myös tulevan koneäänen nimeä, joka oli kuitenkin vielä tässä vaiheessa pohdinnassa. Samoin Hufvudstadsbladet-sanomalehti kiinnostui asiasta ja haastatteli meitä asiantuntija-artikkeliin koneäänistä ja puheteknologiasta.

Haastattelut pääset lukemaan Mediassa-osiostamme.

Kiinnostuitko? Ota Yhteyttä!

Jaa artikkeli

LinkedIn
Twitter
Facebook
Tekstinlouhinta on tekoälypohjainen menetelmä, jolla tekstimassoista löydetään niihin piiloutuvaa tietoa. Kuvassa mies istuu Excelin edessä ja takana vaaleat ruudukkoikkunat kesämaisemalla.
Tekoälypohjaisilla tekstinlouhinnan työkaluilla laajoista tekstimassoista löydetään tekstisisältöön piiloutuvia tärkeitä havaintoja. Parhaimmillaan nämä oivallukset voivat jopa lisätä niitä käyttävien yritysten kilpailuetua.
Taustalla punahiuksinen nainen, jolla kuulokkeet päässä. Kuvan päällä sumennettu suorakulmio, jossa lukee: Helmikuun ääniuutiset. Tekstin alla on piirretty valkoinen ääniaalto alleviivaamaan tekstiä.
Kokosimme koko helmikuun ajalta yhteen artikkeliin mielenkiintoisimmat koneääni- ja puheentunnistusuutiset maailmalta. Voit myös kuunnella artikkelin Ilonan lukemana.
Mies istuu tietokoneen edessä kuulokkeet päässä. Hän nauhoittaa studiomikkiin puhettaan. Takana on ristikkoikkunat, joista näkyy vihreää luontoa.
Äänen kloonauksella tavoitellaan synteettistä ääntä, joka muistuttaa mahdollisimman paljon alkuperäistä puhujaa. Artikkelissa menetelmän hyödyistä ja syväväärennösten riskeistä.
Mies istuu korituolissa laiturin nokassa ja katsoo merelle. Vieressä on kirjapino, jonka päällä älypuhelin. Miehellä on t-paita päällä ja kuulokkeet päässä.
Aikakausmediat näkevät tärkeimpinä syinä äänisisältöjen tekemiselle nuoren ja uuden yleisön tavoittamisen. Suosituin äänisisällön muoto on podcastit.
Nainen makaa selällään silmät kiinni ja kuulokkeet korvilla, vierellä on lautasellinen pilkottuja hedelmiä.
Koneäänet antavat kuluttajalle mahdollisuuden päättää, missä muodossa haluaa sisältönsä kuluttaa. Samalla lisätään sisällön saavutettavuutta.
Studiolaatuinen mikrofoni. Takana ikkuna, jossa kesäiset maisemat. Pöydällä vaaleanpunainen kesäkukka.
Artikkelissa tutustutaan Microsoftin kehittämään VALL-E -tekoälymalliin, joka pystyy tuottamaan ihmisen äänestä koneääntä vain kolmen sekunnin pohjalta. Sekä Applen uutisiin julkaista äänikirjoja koneäänien lukemina.