Etualalla studiomikrofoni ja taustalla tietokoneen näyttö, jossa näkyy Aimaterin äänikirjaikoni.

Tehosta äänikirjan tuottamista Erinin avulla

Äänikirjat ovat suositumpia kuin koskaan, sillä ne ovat helposti saatavilla. Oman puhelimen mukana kulkevat äänikirjat mahdollistavat kirjoista nauttimisen juuri itselle parhaimpana hetkenä, työmatkalla, kaupassa, rentoutuessa, käytännössä missä tahansa.

Hyvään kuuntelukokemukseen kuuluu muun muassa puhdas lausuminen. Virheellisesti lausutut vierasperäiset sanat särähtävät ikävästi esiin ja saattavat viedä huomiota itse tarinasta. Äänikirjan nauhoituksissa lukija saa valmiit lausumisohjeet yleensä kustantajalta. Tällöin äänikirjan lukijan ei tarvitse ihmetellä, miten esimerkiksi ranskalaisen Chenonceaun linnan nimi pitäisi lausua.

Lausumisohjeet tehdäkseen kustantajan on kuitenkin täytynyt ensin käydä koko teos manuaalisesti läpi ja etsiä sieltä vierasperäiset sanat.

a.i.materin uusin palvelu, tekoälypohjainen tekstisisällön prosessointityökalu Erin on kehitetty tehostamaan äänikirjojen tuotantoprosessia etsimällä automaattisesti vieraskieliset sanat. Kustantajan ei tarvitse enää käydä teoksia sivu sivulta läpi, sillä Erin analysoi teoksen minuuteissa. Pitkissä teksteissä prosessi nopeutuu näin huomattavasti, kun tuntien manuaalinen työ tapahtuukin hetkessä. Tekstit saadaan nopeammin lukijalle nauhoitettaviksi, eli Erin jouduttaa koko äänikirjan tuotantoprosessia.

Miten tekstisisällön prosessointityökalu Erinia käytetään?

Tekstisisällön prosessointityökalua käytetään nykyisellään seuraavanlaisesti:

  • Palveluun ladataan pdf-teksti, josta Erin automaattisesti poimii vierasperäiset sanat.
  • Käyttäjä saa listan, josta kyseiset sanat löytyvät sivunumeroiden ja esiintymislukumäärien kanssa sekä sanojen lauseyhteydet.
  • Lopuksi käyttäjä pystyy itse hiomaan Erinin luoman taulukon haluamaansa muotoon, esimerkiksi poistamalla omaan käyttöön turhat sanat sekä lisäämällä lausumisohjeita. Näin ihmisen tuottama laatu jää keskiöön.

Erinin tarkkuus on saatu hyväksi ja se löytää vierasperäiset sanat erinomaisesti. Eriniä on myös helppo käyttää. Tuotekehitys on kuitenkin jatkuvaa ja nyt tavoitteena on luoda palveluun mahdollisimman houkutteleva käyttöliittymä.

Sai alkunsa sisäiseen käyttöön luodusta työkalusta

Erin on saanut alkunsa a.i.materin sisäiseen käyttöön kehitetystä työkalusta, josta sivumennen mainittiin kustantamoiden kanssa käydyissä keskusteluissa. Kustantamot innostuivat ajatuksesta ja työkalua lähdettiin tuotteistamaan. Kaupallisen potentiaalin huomaaminen oli siis pieni onnenkantamoinen.

Varhaiset Erinin versiot perustuivat avoimesti saatavilla oleviin kieliteknologiatyökaluihin. Hyvin nopeasti kävi silti selväksi, etteivät ne palvelleet suoraan tätä käyttötarkoitusta ja parempaan lopputulokseen päästäisiin räätälöidyllä koneoppimismallilla. Myös Erinin fokus on hieman muuttunut, sillä alkujaan tavoitteena oli tunnistaa tekstistä kaikki erisnimet – Erinin nimikin viittaa tähän alkuperäiseen käyttötarkoitukseen. Nykyään keskitytään nimenomaan vierasperäisiin nimiin sekä muihin vierasperäisiin lausekkeisiin: esimerkiksi Pekka ja Maija -nimille ei tarvita lausumisohjeita, joten niitä on turha sisällyttää tuloksiin.

Erinin kehittyminen koneoppimisen avulla

Koneoppimismallin rakentamista varten oli aluksi haalittava soveltuvaa koulutusdataa. Tässä tapauksessa koulutukseen vaadittiin tekstiaineistoa, joka edustaa hyvin äänikirjoiksi muutettavaa kirjallisuutta. Aineiston kanssa apua saatiin suoraan kustantamoilta, sillä myös heidän intresseissään on mallin hyvä sopivuus omille teoksilleen. Pelkkä raakateksti ei toki riitä, vaan aluksi tekstistä on käsityönä poimittava ja annotoitava vierasperäiset termit. Koneoppimismalli oppii tämän jälkeen käyttäytymään samoin eli se tunnistaa tekstistä samankaltaisia termejä kuin ihminen on koulutusdatasta poiminut.

Nykyinen Erinin versio on tarkkuudeltaan jo ihmisen tasoa: se havaitsee noin 90 prosenttia tekstissä esiintyvistä vierasperäisistä lausekkeista. Etuna silti se, että Erin suoriutuu tehtävästä monin verroin nopeammin kuin ihminen.

Suurin haaste teknologisesta näkökulmasta lienee eri käyttäjien erilaiset näkemykset siitä, millaiset vierasperäiset sanat vaativat ääntämisohjeistusta. Lähitulevaisuuden suunnitelmissa on parantaa Erinin käyttöliittymää siten, että Erinin tarjoamaan listaukseen voi tehdä manuaalisia korjauksia palvelun sisällä. Tällöin järjestelmä saa palautetta siitä, millaisia lausekkeita kyseinen käyttäjä haluaa lopullisessa listauksessaan nähdä ja mukautuu sen perusteella. Myös varsinaiset lausumisohjeet voi jatkossa tehdä Erinin sisällä ja Erin pyrkii ehdottamaan ohjeistuksia automaattisesti.

Kieliteknologian työkalun avulla nopeampi äänikirjan tuottaminen

Tähän mennessä Erinistä on saatu positiivista palautetta ja hyviä käyttökokemuksia äänikirjojen tuotantoprosessissa. Palvelun asiakkaina ovat muun muassa WSOY, Otava ja Gummerus Kustannus. Asiakkaat ovat tärkeässä roolissa antamaan palautetta tuotekehitykseen ja testaamaan muutoksia käytännössä.

Uusia versioita on testattu mielellään, sillä ajansäästö houkuttelee. Ajansäästön ansiosta äänikirjat saadaan julkaistua mahdollisimman lähellä painetun kirjan julkaisuajankohtaa.

Erinin avulla voidaan siis poistaa pitkä ja uuvuttava työvaihe, jossa teokset pitää käydä manuaalisesti läpi ja etsiä kaikki vierasperäiset sanat lausumisohjeiden tekoa varten. Tuntien työ tapahtuu minuuteissa. Kun kustantamot saavat vähennettyä automatisoitavissa olevaa manuaalista työtä, prosessi muuttuu kustannustehokkaammaksi, äänikirjan tuottaminen nopeutuu.

Kysy Eriniä maksuttomaan testikäyttöön täältä!

Kysymyksiä, ajatuksia tai mahdollinen yhteistyö?

Kännykän näyttö, jossa näkyy Rakennuslehden artikkeli, joka kertoo, että Rakennuslehden artikkelit ovat nyt kuunneltavia. Kännykkää pitelee käsi ja taustalla näkyy sepeliä.
5.2.2025
Rakennuslehden kuunneltavat artikkelit ovat saaneet lukijoilta positiivisen vastaanoton ja kuuntelumäärät ovat yllättäneet toimituksessa. Referenssitarinassa kerrotaan, miten Rakennuslehti koki verkkosivulukijan käyttöönoton.
Pöydälle on levitetty Sushi go lautapeli. Kuvan reunoilla näkyy työntekijöiden käsiä, jotka pelaavat peliä.
18.12.2024
Artikkelissa summataan vuoden 2024 projektit; pääsimme tekemään teetettyjä ääniklooneja, äänirajapintoja, verkkosivulukijoita ja ohjelmistokehitystä. Sisäisiä kehitysprojekteja löytyy myös aina; tänä vuonna ääniverstasta ja asiakasportaalia.
18.10.2024
Suomen ensimmäistä tekoälyyn keskittyvää palkintogaalaa juhlitaan 23.10.2024 julkistamalla kunkin kategorian voittajat. a.i.mater on kolmen kärjessä asiakaskokemus-kategoriassa.
Mies istuu toimistolla työpöytänsä ääressä. Valokuva on otettu takaapäin, joten kuvassa näkyy henkilön selkä ja tietokoneen näytöt, takana näkyy sumealla muuta toimistoa.
16.8.2024
Case-esimerkki Ylelle toteutetusta kieliteknologian projektista, jossa hyödynnettiin CLIP-tekoälymallia kuvahaun sujuvoittamiseen materiaaliarkistoista.
Läppäri, jonka näppäimistön päällä on kuulokkeet. Läppärin näytössä on eepressin etusivu.
2.4.2024
Konenäköä ja puhesynteesiä yhdistäneessä projektissa kehitimme ePress-näköislehtipalvelulle pipelinen, joka pystyy tunnistamaan näköislehtien artikkelit ja toimittamaan niistä ääniversiot.
Kuulokkeet tietokonepöydän päällä.
14.3.2024
Yle on ottanut käyttöön a.i.materin kehittämän kuuntelumahdollisuuden uutissivuilleen. Kuunteluominaisuus parantaa palvelun digitaalista saavutettavuutta.