Äänikirjat ovat suositumpia kuin koskaan, sillä ne ovat helposti saatavilla. Oman puhelimen mukana kulkevat äänikirjat mahdollistavat kirjoista nauttimisen juuri itselle parhaimpana hetkenä, työmatkalla, kaupassa, rentoutuessa, käytännössä missä tahansa.
Hyvään kuuntelukokemukseen kuuluu muun muassa puhdas lausuminen. Virheellisesti lausutut vierasperäiset sanat särähtävät ikävästi esiin ja saattavat viedä huomiota itse tarinasta. Äänikirjan nauhoituksissa lukija saa valmiit lausumisohjeet yleensä kustantajalta. Tällöin äänikirjan lukijan ei tarvitse ihmetellä, miten esimerkiksi ranskalaisen Chenonceaun linnan nimi pitäisi lausua.
Lausumisohjeet tehdäkseen kustantajan on kuitenkin täytynyt ensin käydä koko teos manuaalisesti läpi ja etsiä sieltä vierasperäiset sanat.
a.i.materin uusin palvelu, tekoälypohjainen tekstisisällön prosessointityökalu Erin on kehitetty tehostamaan äänikirjojen tuotantoprosessia etsimällä automaattisesti vieraskieliset sanat. Kustantajan ei tarvitse enää käydä teoksia sivu sivulta läpi, sillä Erin analysoi teoksen minuuteissa. Pitkissä teksteissä prosessi nopeutuu näin huomattavasti, kun tuntien manuaalinen työ tapahtuukin hetkessä. Tekstit saadaan nopeammin lukijalle nauhoitettaviksi, eli Erin jouduttaa koko äänikirjan tuotantoprosessia.
Miten tekstisisällön prosessointityökalu Erinia käytetään?
Tekstisisällön prosessointityökalua käytetään nykyisellään seuraavanlaisesti:
- Palveluun ladataan pdf-teksti, josta Erin automaattisesti poimii vierasperäiset sanat.
- Käyttäjä saa listan, josta kyseiset sanat löytyvät sivunumeroiden ja esiintymislukumäärien kanssa sekä sanojen lauseyhteydet.
- Lopuksi käyttäjä pystyy itse hiomaan Erinin luoman taulukon haluamaansa muotoon, esimerkiksi poistamalla omaan käyttöön turhat sanat sekä lisäämällä lausumisohjeita. Näin ihmisen tuottama laatu jää keskiöön.
Erinin tarkkuus on saatu hyväksi ja se löytää vierasperäiset sanat erinomaisesti. Eriniä on myös helppo käyttää. Tuotekehitys on kuitenkin jatkuvaa ja nyt tavoitteena on luoda palveluun mahdollisimman houkutteleva käyttöliittymä.
Sai alkunsa sisäiseen käyttöön luodusta työkalusta
Erin on saanut alkunsa a.i.materin sisäiseen käyttöön kehitetystä työkalusta, josta sivumennen mainittiin kustantamoiden kanssa käydyissä keskusteluissa. Kustantamot innostuivat ajatuksesta ja työkalua lähdettiin tuotteistamaan. Kaupallisen potentiaalin huomaaminen oli siis pieni onnenkantamoinen.
Varhaiset Erinin versiot perustuivat avoimesti saatavilla oleviin kieliteknologiatyökaluihin. Hyvin nopeasti kävi silti selväksi, etteivät ne palvelleet suoraan tätä käyttötarkoitusta ja parempaan lopputulokseen päästäisiin räätälöidyllä koneoppimismallilla. Myös Erinin fokus on hieman muuttunut, sillä alkujaan tavoitteena oli tunnistaa tekstistä kaikki erisnimet – Erinin nimikin viittaa tähän alkuperäiseen käyttötarkoitukseen. Nykyään keskitytään nimenomaan vierasperäisiin nimiin sekä muihin vierasperäisiin lausekkeisiin: esimerkiksi Pekka ja Maija -nimille ei tarvita lausumisohjeita, joten niitä on turha sisällyttää tuloksiin.
Erinin kehittyminen koneoppimisen avulla
Koneoppimismallin rakentamista varten oli aluksi haalittava soveltuvaa koulutusdataa. Tässä tapauksessa koulutukseen vaadittiin tekstiaineistoa, joka edustaa hyvin äänikirjoiksi muutettavaa kirjallisuutta. Aineiston kanssa apua saatiin suoraan kustantamoilta, sillä myös heidän intresseissään on mallin hyvä sopivuus omille teoksilleen. Pelkkä raakateksti ei toki riitä, vaan aluksi tekstistä on käsityönä poimittava ja annotoitava vierasperäiset termit. Koneoppimismalli oppii tämän jälkeen käyttäytymään samoin eli se tunnistaa tekstistä samankaltaisia termejä kuin ihminen on koulutusdatasta poiminut.
Nykyinen Erinin versio on tarkkuudeltaan jo ihmisen tasoa: se havaitsee noin 90 prosenttia tekstissä esiintyvistä vierasperäisistä lausekkeista. Etuna silti se, että Erin suoriutuu tehtävästä monin verroin nopeammin kuin ihminen.
Suurin haaste teknologisesta näkökulmasta lienee eri käyttäjien erilaiset näkemykset siitä, millaiset vierasperäiset sanat vaativat ääntämisohjeistusta. Lähitulevaisuuden suunnitelmissa on parantaa Erinin käyttöliittymää siten, että Erinin tarjoamaan listaukseen voi tehdä manuaalisia korjauksia palvelun sisällä. Tällöin järjestelmä saa palautetta siitä, millaisia lausekkeita kyseinen käyttäjä haluaa lopullisessa listauksessaan nähdä ja mukautuu sen perusteella. Myös varsinaiset lausumisohjeet voi jatkossa tehdä Erinin sisällä ja Erin pyrkii ehdottamaan ohjeistuksia automaattisesti.
Kieliteknologian työkalun avulla nopeampi äänikirjan tuottaminen
Tähän mennessä Erinistä on saatu positiivista palautetta ja hyviä käyttökokemuksia äänikirjojen tuotantoprosessissa. Palvelun asiakkaina ovat muun muassa WSOY, Otava ja Gummerus Kustannus. Asiakkaat ovat tärkeässä roolissa antamaan palautetta tuotekehitykseen ja testaamaan muutoksia käytännössä.
Uusia versioita on testattu mielellään, sillä ajansäästö houkuttelee. Ajansäästön ansiosta äänikirjat saadaan julkaistua mahdollisimman lähellä painetun kirjan julkaisuajankohtaa.
Erinin avulla voidaan siis poistaa pitkä ja uuvuttava työvaihe, jossa teokset pitää käydä manuaalisesti läpi ja etsiä kaikki vierasperäiset sanat lausumisohjeiden tekoa varten. Tuntien työ tapahtuu minuuteissa. Kun kustantamot saavat vähennettyä automatisoitavissa olevaa manuaalista työtä, prosessi muuttuu kustannustehokkaammaksi, äänikirjan tuottaminen nopeutuu.
Kysy Eriniä maksuttomaan testikäyttöön täältä!