Etualalla studiomikrofoni ja taustalla tietokoneen näyttö, jossa näkyy Aimaterin äänikirjaikoni.

Tehosta äänikirjan tuottamista Erinin avulla

Äänikirjat ovat suositumpia kuin koskaan, sillä ne ovat helposti saatavilla. Oman puhelimen mukana kulkevat äänikirjat mahdollistavat kirjoista nauttimisen juuri itselle parhaimpana hetkenä, työmatkalla, kaupassa, rentoutuessa, käytännössä missä tahansa.

Hyvään kuuntelukokemukseen kuuluu muun muassa puhdas lausuminen. Virheellisesti lausutut vierasperäiset sanat särähtävät ikävästi esiin ja saattavat viedä huomiota itse tarinasta. Äänikirjan nauhoituksissa lukija saa valmiit lausumisohjeet yleensä kustantajalta. Tällöin äänikirjan lukijan ei tarvitse ihmetellä, miten esimerkiksi ranskalaisen Chenonceaun linnan nimi pitäisi lausua.

Lausumisohjeet tehdäkseen kustantajan on kuitenkin täytynyt ensin käydä koko teos manuaalisesti läpi ja etsiä sieltä vierasperäiset sanat.

a.i.materin uusin palvelu, tekoälypohjainen tekstisisällön prosessointityökalu Erin on kehitetty tehostamaan äänikirjojen tuotantoprosessia etsimällä automaattisesti vieraskieliset sanat. Kustantajan ei tarvitse enää käydä teoksia sivu sivulta läpi, sillä Erin analysoi teoksen minuuteissa. Pitkissä teksteissä prosessi nopeutuu näin huomattavasti, kun tuntien manuaalinen työ tapahtuukin hetkessä. Tekstit saadaan nopeammin lukijalle nauhoitettaviksi, eli Erin jouduttaa koko äänikirjan tuotantoprosessia.

Miten tekstisisällön prosessointityökalu Erinia käytetään?

Tekstisisällön prosessointityökalua käytetään nykyisellään seuraavanlaisesti:

  • Palveluun ladataan pdf-teksti, josta Erin automaattisesti poimii vierasperäiset sanat.
  • Käyttäjä saa listan, josta kyseiset sanat löytyvät sivunumeroiden ja esiintymislukumäärien kanssa sekä sanojen lauseyhteydet.
  • Lopuksi käyttäjä pystyy itse hiomaan Erinin luoman taulukon haluamaansa muotoon, esimerkiksi poistamalla omaan käyttöön turhat sanat sekä lisäämällä lausumisohjeita. Näin ihmisen tuottama laatu jää keskiöön.

Erinin tarkkuus on saatu hyväksi ja se löytää vierasperäiset sanat erinomaisesti. Eriniä on myös helppo käyttää. Tuotekehitys on kuitenkin jatkuvaa ja nyt tavoitteena on luoda palveluun mahdollisimman houkutteleva käyttöliittymä.

Sai alkunsa sisäiseen käyttöön luodusta työkalusta

Erin on saanut alkunsa a.i.materin sisäiseen käyttöön kehitetystä työkalusta, josta sivumennen mainittiin kustantamoiden kanssa käydyissä keskusteluissa. Kustantamot innostuivat ajatuksesta ja työkalua lähdettiin tuotteistamaan. Kaupallisen potentiaalin huomaaminen oli siis pieni onnenkantamoinen.

Varhaiset Erinin versiot perustuivat avoimesti saatavilla oleviin kieliteknologiatyökaluihin. Hyvin nopeasti kävi silti selväksi, etteivät ne palvelleet suoraan tätä käyttötarkoitusta ja parempaan lopputulokseen päästäisiin räätälöidyllä koneoppimismallilla. Myös Erinin fokus on hieman muuttunut, sillä alkujaan tavoitteena oli tunnistaa tekstistä kaikki erisnimet – Erinin nimikin viittaa tähän alkuperäiseen käyttötarkoitukseen. Nykyään keskitytään nimenomaan vierasperäisiin nimiin sekä muihin vierasperäisiin lausekkeisiin: esimerkiksi Pekka ja Maija -nimille ei tarvita lausumisohjeita, joten niitä on turha sisällyttää tuloksiin.

Erinin kehittyminen koneoppimisen avulla

Koneoppimismallin rakentamista varten oli aluksi haalittava soveltuvaa koulutusdataa. Tässä tapauksessa koulutukseen vaadittiin tekstiaineistoa, joka edustaa hyvin äänikirjoiksi muutettavaa kirjallisuutta. Aineiston kanssa apua saatiin suoraan kustantamoilta, sillä myös heidän intresseissään on mallin hyvä sopivuus omille teoksilleen. Pelkkä raakateksti ei toki riitä, vaan aluksi tekstistä on käsityönä poimittava ja annotoitava vierasperäiset termit. Koneoppimismalli oppii tämän jälkeen käyttäytymään samoin eli se tunnistaa tekstistä samankaltaisia termejä kuin ihminen on koulutusdatasta poiminut.

Nykyinen Erinin versio on tarkkuudeltaan jo ihmisen tasoa: se havaitsee noin 90 prosenttia tekstissä esiintyvistä vierasperäisistä lausekkeista. Etuna silti se, että Erin suoriutuu tehtävästä monin verroin nopeammin kuin ihminen.

Suurin haaste teknologisesta näkökulmasta lienee eri käyttäjien erilaiset näkemykset siitä, millaiset vierasperäiset sanat vaativat ääntämisohjeistusta. Lähitulevaisuuden suunnitelmissa on parantaa Erinin käyttöliittymää siten, että Erinin tarjoamaan listaukseen voi tehdä manuaalisia korjauksia palvelun sisällä. Tällöin järjestelmä saa palautetta siitä, millaisia lausekkeita kyseinen käyttäjä haluaa lopullisessa listauksessaan nähdä ja mukautuu sen perusteella. Myös varsinaiset lausumisohjeet voi jatkossa tehdä Erinin sisällä ja Erin pyrkii ehdottamaan ohjeistuksia automaattisesti.

Kieliteknologian työkalun avulla nopeampi äänikirjan tuottaminen

Tähän mennessä Erinistä on saatu positiivista palautetta ja hyviä käyttökokemuksia äänikirjojen tuotantoprosessissa. Palvelun asiakkaina ovat muun muassa WSOY, Otava ja Gummerus Kustannus. Asiakkaat ovat tärkeässä roolissa antamaan palautetta tuotekehitykseen ja testaamaan muutoksia käytännössä.

Uusia versioita on testattu mielellään, sillä ajansäästö houkuttelee. Ajansäästön ansiosta äänikirjat saadaan julkaistua mahdollisimman lähellä painetun kirjan julkaisuajankohtaa.

Erinin avulla voidaan siis poistaa pitkä ja uuvuttava työvaihe, jossa teokset pitää käydä manuaalisesti läpi ja etsiä kaikki vierasperäiset sanat lausumisohjeiden tekoa varten. Tuntien työ tapahtuu minuuteissa. Kun kustantamot saavat vähennettyä automatisoitavissa olevaa manuaalista työtä, prosessi muuttuu kustannustehokkaammaksi, äänikirjan tuottaminen nopeutuu.

Kysy Eriniä maksuttomaan testikäyttöön täältä!

Kiinnostuitko? Ota Yhteyttä!

Jaa artikkeli

LinkedIn
Twitter
Facebook
Mies istuu selkä kuvaajaa päin laiturilla korituolissa kuulokkeet päässä. Vieressä on pino kirjoja ja niiden päällä älypuhelin , josta lähtee piuha kuulokkeisiin.
Alkuvuodesta Apple Books ja kesäkuussa Storytel ilmoittivat ottavansa äänikirjapalveluihinsa koneäänet osaksi äänikirjalukijavaihtoehtojaan. Storytel laajentaa tätä vaihtoehtoa Voice Switcher -ominaisuudella, joka mahdollistaa kuulijan vaihtaa lukijaääntä.
Nainen makaa ylhäältäpäin otetussa valokuvassa sohvalla silmät kiinni, kuulokkeet päässä ja hymyilee.
Suomalaisten lukuharrastusta tutkittiin Kirjakauppaliiton ja Suomen Kustannusyhdistyksen teettämässä Suomi lukee 2023 -tutkimuksessa. Artikkelissa katsaus tutkimukseen ääni- ja sähkökirjojen osalta sekä Suomen Kustannusyhdistyksen todelliset myyntitilastot vuodelta 2022.
Pieni koira makaa selällään laiturilla. Koiran vieressä on kirjapino, jonka päällä on puhelin ja kuulokkeet.
Miten koneääni-Ilona taipuu klassikkotarinan lukemiseen? Teimme kahdeksan tuntia kuunneltavaa Phileas Foggin seikkailusta; ota kuunteluun!
Tekstinlouhinta on tekoälypohjainen menetelmä, jolla tekstimassoista löydetään niihin piiloutuvaa tietoa. Kuvassa mies istuu Excelin edessä ja takana vaaleat ruudukkoikkunat kesämaisemalla.
Tekoälypohjaisilla tekstinlouhinnan työkaluilla laajoista tekstimassoista löydetään tekstisisältöön piiloutuvia tärkeitä havaintoja. Parhaimmillaan nämä oivallukset voivat jopa lisätä niitä käyttävien yritysten kilpailuetua.
Studiolaatuinen mikrofoni. Takana ikkuna, jossa kesäiset maisemat. Pöydällä vaaleanpunainen kesäkukka.
Artikkelissa tutustutaan Microsoftin kehittämään VALL-E -tekoälymalliin, joka pystyy tuottamaan ihmisen äänestä koneääntä vain kolmen sekunnin pohjalta. Sekä Applen uutisiin julkaista äänikirjoja koneäänien lukemina.
Ylhäältäpäin kuvattu kirjapino, jonka päällä puhelin ja kuulokkeet.
Tuoreimmista Suomen Kustannusyhdistyksen neljännesvuositilastoista näkee, miten äänikirjat jatkavat edelleen suosiotaan. Artikkelissa enemmän Erin-ohjelmistosta ja koneäänistä, joiden avulla äänikirjan tekemistä voidaan sujuvoittaa.