Etualalla studiomikrofoni ja taustalla tietokoneen näyttö, jossa näkyy Aimaterin äänikirjaikoni.

Tehosta äänikirjan tuottamista Erinin avulla

Äänikirjat ovat suositumpia kuin koskaan, sillä ne ovat helposti saatavilla. Oman puhelimen mukana kulkevat äänikirjat mahdollistavat kirjoista nauttimisen juuri itselle parhaimpana hetkenä, työmatkalla, kaupassa, rentoutuessa, käytännössä missä tahansa.

Hyvään kuuntelukokemukseen kuuluu muun muassa puhdas lausuminen. Virheellisesti lausutut vierasperäiset sanat särähtävät ikävästi esiin ja saattavat viedä huomiota itse tarinasta. Äänikirjan nauhoituksissa lukija saa valmiit lausumisohjeet yleensä kustantajalta. Tällöin äänikirjan lukijan ei tarvitse ihmetellä, miten esimerkiksi ranskalaisen Chenonceaun linnan nimi pitäisi lausua.

Lausumisohjeet tehdäkseen kustantajan on kuitenkin täytynyt ensin käydä koko teos manuaalisesti läpi ja etsiä sieltä vierasperäiset sanat.

a.i.materin uusin palvelu, tekoälypohjainen tekstisisällön prosessointityökalu Erin on kehitetty tehostamaan äänikirjojen tuotantoprosessia etsimällä automaattisesti vieraskieliset sanat. Kustantajan ei tarvitse enää käydä teoksia sivu sivulta läpi, sillä Erin analysoi teoksen minuuteissa. Pitkissä teksteissä prosessi nopeutuu näin huomattavasti, kun tuntien manuaalinen työ tapahtuukin hetkessä. Tekstit saadaan nopeammin lukijalle nauhoitettaviksi, eli Erin jouduttaa koko äänikirjan tuotantoprosessia.

Miten tekstisisällön prosessointityökalu Erinia käytetään?

Tekstisisällön prosessointityökalua käytetään nykyisellään seuraavanlaisesti:

  • Palveluun ladataan pdf-teksti, josta Erin automaattisesti poimii vierasperäiset sanat.
  • Käyttäjä saa listan, josta kyseiset sanat löytyvät sivunumeroiden ja esiintymislukumäärien kanssa sekä sanojen lauseyhteydet.
  • Lopuksi käyttäjä pystyy itse hiomaan Erinin luoman taulukon haluamaansa muotoon, esimerkiksi poistamalla omaan käyttöön turhat sanat sekä lisäämällä lausumisohjeita. Näin ihmisen tuottama laatu jää keskiöön.

Erinin tarkkuus on saatu hyväksi ja se löytää vierasperäiset sanat erinomaisesti. Eriniä on myös helppo käyttää. Tuotekehitys on kuitenkin jatkuvaa ja nyt tavoitteena on luoda palveluun mahdollisimman houkutteleva käyttöliittymä.

Sai alkunsa sisäiseen käyttöön luodusta työkalusta

Erin on saanut alkunsa a.i.materin sisäiseen käyttöön kehitetystä työkalusta, josta sivumennen mainittiin kustantamoiden kanssa käydyissä keskusteluissa. Kustantamot innostuivat ajatuksesta ja työkalua lähdettiin tuotteistamaan. Kaupallisen potentiaalin huomaaminen oli siis pieni onnenkantamoinen.

Varhaiset Erinin versiot perustuivat avoimesti saatavilla oleviin kieliteknologiatyökaluihin. Hyvin nopeasti kävi silti selväksi, etteivät ne palvelleet suoraan tätä käyttötarkoitusta ja parempaan lopputulokseen päästäisiin räätälöidyllä koneoppimismallilla. Myös Erinin fokus on hieman muuttunut, sillä alkujaan tavoitteena oli tunnistaa tekstistä kaikki erisnimet – Erinin nimikin viittaa tähän alkuperäiseen käyttötarkoitukseen. Nykyään keskitytään nimenomaan vierasperäisiin nimiin sekä muihin vierasperäisiin lausekkeisiin: esimerkiksi Pekka ja Maija -nimille ei tarvita lausumisohjeita, joten niitä on turha sisällyttää tuloksiin.

Erinin kehittyminen koneoppimisen avulla

Koneoppimismallin rakentamista varten oli aluksi haalittava soveltuvaa koulutusdataa. Tässä tapauksessa koulutukseen vaadittiin tekstiaineistoa, joka edustaa hyvin äänikirjoiksi muutettavaa kirjallisuutta. Aineiston kanssa apua saatiin suoraan kustantamoilta, sillä myös heidän intresseissään on mallin hyvä sopivuus omille teoksilleen. Pelkkä raakateksti ei toki riitä, vaan aluksi tekstistä on käsityönä poimittava ja annotoitava vierasperäiset termit. Koneoppimismalli oppii tämän jälkeen käyttäytymään samoin eli se tunnistaa tekstistä samankaltaisia termejä kuin ihminen on koulutusdatasta poiminut.

Nykyinen Erinin versio on tarkkuudeltaan jo ihmisen tasoa: se havaitsee noin 90 prosenttia tekstissä esiintyvistä vierasperäisistä lausekkeista. Etuna silti se, että Erin suoriutuu tehtävästä monin verroin nopeammin kuin ihminen.

Suurin haaste teknologisesta näkökulmasta lienee eri käyttäjien erilaiset näkemykset siitä, millaiset vierasperäiset sanat vaativat ääntämisohjeistusta. Lähitulevaisuuden suunnitelmissa on parantaa Erinin käyttöliittymää siten, että Erinin tarjoamaan listaukseen voi tehdä manuaalisia korjauksia palvelun sisällä. Tällöin järjestelmä saa palautetta siitä, millaisia lausekkeita kyseinen käyttäjä haluaa lopullisessa listauksessaan nähdä ja mukautuu sen perusteella. Myös varsinaiset lausumisohjeet voi jatkossa tehdä Erinin sisällä ja Erin pyrkii ehdottamaan ohjeistuksia automaattisesti.

Kieliteknologian työkalun avulla nopeampi äänikirjan tuottaminen

Tähän mennessä Erinistä on saatu positiivista palautetta ja hyviä käyttökokemuksia äänikirjojen tuotantoprosessissa. Palvelun asiakkaina ovat muun muassa WSOY, Otava ja Gummerus Kustannus. Asiakkaat ovat tärkeässä roolissa antamaan palautetta tuotekehitykseen ja testaamaan muutoksia käytännössä.

Uusia versioita on testattu mielellään, sillä ajansäästö houkuttelee. Ajansäästön ansiosta äänikirjat saadaan julkaistua mahdollisimman lähellä painetun kirjan julkaisuajankohtaa.

Erinin avulla voidaan siis poistaa pitkä ja uuvuttava työvaihe, jossa teokset pitää käydä manuaalisesti läpi ja etsiä kaikki vierasperäiset sanat lausumisohjeiden tekoa varten. Tuntien työ tapahtuu minuuteissa. Kun kustantamot saavat vähennettyä automatisoitavissa olevaa manuaalista työtä, prosessi muuttuu kustannustehokkaammaksi, äänikirjan tuottaminen nopeutuu.

Kysy Eriniä maksuttomaan testikäyttöön täältä!

Kysymyksiä, ajatuksia tai mahdollinen yhteistyö?

Läppäri, jonka näppäimistön päällä on kuulokkeet. Läppärin näytössä on eepressin etusivu.
2.4.2024
Konenäköä ja puhesynteesiä yhdistäneessä projektissa kehitimme ePress-näköislehtipalvelulle pipelinen, joka pystyy tunnistamaan näköislehtien artikkelit ja toimittamaan niistä ääniversiot.
Kuulokkeet tietokonepöydän päällä.
14.3.2024
Yle on ottanut käyttöön a.i.materin kehittämän kuuntelumahdollisuuden uutissivuilleen. Kuunteluominaisuus parantaa palvelun digitaalista saavutettavuutta.
Selko Digitalin logo, jossa silmä ja teksti Selko Digital.
19.6.2023
Saavutettavuuteen erikoistunut yhteistyökumppanimme Selko Digital avaa vieraskynäblogissa koneäänien ja puheentunnistuksen vaikutusta digimaailman yhdenvertaisuuteen.
Kaksi Fölin keltaista bussia Turun Kauppatorin laidalla. Takana on Kop-kolmio ja ruotsalainen teatteri.
29.11.2022
Turun seudun joukkoliikenne Föli otti käyttöön a.i.materin valmistaman koneäänen pysäkki- ja muiden kuulutusten tekemiseen busseissa.
Kannattevan tietokoneen näyttö, jossa on Työmarkkinatorin verkkosivut auki. Taustalle harmaa seinä ja pöydällä kyniä ja kahvikuppi.
22.11.2022
Työmarkkinatori paransi sivustonsa saavutettavuutta ottamalla käyttöön verkkosivulukijan. Sivusto on ensimmäinen, jolle suomenruotsalainen koneääni-Amanda tuli käyttöön.
Käsi, jossa älypuhelin. Puhelimen ruudussa näkyy Editan äänikirja Ihon alle kansi, jonka aimater teki ääniversioksi.
8.2.2022
Pääsimme toteuttamaan Editan ensimmäisen ammatillisten opintojen oppimateriaaleista tehdyn äänikirjan koneääni Ilonan lukemana.