Äänikirjan nauhoitukset menossa. Äänikirjan lausumisohjeiden tekemisen tehostamiseen voidaan käyttää vierasperäiset sanat löytävää Eriniä.

Tehosta äänikirjan tuottamista Erinin avulla

Äänikirjat ovat suositumpia kuin koskaan, sillä ne ovat helposti saatavilla. Oman puhelimen mukana kulkevat äänikirjat mahdollistavat kirjoista nauttimisen juuri itselle parhaimpana hetkenä, työmatkalla, kaupassa, rentoutuessa, käytännössä missä tahansa.

Hyvään kuuntelukokemukseen kuuluu muun muassa puhdas lausuminen. Virheellisesti lausutut vierasperäiset sanat särähtävät ikävästi esiin ja saattavat viedä huomiota itse tarinasta. Äänikirjan nauhoituksissa lukija saa valmiit lausumisohjeet yleensä kustantajalta. Tällöin äänikirjan lukijan ei tarvitse ihmetellä, miten esimerkiksi ranskalaisen Chenonceaun linnan nimi pitäisi lausua.

Lausumisohjeet tehdäkseen kustantajan on kuitenkin täytynyt ensin käydä koko teos manuaalisesti läpi ja etsiä sieltä vierasperäiset sanat.

a.i.materin uusin palvelu, tekoälypohjainen tekstisisällön prosessointityökalu Erin on kehitetty tehostamaan äänikirjojen tuotantoprosessia etsimällä automaattisesti vieraskieliset sanat. Kustantajan ei tarvitse enää käydä teoksia sivu sivulta läpi, sillä Erin analysoi teoksen minuuteissa. Pitkissä teksteissä prosessi nopeutuu näin huomattavasti, kun tuntien manuaalinen työ tapahtuukin hetkessä. Tekstit saadaan nopeammin lukijalle nauhoitettaviksi, eli Erin jouduttaa koko äänikirjan tuotantoprosessia.

Miten tekstisisällön prosessointityökalu Erinia käytetään?

Tekstisisällön prosessointityökalua käytetään nykyisellään seuraavanlaisesti:

  • Palveluun ladataan pdf-teksti, josta Erin automaattisesti poimii vierasperäiset sanat.
  • Käyttäjä saa listan, josta kyseiset sanat löytyvät sivunumeroiden ja esiintymislukumäärien kanssa sekä sanojen lauseyhteydet.
  • Lopuksi käyttäjä pystyy itse hiomaan Erinin luoman taulukon haluamaansa muotoon, esimerkiksi poistamalla omaan käyttöön turhat sanat sekä lisäämällä lausumisohjeita. Näin ihmisen tuottama laatu jää keskiöön.

Erinin tarkkuus on saatu hyväksi ja se löytää vierasperäiset sanat erinomaisesti. Eriniä on myös helppo käyttää. Tuotekehitys on kuitenkin jatkuvaa ja nyt tavoitteena on luoda palveluun mahdollisimman houkutteleva käyttöliittymä.

Sai alkunsa sisäiseen käyttöön luodusta työkalusta

Erin on saanut alkunsa a.i.materin sisäiseen käyttöön kehitetystä työkalusta, josta sivumennen mainittiin kustantamoiden kanssa käydyissä keskusteluissa. Kustantamot innostuivat ajatuksesta ja työkalua lähdettiin tuotteistamaan. Kaupallisen potentiaalin huomaaminen oli siis pieni onnenkantamoinen.

Varhaiset Erinin versiot perustuivat avoimesti saatavilla oleviin kieliteknologiatyökaluihin. Hyvin nopeasti kävi silti selväksi, etteivät ne palvelleet suoraan tätä käyttötarkoitusta ja parempaan lopputulokseen päästäisiin räätälöidyllä koneoppimismallilla. Myös Erinin fokus on hieman muuttunut, sillä alkujaan tavoitteena oli tunnistaa tekstistä kaikki erisnimet – Erinin nimikin viittaa tähän alkuperäiseen käyttötarkoitukseen. Nykyään keskitytään nimenomaan vierasperäisiin nimiin sekä muihin vierasperäisiin lausekkeisiin: esimerkiksi Pekka ja Maija -nimille ei tarvita lausumisohjeita, joten niitä on turha sisällyttää tuloksiin.

Erinin kehittyminen koneoppimisen avulla

Koneoppimismallin rakentamista varten oli aluksi haalittava soveltuvaa koulutusdataa. Tässä tapauksessa koulutukseen vaadittiin tekstiaineistoa, joka edustaa hyvin äänikirjoiksi muutettavaa kirjallisuutta. Aineiston kanssa apua saatiin suoraan kustantamoilta, sillä myös heidän intresseissään on mallin hyvä sopivuus omille teoksilleen. Pelkkä raakateksti ei toki riitä, vaan aluksi tekstistä on käsityönä poimittava ja annotoitava vierasperäiset termit. Koneoppimismalli oppii tämän jälkeen käyttäytymään samoin eli se tunnistaa tekstistä samankaltaisia termejä kuin ihminen on koulutusdatasta poiminut.

Nykyinen Erinin versio on tarkkuudeltaan jo ihmisen tasoa: se havaitsee noin 90 prosenttia tekstissä esiintyvistä vierasperäisistä lausekkeista. Etuna silti se, että Erin suoriutuu tehtävästä monin verroin nopeammin kuin ihminen.

Suurin haaste teknologisesta näkökulmasta lienee eri käyttäjien erilaiset näkemykset siitä, millaiset vierasperäiset sanat vaativat ääntämisohjeistusta. Lähitulevaisuuden suunnitelmissa on parantaa Erinin käyttöliittymää siten, että Erinin tarjoamaan listaukseen voi tehdä manuaalisia korjauksia palvelun sisällä. Tällöin järjestelmä saa palautetta siitä, millaisia lausekkeita kyseinen käyttäjä haluaa lopullisessa listauksessaan nähdä ja mukautuu sen perusteella. Myös varsinaiset lausumisohjeet voi jatkossa tehdä Erinin sisällä ja Erin pyrkii ehdottamaan ohjeistuksia automaattisesti.

Kieliteknologian työkalusta hyvät kokemukset äänikirjojen tekemiseen

Tähän mennessä Erinistä on saatu positiivista palautetta ja hyviä käyttökokemuksia äänikirjojen tuotantoprosessissa. Palvelun asiakkaina ovat muun muassa WSOY, Otava ja Gummerus Kustannus. Asiakkaat ovat tärkeässä roolissa antamaan palautetta tuotekehitykseen ja testaamaan muutoksia käytännössä.

Uusia versioita on testattu mielellään, sillä ajansäästö houkuttelee. Ajansäästön ansiosta äänikirjat saadaan julkaistua mahdollisimman lähellä painetun kirjan julkaisuajankohtaa.

Erinin avulla voidaan siis poistaa pitkä ja uuvuttava työvaihe, jossa teokset pitää käydä manuaalisesti läpi ja etsiä kaikki vierasperäiset sanat lausumisohjeiden tekoa varten. Tuntien työ tapahtuu minuuteissa. Kun kustantamot saavat vähennettyä automatisoitavissa olevaa manuaalista työtä, prosessi muuttuu kustannustehokkaammaksi.

Kysy Eriniä testikäyttöön täältä

Kiinnostuitko? Ota Yhteyttä!

Jaa artikkeli

Share on linkedin
LinkedIn
Share on twitter
Twitter
Share on facebook
Facebook
Litterointi on työläs prosessi - Automaattinen puheentunnistus apuna

Litterointi on työläs prosessi - Automaattinen puheentunnistus apuna

Litterointi tarkoittaa ääni- ja videosisältöjen purkamista tekstimuotoon. Litteroinnin avuksi kannattaa ottaa automaattinen puheentunnistus,…
Verkkosivulukija - kuunneltavat verkkosivut

Verkkosivulukija - kuunneltavat verkkosivut

Verkkosivulukijan avulla käyttäjä voi kuunnella verkkosivun tekstit ääneen luettuna, ilman että vierailijan tarvitsee…
Mikä on digioppikirja ja mitä etuja se tuo?

Mikä on digioppikirja ja mitä etuja se tuo?

Digikirjat ovat paljon enemmän kuin pelkkä painetun kirjan pdf-versio. Digioppikirjat ovat interaktiivisia ja…
Äänikirjojen suosion kasvu - Käyttäjämäärät kolminkertaistuneet

Äänikirjojen suosion kasvu - Käyttäjämäärät kolminkertaistuneet

Äänikirjojen suosio alkoi vuonna 2019, jonka jälkeen suosio on kasvanut entisestään. Taulukoimme suosion…
Äänikirjan lukemisen vaiheet - Studiossa tapahtuva luenta on vain yksi osa

Äänikirjan lukemisen vaiheet - Studiossa tapahtuva luenta on vain yksi osa

Studiossa tapahtuva luenta on vain yksi, vaikkakin kuuluvin osa äänikirjaprosessia. Avataan enemmän, mitä…
Hyödynnä puheteknologiaa maatalous- ja puutarha-alalla

Hyödynnä puheteknologiaa maatalous- ja puutarha-alalla

Teknologia, kuten puheteknologia, ja digitaaliset apuvälineet vähentävät maatalous- ja puutarha-alan työntekijöiden kuormittavuutta. Puheohjattavaa…
Koneääni: Ennakkoluulot vs. Todellisuus

Koneääni: Ennakkoluulot vs. Todellisuus

Minkälaisia mielikuvia sanasta koneääni syntyy? Koneäänet saadaan nykyään kuulostamaan hyvinkin luonnollisilta ja miellyttäviltä…
Mitä puheteknologia on?

Mitä puheteknologia on?

Mitä puheteknologia tarkoittaa ja mitä mahdollisuuksia se tarjoaa? Entä mitä puhesynteesi on ja…
Oppiminen kuulon avulla – äänisisällöt lukemisen ja oppimisen tukena

Oppiminen kuulon avulla – äänisisällöt lukemisen ja oppimisen tukena

Lukivaikeudet ilmenevät muun muassa hitaana lukemisena tai luetun ymmärtämisen hankaluutena. Tällöin itselle helpoin…