Mies istuu selkä kuvaajaa päin laiturilla korituolissa kuulokkeet päässä. Vieressä on pino kirjoja ja niiden päällä älypuhelin , josta lähtee piuha kuulokkeisiin.

Suuret äänikirjapalvelut käyttävät nyt myös koneääniä

Ruotsalainen Storytel teki kesäkuussa saman ilmoituksen kuin Apple Books tammikuussa: äänikirjapalvelu alkaa käyttämään koneääntä ihmislukijan rinnalla äänikirjojen lukijana. Synteettiset äänet (joista näkyy nykyään puhuttavan myös tekoälyäänenä ja tekoälylukijana) ovat siis viimeistään tämän vuoden aikana nousseet varteenotettavaksi äänikirjalukija-vaihtoehdoksi.

Koneääniä on käytetty jo pidempään saavutettavan kirjallisuuden lukemiseen; muun muassa saavutettavuuskeskus Celian yhdistelmäkirjoissa. Koneoppimismenetelmien kehittymisen myötä synteettisestä puheesta on tullut vaihtoehto myös valtavirtakuluttajille – niin luonnolliseen kuuloiseen lopputulokseen puhesynteesillä nykyään päästään. Nyt kun koneäänistä on tulossa hyväksytty vaihtoehto isoissa lukuaikapalveluissa, äänikirjojen kuunteluun nousee uusia, mielenkiintoisia mahdollisuuksia.

Storytelissä mahdollisuus personoida kuuntelukokemusta

Yksi syy jättää äänikirja kesken on, että lukijan ääni ei miellytä kuulijaa. Ongelmaan pystytään tarttumaan synteettisten äänien avulla, kuten Storytelin uudesta ominaisuudesta voidaan todeta.

Storytel on ottanut tänä vuonna kokeiluun VoiceSwitcher -ominaisuuden, jonka avulla käyttäjät pystyvät sujuvasti vaihtamaan lukijaa kesken äänikirjan kuuntelun toiseen haluamaansa koneäänilukijaan. Käyttäjät saavat VoiceSwitcherin kautta enemmän valinnanvaraa oman kuuntelukokemuksen yksilöimiseen. Ominaisuus on toistaiseksi käytössä vain tietyissä englanninkielisissä teoksissa, mutta sitä laajennetaan loppuvuodesta ruotsin- ja tanskankielisiin äänikirjoihin. Storytelillä on suunnitelmia laajentaa ominaisuutta muihinkin kieliin. Storytelin käytössä olevat koneäänet tuottaa yhdysvaltalainen ElevenLabs -puheteknologiayritys.

Haluamansa lukijan valitsemisen lisäksi kuuntelukokemusta voitaisiin tulevaisuudessa yksilöidä mahdollistamalla kullekin kuulijalle mieluisan lukijaäänen generointi. Tällaista toiminnallisuutta ei vielä ole saatavilla, eikä meidän tietojemme mukaan suunnitteillakaan. Teknisesti se olisi kuitenkin lähitulevaisuudessa mahdollista.

Äänikirjojen määrä kasvaa

Koneäänien ei edelleenkään ole tarkoitus korvata ihmislukijoita, vaan täydentää tarjontaa. Esimerkiksi Apple Books kertoi koneäänilukijoidensa olevan hyvä vaihtoehto pienille kustantamoille ja omakustanteille, koska äänikirjan tekeminen maksaa niitä käytettäessä paljon vähemmän ääninäyttelijään verrattuna. Storytel on nostanut saman näkökannan esiin – yhä useampia ja myös vähemmän tunnettuja kirjoja voidaan tuottaa äänikirjoiksi, kun kustantamot tai äänikirjapalvelu säästävät äänityskustannuksissa.

Lisäksi äänikirjojen julkaisuaikataulua voidaan nopeuttaa koneäänien ansiosta: tekstin generoiminen koneäänellä tapahtuu huomattavasti nopeammin kuin studionauhoitukset. Tällöin uusista kirjoista saadaan julkaistua painettu kirja ja ääniversio mahdollisimman samanaikaisesti.

Kun ajassa ja rahassa säästetään, äänikirjavalikoimaa pystytään laajentamaan myös niille kielille, joihin ei välttämättä aiemmin ole ollut resursseja panostaa. Koneäänten nopeus ja edullisuus ihmislukijaan verrattuna tulevat todennäköisesti lisäämään äänikirjojen määrää.

Synteettinen puhe osoittaa siis suurta potentiaalia äänikirjojen lukijana. Tulevaisuudessa luultavasti vielä enemmän valikoiman laajuuden, personointimahdollisuuksien ja joustavuutensa ansiosta. Äänikirjojen tulevaisuus näyttää siis entistä monipuolisemmalta.

Myös kehittämämme Ilona-koneääni on lukenut usealle toimijalle äänikirjoja. Viimeisimpänä valmistui metsäasiantuntijayritys Tapion Metsänhoidon Suositukset. Tämä oli samalla Tapion ensimmäinen äänikirja, joten he tekivät aiheesta artikkelin ja haastattelivat meitä koneäänen käytöstä äänikirjoissa. Haastattelu ja äänikatkelma kirjasta löytyvät Tapion verkkosivuilta.

Kiinnostuitko? Ota Yhteyttä!

Jaa artikkeli

Lähikuva kädestä, joka on tietokoneen hiiren päällä. Taustalla näppäimistä, kaksi näyttöä, läppärin kulma ja kahvimuki.
29.11.2023
Turun yliopiston tutkimusryhmä TurkuNLP on avannut sivuston, jonka kautta sinäkin voit osallistua suomenkielisen keskustelevan tekoälyn kehitykseen. Artikkelissa avataan enemmän kielimallien kehityksen taustoja.
Nainen makoilee sängyllä kuulokkeet päässä, katselee vieressä olevaa kulhollista hedelmiä.
29.9.2023
Käydään läpi digiaudiotutkimusta, jossa syvennytään suomalaisten kuuntelutottumuksiin. Vastauksissa näkyy, miten digiaudion kuuntelusta on tullut valtavirtaa.
Nainen istuu kesällä puutarhassa taidemaalaustarvikkeiden kanssa. Päässä on kuulokkeet.
14.9.2023
Yhdysvalloissa parhaillaan käynnissä olevassa näyttelijöiden ja käsikirjoittajien lakossa on kysymys myös tekoälyn käytöstä. Huolenaiheet koskevat muun muassa työpaikkoja ja taiteellista luovuutta.
Selko Digitalin logo, jossa silmä ja teksti Selko Digital.
19.6.2023
Saavutettavuuteen erikoistunut yhteistyökumppanimme Selko Digital avaa vieraskynäblogissa koneäänien ja puheentunnistuksen vaikutusta digimaailman yhdenvertaisuuteen.
Keskellä lukee toukokuun ääniuutiset. Taustalla kuva kuulokkeista kirjapinon päällä, kuulokkeiden vieressä on juomalasi, jossa sitruunaviipale ja kukkiva omenapuun oksa.
31.5.2023
Toukokuun ääniuutisten aiheina Google Bard, Metan uusi kielimalli, Applen uudet saavutettavuusominaisuudet, kielivähemmistöille suunnattu chatbot ja älykkäät NPC:t.
Nainen istuu auton etupenkillä kuulokkeet päässä ja pädi sylissä.
17.5.2023
Tekoäly ja kieliteknologia mahdollistavat uudenlaisia ja kiinnostavampia tapoja oppia uusia kieliä. Esimerkiksi kieltenoppimissovellukset hyödyntävät luonnollisen kielen käsittelyä.