Mies istuu selkä kuvaajaa päin laiturilla korituolissa kuulokkeet päässä. Vieressä on pino kirjoja ja niiden päällä älypuhelin , josta lähtee piuha kuulokkeisiin.

Suuret äänikirjapalvelut käyttävät nyt myös koneääniä

Ruotsalainen Storytel teki kesäkuussa saman ilmoituksen kuin Apple Books tammikuussa: äänikirjapalvelu alkaa käyttämään koneääntä ihmislukijan rinnalla äänikirjojen lukijana. Synteettiset äänet (joista näkyy nykyään puhuttavan myös tekoälyäänenä ja tekoälylukijana) ovat siis viimeistään tämän vuoden aikana nousseet varteenotettavaksi äänikirjalukija-vaihtoehdoksi.

Koneääniä on käytetty jo pidempään saavutettavan kirjallisuuden lukemiseen; muun muassa saavutettavuuskeskus Celian yhdistelmäkirjoissa. Koneoppimismenetelmien kehittymisen myötä synteettisestä puheesta on tullut vaihtoehto myös valtavirtakuluttajille – niin luonnolliseen kuuloiseen lopputulokseen puhesynteesillä nykyään päästään. Nyt kun koneäänistä on tulossa hyväksytty vaihtoehto isoissa lukuaikapalveluissa, äänikirjojen kuunteluun nousee uusia, mielenkiintoisia mahdollisuuksia.

Storytelissä mahdollisuus personoida kuuntelukokemusta

Yksi syy jättää äänikirja kesken on, että lukijan ääni ei miellytä kuulijaa. Ongelmaan pystytään tarttumaan synteettisten äänien avulla, kuten Storytelin uudesta ominaisuudesta voidaan todeta.

Storytel on ottanut tänä vuonna kokeiluun VoiceSwitcher -ominaisuuden, jonka avulla käyttäjät pystyvät sujuvasti vaihtamaan lukijaa kesken äänikirjan kuuntelun toiseen haluamaansa koneäänilukijaan. Käyttäjät saavat VoiceSwitcherin kautta enemmän valinnanvaraa oman kuuntelukokemuksen yksilöimiseen. Ominaisuus on toistaiseksi käytössä vain tietyissä englanninkielisissä teoksissa, mutta sitä laajennetaan loppuvuodesta ruotsin- ja tanskankielisiin äänikirjoihin. Storytelillä on suunnitelmia laajentaa ominaisuutta muihinkin kieliin. Storytelin käytössä olevat koneäänet tuottaa yhdysvaltalainen ElevenLabs -puheteknologiayritys.

Haluamansa lukijan valitsemisen lisäksi kuuntelukokemusta voitaisiin tulevaisuudessa yksilöidä mahdollistamalla kullekin kuulijalle mieluisan lukijaäänen generointi. Tällaista toiminnallisuutta ei vielä ole saatavilla, eikä meidän tietojemme mukaan suunnitteillakaan. Teknisesti se olisi kuitenkin lähitulevaisuudessa mahdollista.

Äänikirjojen määrä kasvaa

Koneäänien ei edelleenkään ole tarkoitus korvata ihmislukijoita, vaan täydentää tarjontaa. Esimerkiksi Apple Books kertoi koneäänilukijoidensa olevan hyvä vaihtoehto pienille kustantamoille ja omakustanteille, koska äänikirjan tekeminen maksaa niitä käytettäessä paljon vähemmän ääninäyttelijään verrattuna. Storytel on nostanut saman näkökannan esiin – yhä useampia ja myös vähemmän tunnettuja kirjoja voidaan tuottaa äänikirjoiksi, kun kustantamot tai äänikirjapalvelu säästävät äänityskustannuksissa.

Lisäksi äänikirjojen julkaisuaikataulua voidaan nopeuttaa koneäänien ansiosta: tekstin generoiminen koneäänellä tapahtuu huomattavasti nopeammin kuin studionauhoitukset. Tällöin uusista kirjoista saadaan julkaistua painettu kirja ja ääniversio mahdollisimman samanaikaisesti.

Kun ajassa ja rahassa säästetään, äänikirjavalikoimaa pystytään laajentamaan myös niille kielille, joihin ei välttämättä aiemmin ole ollut resursseja panostaa. Koneäänten nopeus ja edullisuus ihmislukijaan verrattuna tulevat todennäköisesti lisäämään äänikirjojen määrää.

Synteettinen puhe osoittaa siis suurta potentiaalia äänikirjojen lukijana. Tulevaisuudessa luultavasti vielä enemmän valikoiman laajuuden, personointimahdollisuuksien ja joustavuutensa ansiosta. Äänikirjojen tulevaisuus näyttää siis entistä monipuolisemmalta.

Myös kehittämämme Ilona-koneääni on lukenut usealle toimijalle äänikirjoja. Viimeisimpänä valmistui metsäasiantuntijayritys Tapion Metsänhoidon Suositukset. Tämä oli samalla Tapion ensimmäinen äänikirja, joten he tekivät aiheesta artikkelin ja haastattelivat meitä koneäänen käytöstä äänikirjoissa. Haastattelu ja äänikatkelma kirjasta löytyvät Tapion verkkosivuilta.

Kysymyksiä, ajatuksia tai mahdollinen yhteistyö?

Henkilö istuu lattialla kirjan edessä tekemässä muistiinpanoja. Hänellä on kuulokkeet päässä. Kuvaotettu ylhäältäpäin.
23.4.2024
Tietoa on monia tapoja kuluttaa ja meidän tulisi huomioida tämä monimuotoisuus sisältöä tuottaessa Ääni ja teksti tukevat toisiaan ja antavat sisällön kuluttajalle valinnanvaraa päättää
Läppäri, jonka näppäimistön päällä on kuulokkeet. Läppärin näytössä on eepressin etusivu.
2.4.2024
Konenäköä ja puhesynteesiä yhdistäneessä projektissa kehitimme ePress näköislehtipalvelulle pipelinen joka pystyy tunnistamaan näköislehtien artikkelit ja toimittamaan niistä ääniversiot
Kuulokkeet tietokonepöydän päällä.
14.3.2024
Yle on ottanut käyttöön a i materin kehittämän kuuntelumahdollisuuden uutissivuilleen Kuunteluominaisuus parantaa palvelun digitaalista saavutettavuutta
Aimaterin työntekijät Roope ja Niko tutkivat työpöydän edessä tietokoneelta jotain. Roope juuri osoittaa kädellään näyttöä.
28.2.2024
Artikkelissa esitellään ja vertaillaan verkkosivulukijaa ja äänirajapintaa miten ne toimivat ja mikä tapa sopii mihinkin tarkoitukseen
Educa-messujen 2024 logo
29.1.2024
a i mater oli mukana Educa messuilla näytteilleasettajan roolissa Paljon kiinnostavia kohtaamisia keskusteluja mahdollisten uusien asiakkaiden kanssa sekä nykyisten asiakkaiden ja yhteistyökumppanien tapaamisia
10.1.2024
Digiaudion kulutus kasvaa edelleen ääni on yhä tärkeämpi osa brändistrategiaa ja ääniklooneja voi hyödyntää muuhunkin kuin hupailuun Muun muassa näihin voi hyödyntää moderneja koneääniä kuluvana vuonna