Koneäänien hyödyntäminen vuonna 2024

Vuoden 2023 aikana tekoäly ja kielimallit tulivat kertarysäyksellä suuremmallekin yleisölle tutuksi. Tämä näkyi myös liikenteenä a.i.materin verkkosivuilla ja lisääntyneenä kiinnostuksena ylipäätään. Kesän jälkeen sivustollemme päädyttiin Googlen kautta uusin hakusanatermein ai ääni ja GPT. ”Ai äänellä” viitataan tekoälyn avulla luotuun ihmismäiseen puheääneen, koneääneen, ja ”GPT:llä” taas tiettyyn tekstiä tuottavaan kielimalliperheeseen. Tässä artikkelissa syvennytään tekoälyääniin ja siihen, miten niitä hyödynnetään nyt ja tulevana vuonna.

Äänisisältöjen kulutus on edelleen kasvava trendi

Tilastokeskuksen Väestön tieto- ja viestintätekniikan käyttö -tilaston mukaan 26 prosenttia suomalaisista on kuunnellut tai ladannut äänikirjoja viimeisen kolmen kuukauden aikana ja jopa 39 prosenttia suomalaisista on kuunnellut tai ladannut podcastin viimeisen kolmen kuukauden aikana. Tämä kehitys näkyy alla olevasta taulukosta vuosien 2019–2023 aikana.

Viivataulukko, jossa näkyy, miten sekä podcastien että äänikirjojen kuuntelu on ollut tasaisesti kasvavaa.
Podcastien ja äänikirjojen kuuntelu Suomessa vuosina 2019–2023. Lähde: Tilastokeskus

Digiaudiotutkimus 2023 näyttää samaa trendiä: digiaudiosta on tullut Suomessa valtavirtaa. Jopa 98 prosenttia kyselytutkimukseen osallistuneista sanoo kuluttavansa viikoittain jotain audiosisältöä. Digiaudiotutkimuksen tuloksista pääset lukemaan lisää aiemmasta blogiartikkelista Digiaudion kuuntelu vuonna 2023.

Äänen rooli laajentuu brändiviestinnässä

Maailman suurin mainonnan, markkinoinnin ja viestinnän yritys WPP koosti vuoden 2024 markkinointitrendejä. Haastateltujen joukosta amp Sound Branding yrityksen perustaja ja toimitusjohtaja Michele Arnesen mukaan tekoälystä tulee olennainen osa brändistrategioita. Äänen roolista hän kertoo: Ääni on nyt osa brändi-identiteettiä ja kulkee käsi kädessä visuaalisen puolen ja kokemusten kanssa. Kuluttajat saattavat unohtaa, mitä brändit sanovat, he saattavat unohtaa myös, mitä brändit tekevät, mutta kuluttajat eivät koskaan unohda, miten brändit saivat heidät tuntemaan. Ääni voimistuu brändimaailmassa juuri tästä syystä.

Äänen osuutta ei siis enää voi olla huomioimatta brändin rakentamisessa. Sen rooli ja vaikuttavuus laajenee sitä mukaan, kun se otetaan nykyistä useampaan kanavaan käyttöön. Mutta miten? Jos äänen tuottaminen on helppoa, sitä myös käytetään enemmän.

Vertauskuvana voimme käyttää Canva-työkalua, jonka avulla tahansa voi tehdä hyvännäköistä visuaalisia sisältöjä. Entä jos sama toimisi audiopuolella? Musiikkeja kyllä löytyy, esimerkiksi Pixabaystä rojaltivapaita kappaleita vaikkapa mainoksiin tai podcastien jingleiksi, mutta entäpä yksilölliset puhesisällöt? Tällä hetkellä äänisisältöjen teko onnistuu helpoiten ihmispuhujaa ja studiota käyttämällä – harvalta löytyy vaadittavaa ammattitaitoa ja välineistöä itseltää. Studioaika ja puhujan palkkiot eivät kuitenkaan ole halpaa huvia.

a.i.materin kehitteillä oleva ääniverstas on äänisisältöjen Canva, jossa teet helposti lyhyitä äänisisältöjä digitaalisilla kertojilla. Ääniverstaan kautta on mahdollista tehdä mm. voice-overeita ohjevideoihin, äänet puhelinvaihteisiin ja -tiedotteisiin tai vaikka kuulutuksiin. Ääniverstaan digitaaliset lukijat ovat a.i.materin kehittämiä. Palvelu on kuukausilaskutteinen, ja voit ottaa sen käyttöön joustavasti tarvitsemallesi ajanjaksolle.

Äänikloonit hyötykäyttöön

Vuonna 2023 uutena ilmiönä nousivat äänikloonit ja niihin liittyvät huijaukset. Puheteknologiayritys ElevenLabsin teknologialla oli palvelun julkaisemisen yhteydessä mahdollista tehdä ääniklooni muutaman minuutin mittaisesta nauhotteesta, ilman rekisteröitymistä. Tämä johti useampaan mediassakin nousseeseen tapaukseen, jossa tunnettujen henkilöiden puheesta tehdyllä äänikloonilla luettiin esimerkiksi vihapuhesisältöä. Myös ihan tavallisiin ihmisiin kohdistui huijauksia, kun ihmiset saivat soittoja ”lapseltaan” tai ”pomoltaan” ja näiltä kuulostavat äänet pyysivät siirtämään rahaa tililleen.

Äänikloonit olivat esillä myös Hollywoodissa kesällä alkaneen lakon yhteydessä, kun näyttelijät vaativat oikeuksiaan muun muassa äänensä käytössä ja sen jäljittelyssä digitaalisesti. Kanadalaislaulaja Grimes puolestaan jakoi äänestään luodun äänikloonin ja sanoi antavansa sillä tehdyistä kappaleista 50 prosentin rojaltit.

Loppuvuodesta ääniä tuottava Deepdub -niminen yritys käynnisti Voice Artist Royalty -ohjelman, jossa ääninäyttelijä antaa oman äänensä äänikloonin käytettäväksi eri projekteihin säilyttäen samalla sen kaikki kaupalliset oikeudet. Ääninäyttelijä saa siis tätä kautta ansaittua passiivisia tuloja äänellään.

Ääniklooni saattaa kuulostaa uhkaavalta, mutta todelliset käyttötavat ovat paljon vähemmän dramaattisia; ihmispuhujia ei olla edelleenkään korvaamassa kokonaan. Ääniklooni soveltuu edelleen parhaiten lukemaan sellaista sisältöä, jota ihmislukijan ei ole kannattavaa lukea.

Jos yritys haluaa käyttöönsä koneäänen ja valmiit digitaaliset lukijaäänet eivät miellytä, brändiin sopiva ääniklooni voidaan tällöin luoda toivotusta puhujaäänestä.  Tällöin on ensisijaisen tärkeää sopia puhujan kanssa sopivasta korvauksesta äänen käytöstä ja samalla voidaan sopia esimerkiksi yksinoikeudesta tiettyyn ääniklooniin.

Kehitimme äänikloonin Turun seudun joukkoliikenne Fölille. Fölin toiveena oli, että sama ääni pystyy tekemään pysäkkikuulutukset suomeksi, ruotsiksi ja englanniksi samalla äänellä. Oman äänen koulutus oli siis erinomainen vaihtoehto. Myös siksi, että koneäänen avulla Fölillä pystytään itse generoimaan uusia poikkeuskuulutuksia ja pysäkkien nimiä vaivattomasti muutaman napin painalluksella.

Modernit koneäänet yllättävät aidontuntuisuudellaan

Koneäänellä saadaan tuotettua äänisisältöä nopeasti ja kustannustehokkaasti. Modernit äänet ovat laadultaan jo sen verran hyviä, että niitä on vaikea erottaa ihmisäänestä. Teimme viime vuonna muun muassa metsäasiantuntijayritys Tapiolle Metsänhoidon suositukset -äänikirjan, jota Tapio kuunnellutti asiakkaillaan ja pyysi siitä mielipiteitä. Kohdeyleisö oli positiivisesti yllättynyt koneääni-Ilonan aidontuntuisuudesta ja eräs jopa mainitsi, ettei olisi tunnistanut ääntä koneääneksi, jos sitä ei olisi erikseen kerrottu. Tapion loppuvuodesta julkaiseman artikkelin pääset lukemaan Metsäkaupan verkkosivuilta.

Palvelumme sopivat hyvin myös muun digitaalisen sisällön audioittamiseen koneäänellä: TTS-APIlla tuotat jatkuvasti julkaistavasta sisällöstäsi ääniversiot esimerkiksi uutissivuille tai sovelluksiin, kun taas verkkosivulukijalla parannat sivuston saavutettavuutta ja käyttäjäkokemusta.

Muun muassa Ylen verkkosivuilla uutisartikkelit voi nykyään kuunnella Ilonan lukemana a.i.materin tuottaman TTS-API:n ansiosta.

Tutustu lisää a.i.materin tarjoamiin äänimahdollisuuksiin: verkkosivulukijaan, TTS-API:in, ääniverstaaseen ja äänikloonin teettämiseen Palvelut-valikosta

Kiinnostuitko? Ota Yhteyttä!

Jaa artikkeli

Läppäri, jonka näppäimistön päällä on kuulokkeet. Läppärin näytössä on eepressin etusivu.
2.4.2024
Konenäköä ja puhesynteesiä yhdistäneessä projektissa kehitimme ePress-näköislehtipalvelulle pipelinen, joka pystyy tunnistamaan näköislehtien artikkelit ja toimittamaan niistä ääniversiot.
Kuulokkeet tietokonepöydän päällä.
14.3.2024
Yle on ottanut käyttöön a.i.materin kehittämän kuuntelumahdollisuuden uutissivuilleen. Kuunteluominaisuus parantaa palvelun digitaalista saavutettavuutta.
Aimaterin työntekijät Roope ja Niko tutkivat työpöydän edessä tietokoneelta jotain. Roope juuri osoittaa kädellään näyttöä.
28.2.2024
Artikkelissa esitellään ja vertaillaan verkkosivulukijaa ja äänirajapintaa: miten ne toimivat ja mikä tapa sopii mihinkin tarkoitukseen.
Educa-messujen 2024 logo
29.1.2024
a.i.mater oli mukana Educa-messuilla näytteilleasettajan roolissa. Paljon kiinnostavia kohtaamisia, keskusteluja mahdollisten uusien asiakkaiden kanssa, sekä nykyisten asiakkaiden ja yhteistyökumppanien tapaamisia.
21.12.2023
a.i.materin joulutervehdyksenä koneääni Ilonan lukema äänisatu Kiljusen perheen jouluaaton vietosta.
Lähikuva kädestä, joka on tietokoneen hiiren päällä. Taustalla näppäimistä, kaksi näyttöä, läppärin kulma ja kahvimuki.
29.11.2023
Turun yliopiston tutkimusryhmä TurkuNLP on avannut sivuston, jonka kautta sinäkin voit osallistua suomenkielisen keskustelevan tekoälyn kehitykseen. Artikkelissa avataan enemmän kielimallien kehityksen taustoja.