Vuoden 2023 aikana tekoäly ja kielimallit tulivat kertarysäyksellä suuremmallekin yleisölle tutuksi. Tämä näkyi myös liikenteenä a.i.materin verkkosivuilla ja lisääntyneenä kiinnostuksena ylipäätään. Kesän jälkeen sivustollemme päädyttiin Googlen kautta uusin hakusanatermein ai ääni ja GPT. ”Ai äänellä” viitataan tekoälyn avulla luotuun ihmismäiseen puheääneen, koneääneen, ja ”GPT:llä” taas tiettyyn tekstiä tuottavaan kielimalliperheeseen. Tässä artikkelissa syvennytään tekoälyääniin ja siihen, miten niitä hyödynnetään nyt ja tulevana vuonna.
Äänisisältöjen kulutus on edelleen kasvava trendi
Tilastokeskuksen Väestön tieto- ja viestintätekniikan käyttö -tilaston mukaan 26 prosenttia suomalaisista on kuunnellut tai ladannut äänikirjoja viimeisen kolmen kuukauden aikana ja jopa 39 prosenttia suomalaisista on kuunnellut tai ladannut podcastin viimeisen kolmen kuukauden aikana. Tämä kehitys näkyy alla olevasta taulukosta vuosien 2019–2023 aikana.
Digiaudiotutkimus 2023 näyttää samaa trendiä: digiaudiosta on tullut Suomessa valtavirtaa. Jopa 98 prosenttia kyselytutkimukseen osallistuneista sanoo kuluttavansa viikoittain jotain audiosisältöä. Digiaudiotutkimuksen tuloksista pääset lukemaan lisää aiemmasta blogiartikkelista Digiaudion kuuntelu vuonna 2023.
Äänen rooli laajentuu brändiviestinnässä
Maailman suurin mainonnan, markkinoinnin ja viestinnän yritys WPP koosti vuoden 2024 markkinointitrendejä. Haastateltujen joukosta amp Sound Branding yrityksen perustaja ja toimitusjohtaja Michele Arnesen mukaan tekoälystä tulee olennainen osa brändistrategioita. Äänen roolista hän kertoo: Ääni on nyt osa brändi-identiteettiä ja kulkee käsi kädessä visuaalisen puolen ja kokemusten kanssa. Kuluttajat saattavat unohtaa, mitä brändit sanovat, he saattavat unohtaa myös, mitä brändit tekevät, mutta kuluttajat eivät koskaan unohda, miten brändit saivat heidät tuntemaan. Ääni voimistuu brändimaailmassa juuri tästä syystä.
Äänen osuutta ei siis enää voi olla huomioimatta brändin rakentamisessa. Sen rooli ja vaikuttavuus laajenee sitä mukaan, kun se otetaan nykyistä useampaan kanavaan käyttöön. Mutta miten? Jos äänen tuottaminen on helppoa, sitä myös käytetään enemmän.
Vertauskuvana voimme käyttää Canva-työkalua, jonka avulla tahansa voi tehdä hyvännäköistä visuaalisia sisältöjä. Entä jos sama toimisi audiopuolella? Musiikkeja kyllä löytyy, esimerkiksi Pixabaystä rojaltivapaita kappaleita vaikkapa mainoksiin tai podcastien jingleiksi, mutta entäpä yksilölliset puhesisällöt? Tällä hetkellä äänisisältöjen teko onnistuu helpoiten ihmispuhujaa ja studiota käyttämällä – harvalta löytyy vaadittavaa ammattitaitoa ja välineistöä itseltää. Studioaika ja puhujan palkkiot eivät kuitenkaan ole halpaa huvia.
a.i.materin kehitteillä oleva ääniverstas on äänisisältöjen Canva, jossa teet helposti lyhyitä äänisisältöjä digitaalisilla kertojilla. Ääniverstaan kautta on mahdollista tehdä mm. voice-overeita ohjevideoihin, äänet puhelinvaihteisiin ja -tiedotteisiin tai vaikka kuulutuksiin. Ääniverstaan digitaaliset lukijat ovat a.i.materin kehittämiä. Palvelu on kuukausilaskutteinen, ja voit ottaa sen käyttöön joustavasti tarvitsemallesi ajanjaksolle.
Äänikloonit hyötykäyttöön
Vuonna 2023 uutena ilmiönä nousivat äänikloonit ja niihin liittyvät huijaukset. Puheteknologiayritys ElevenLabsin teknologialla oli palvelun julkaisemisen yhteydessä mahdollista tehdä ääniklooni muutaman minuutin mittaisesta nauhotteesta, ilman rekisteröitymistä. Tämä johti useampaan mediassakin nousseeseen tapaukseen, jossa tunnettujen henkilöiden puheesta tehdyllä äänikloonilla luettiin esimerkiksi vihapuhesisältöä. Myös ihan tavallisiin ihmisiin kohdistui huijauksia, kun ihmiset saivat soittoja ”lapseltaan” tai ”pomoltaan” ja näiltä kuulostavat äänet pyysivät siirtämään rahaa tililleen.
Äänikloonit olivat esillä myös Hollywoodissa kesällä alkaneen lakon yhteydessä, kun näyttelijät vaativat oikeuksiaan muun muassa äänensä käytössä ja sen jäljittelyssä digitaalisesti. Kanadalaislaulaja Grimes puolestaan jakoi äänestään luodun äänikloonin ja sanoi antavansa sillä tehdyistä kappaleista 50 prosentin rojaltit.
Loppuvuodesta ääniä tuottava Deepdub -niminen yritys käynnisti Voice Artist Royalty -ohjelman, jossa ääninäyttelijä antaa oman äänensä äänikloonin käytettäväksi eri projekteihin säilyttäen samalla sen kaikki kaupalliset oikeudet. Ääninäyttelijä saa siis tätä kautta ansaittua passiivisia tuloja äänellään.
Ääniklooni saattaa kuulostaa uhkaavalta, mutta todelliset käyttötavat ovat paljon vähemmän dramaattisia; ihmispuhujia ei olla edelleenkään korvaamassa kokonaan. Ääniklooni soveltuu edelleen parhaiten lukemaan sellaista sisältöä, jota ihmislukijan ei ole kannattavaa lukea.
Jos yritys haluaa käyttöönsä koneäänen ja valmiit digitaaliset lukijaäänet eivät miellytä, brändiin sopiva ääniklooni voidaan tällöin luoda toivotusta puhujaäänestä. Tällöin on ensisijaisen tärkeää sopia puhujan kanssa sopivasta korvauksesta äänen käytöstä ja samalla voidaan sopia esimerkiksi yksinoikeudesta tiettyyn ääniklooniin.
Kehitimme äänikloonin Turun seudun joukkoliikenne Fölille. Fölin toiveena oli, että sama ääni pystyy tekemään pysäkkikuulutukset suomeksi, ruotsiksi ja englanniksi samalla äänellä. Oman äänen koulutus oli siis erinomainen vaihtoehto. Myös siksi, että koneäänen avulla Fölillä pystytään itse generoimaan uusia poikkeuskuulutuksia ja pysäkkien nimiä vaivattomasti muutaman napin painalluksella.
Modernit koneäänet yllättävät aidontuntuisuudellaan
Koneäänellä saadaan tuotettua äänisisältöä nopeasti ja kustannustehokkaasti. Modernit äänet ovat laadultaan jo sen verran hyviä, että niitä on vaikea erottaa ihmisäänestä. Teimme viime vuonna muun muassa metsäasiantuntijayritys Tapiolle Metsänhoidon suositukset -äänikirjan, jota Tapio kuunnellutti asiakkaillaan ja pyysi siitä mielipiteitä. Kohdeyleisö oli positiivisesti yllättynyt koneääni-Ilonan aidontuntuisuudesta ja eräs jopa mainitsi, ettei olisi tunnistanut ääntä koneääneksi, jos sitä ei olisi erikseen kerrottu. Tapion loppuvuodesta julkaiseman artikkelin pääset lukemaan Metsäkaupan verkkosivuilta.
Palvelumme sopivat hyvin myös muun digitaalisen sisällön audioittamiseen koneäänellä: TTS-APIlla tuotat jatkuvasti julkaistavasta sisällöstäsi ääniversiot esimerkiksi uutissivuille tai sovelluksiin, kun taas verkkosivulukijalla parannat sivuston saavutettavuutta ja käyttäjäkokemusta.
Muun muassa Ylen verkkosivuilla uutisartikkelit voi nykyään kuunnella Ilonan lukemana a.i.materin tuottaman TTS-API:n ansiosta.