Äänen kloonaaminen on prosessi, jossa koneoppimismalli opetetaan puhumaan kuin ihminen. Koneoppimismallille syötetään koulutusvaiheessa ääni-teksti parillista dataa, josta se oppii nauhoituksissa käytetyn ihmisen äänen ja tämän tavan puhua.
Luomalla äänikloonin saat brändiisi tai käyttötarkoitukseesi mahdollisimman hyvin osuvan äänen. Ääni voi olla esimerkiksi tietyn ikäisen kuuloinen, mainosmaisen eläytyvä, kuulutusmainen, äänikirjalukijamainen tai yleispätevän asiallinen.
a.i.materin luomaa tekoälyääntä on kuultu Turun seudun joukkoliikenteen Fölin busseissa elokuusta 2022. Oma koneääni päätettiin teettää, jotta kuulutuksia saadaan tehtyä heti tarpeen tullen lisää, ilman studionauhoituksia. Äänen haluttiin myös olevan sama ja tunnistettava jokaisella bussilinjalla, kielestä riippumatta.
Oman tekoälyäänen luomisessa lähdettiin liikkeelle sopivan äänen etsimisellä. Henkilön tuli lausua sujuvasti suomea, ruotsia ja englantia, joiden lisäksi äänen haluttiin olevan selkeä ja miellyttävä kuunnella. Valmiista tekoälyäänestä haluttiin myös kuulutusmainen, joten jo studionauhoituksissa henkilö keskittyi lukemaan tekstimateriaalin “kuulutusmaisesti”.
Lopputuloksena syntyi juuri halutunlainen ääni. Fölin palautteen mukaan “jos ääntä ei tietäisi koneääneksi, ajattelisi sen olevan ihmisääni!”