Tähän vuoteen on sisältynyt monta kiinnostavaa projektiavausta, joiden teemana on ollut tekoälyäänet. Listasimme alle muutamia tärkeimpiä tai kiinnostavampia projekteja vuodelta 2024; osa näistä on jo tuttuja a.i.materin verkkosivuilta ja some-kanavista, osa taas uusia tuttavuuksia.
Mediaa ja merisäätä
Ylen verkkosivujen ja sovelluksen kuunteluominaisuuden kokeilu aloitettiin a.i.materin äänirajapintaa hyödyntäen vuoden 2023 loppupuolella. Kokeilusta saatiin hyviä kokemuksia ja maaliskuussa 2024 asiasta tiedotettiinkin jo laajemmin: Yle.fi-verkkosivujen ja -sovelluksen uutisartikkelit nyt kuunneltavissa. Tämän jälkeen äänirajapintaa on laajennettu Svenska Ylen puolelle, jossa uutisia voi nyt kuunnella samaan tapaan ääneen luettuna suomenruotsia puhuvan koneäänen toimesta. Projekti laajeni edelleen Ylelle kehitettyyn omaan suomenruotsia puhuvaan ääniklooniin. Ääni toteutettiin Ylen radiosta tutun toimittajan Ida Rislakin äänestä ja sitä on voinut kesästä lähtien kuulla todellisen klassikon, merisään lukijaäänenä: Sjövädret går in i framtiden – väderrapporten för sjöfarare läses av AI från och med i dag.
Juhlatunnelmaan päästiin uudelleen, kun meillä oli kunnia saada Suomen isoihin mediataloihin kuuluva Alma Media a.i.materin äänirajapinnan käyttäjäksi vuoden 2024 aikana. Kauppalehden-mobiilisovelluksessa julkaistiin Alma Median toimesta kokonaan uudenlainen, a.i.materin äänillä tuotettuun sisältöön pohjautuva Kuuntele-osio. Uudistuksella tarjotaan käyttäjille monipuolisempia mahdollisuuksia sisällön kuluttamiseen: Kuuntele Kauppalehden tärkeimmät uutiset vartissa.
Media-alalla on huomattu laadukkaiden koneäänien mahdollisuudet ja on ollut ilahduttavaa huomata, miten uusia verkkosivulukija-asiakkaita tuli tänä vuonna erityisesti pienemmistä digilehdistä. Esimerkiksi valtakunnallisesti julkaistavaa erikoislehteä Rakennuslehteä ja paikallislehtiä, kuten Kiuruvesi-lehteä ja Rantapohjaa pystyy tästä vuodesta lähtien kuuntelemaan Ilona-äänen lukemana. Suomenruotsia puhuvalle lukijalle oli myös kysyntää ja Amanda-ääni lisättiin syksyn aikana Amos Rex -taidemuseota ja Söderlångvikin kartanomuseota ylläpitävän Konstsamfundetin verkkosivuille sekä pedagogiikkaan ja oppimiseen keskittyvälle Lärorikt-sivustolle. Opinahjoista myös Suomen suurimman ammattikorkeakoulun Metropolian verkkosivuille otettiin käyttöön suomea ja englantia puhuva verkkosivulukija.
Itävaltaa, suomea, suomenruotsia ja englantia
Ylelle kehitetyn suomenruotsia puhuvan äänikloonin lisäksi pääsimme kehittämään Saksassa toimivalle, tekstistä puheeksi palveluita tuottavalle BotTalk -yritykselle itävallankielisiä äänikloonimalleja. Yhteistyö on ollut hyvin mielenkiintoinen avaus, jossa saimme ottaa haltuun kokonaan uuden kielen. Ja mikä tärkeintä, asiakas oli tyytyväinen lopputulokseen!
Saimme myös tavallaan jatkoa yhdelle lempiprojekteistamme, päästessämme jatkamaan joukkoliikenteen kuulutuksiin käytettävien äänten koulutusta. Pari vuotta sitten toteutimme Turun seudun joukkoliikenteelle Fölille oman kolmikielisen äänikloonin, jota käytetään bussien pysäkki- ja muissa kuulutuksissa. Nyt toteutimme vastaavan projektin Waltti Solutions Oy:lle, joka on valtakunnallinen joukkoliikenteen lippu-, maksu- ja matkustajainformaatiopalveluita tarjoava yritys. Waltti aikoo jatkossa tarjota joukkoliikenneyhtiöille omaa kolmikielistä (suomea, suomenruotsia ja englantia puhuvaa) tekoälyääntä kuulutusten tekemiseen. Hyvin sujuneet tekoälyäänen koulutusmateriaalin nauhoitukset toteutettiin tuttuun tyyliin Piispanristin yhteistyökumppanimme studiolla.
Ohjelmistokehitystä ja kieliteknologiaa
Jokasyksyinen ePress-perinne jatkui tänäkin vuonna ja ePress-sanomalehtipalvelu sai lisää uusia digilehtiä kuunneltavaan muotoon. Kuunneltavien sanoma- ja aikakauslehtien määrä on jo hyvinkin kattava! Tarkemman kuvauksen tästä konenäköä ja puhesynteesiä yhdistävästä projektista pääset lukemaan huhtikuussa julkaistusta referenssitarinasta: a.i.mater tuottaa ePress-näköislehtipalvelun kuunneltavat artikkelit.
Kieliteknologiaa yhdistettiin kuvasisältöjen hakemiseen Ylelle toteutettuun sisäiseen projektiin. Projektin tavoitteena oli sujuvoittaa tiedon hakemista Ylen valtavan määrän kuvia ja videoita sisältävästä arkistosta. Ajatuksena oli yksinkertaistaa etenkin vanhempien sisältöjen löytämistä, sillä niistä ei välttämättä löydy mitään metatietoja – CLIP:iä hyödyntämällä voidaan löytää haluttuja sisältöjä, vaikka metatiedot puuttuisivat. Tämän projektin referenssitarinan pääset lukemaan elokuussa julkaistusta artikkelista: CLIP-projekti Ylelle: kuvasisällön hakeminen arkistosta.
Aina löytyy myös sisäisiä projekteja!
Kevään kehitysprojekteihin kuului muun muassa asiakasportaali, jonka kautta asiakkaamme pääsevät esimerkiksi ottamaan verkkosivulukijan käyttöön omille verkkosivuilleen. Portaalista asiakas saa lukijan käytön mahdollistavan koodinpätkän, joka upotetaan omien sivujen lähdekoodiin. Käyttöön tulevan lukijan ulkonköä on niinikään mahdollista rajallisesti muokata asiakasportaalissa. Kun lukija on otettu käyttöön, voi käyttömääriä seurata portaalista, kuuntelukertoja ja sisällön kuunteluprosentteja päivä- tai kuukausitasolla keräävän tilaston muodossa.
Mikäli verkkosivuston tekstisisällöissä on sanoja, joita koneääni ei osaa lausua oikein, asiakasportaalin kautta pääsee tekemään lausumisohjeita kyseisille sanoille. Lausumisohjeiden tekemiseen löytyy selkeät käyttöohjeet asiakasportaalin Lausumisohjeet -välilehdeltä. Myös äänirajapinta-asiakkaat pääsevät tekemään lausumisohjeita asiakasportaalin kautta.
Kuluneen vuoden isoin sisäinen kehitysprojekti on kuitenkin ollut Ääniverstaan työstäminen. Ääniverstas on yksinkertainen tekstistä puheeksi -työkalu, jonka avulla niin lyhyet kuin pidemmätkin digitaaliset tekstit voi itse muuttaa äänitiedostoiksi. Verstas sopii esimerkiksi audioartikkelien tekemiseen, voice-over -ääniraitojen tuottamiseen videoihin ja animaatioihin, puhelinvaihteisiin ja muuhun asiakastukeen, sekä markkinointiin, viestintään ja sisällöntuotantoon. Ääniverstaan kautta tuotetut audiot sopivat myös alustaviksi placeholdereiksi (esimerkiksi mainosvideoihin), jotka korvataan myöhemmin ääninäyttelijän äänellä. Mutkattomuutensa ansiosta tämä työkalu sopii niin freelancereille kuin suurillekin yrityksille. Verstaan ensimmäisiä käyttäjiä ovat olleet KEHA-keskus, Vaasan Sähkö ja Honkalampi-säätiö.
Ääniverstaan tärkein tavoite on ollut helppokäyttöisyys: sitä osaa käyttää, vaikka audion ja tekoälyäänien kanssa työskentely olisi kokonaan uutta. Ääniverstaaseen luodaan projekteja, joihin voi kirjoittaa tai kopioida tekstiä suoraan (kuva alla). Vaihtoehtoisesti käyttäjä voi ladata palveluun tekstiä sisältävän tekstitiedoston. Käyttöliittymässä voi muokata tekstiä, korjata vierasperäisten lausumista, testikuunnella audiota, lisätä haluamansa pituisia taukoja sekä säätää äänen nopeutta ja voimakkuutta.