Punatukkaisella naisella on headset päässä, takana on taimien mikroviljelmiä.

Miksi koneäänet ovat yleensä naisääniä?

Loppuvuodesta 2021 haimme puhujaa uuden koneäänen koulutusta varten tehtäviin nauhoituksiin. Mielenkiintoisessa projektissa aloimme kehittää asiakkaallemme uutta koneääntä joukkoliikenteen kuulutuksiin, ja tarkoitukseen etsimme naispuhujaa.

Oletko koskaan pannut merkille, että koneäänet tosiaan ovat usein naiselta kuulostavia? Tämän huomaa, kun kuuntelee navigaattorien, puhelinvastaajien, kuulutusten ja itsepalvelupisteiden koneääniä.

Naisääni on tyypillisesti korkeampi kuin miesääni. Muun muassa Näkövammaisten Liitolta saimme kuulla, että naisääni erottuu julkisen liikenteen ajoneuvoissa renkaiden ja moottorin tasaisesta, matalasta huminasta miesääntä paremmin.  Kenties vastaavanlaiset käytännön syyt selittävät naisäänten yleisyyttä koneäänissä muutoinkin?

Ystävälliset, avustavat äänet

Tieteiselokuvien tekoälyavustajien äänet ovat lähes poikkeuksetta naisia. Tässä syy saattaa olla se, että esimerkiksi avaruusaiheisissa elokuvissa alukseen viitataan perinteisesti pronominilla she, aivan kuten perinteisiin laivoihinkin viitataan. Tällöin on luonnollista, että avaruusaluksen käyttämä äänikin on naisääni.

Naisäänten suosimisella tietyissä käyttötarkoituksissa näyttää olevan pitkä historia. Vuonna 1878 Emma Nutt aloitti työnsä maailman ensimmäisenä naispuolisena puhelinvaihteena. Nuttin äänestä tuli niin suosittu, että muut puhelinvaihteita perustaneet yritykset alkoivat jäljittelemään sitä. Toki yritykset halusivat myös ottaa kaiken hyödyn irti: naiset olivat tunnollisia työntekijöitä, ystävällisiä asiakkaita kohtaan ja ennen kaikkea halvempaa työvoimaa kuin miehet. Vähä vähältä lumipalloefekti johti siihen, että käytännössä kaikki maailman puhelinvaihteet olivat naisten operoimia.

Koneäänten sukupuolta käsittelevässä keskustelussa tulee väkisin vastaan se, miksi naisääni on laitettu avustajan tehtäviin tai kotitöihin liittyviin tehtäviin. Naisäänten käytön yleisyyden voisi kuitenkin ajatella liittyvän sukupuolten välisen epätasa-arvon sijasta muihin, edellä mainitun kaltaisiin käytännön asioihin.

On hyvä muistaa, ettei koneäänillä kuitenkaan oikeasti ole sukupuolta – ne eivät ole miehiä tai naisia, vaan tietokonekoodia. 

 

Alexa, tell me a story

Naisten äänitallenteita on kerääntynyt vuosien saatossa enemmän kuin miesten äänitallenteita. Olemassa olevista äänitallenteista on ollut helpompi lähteä kouluttamaan tekstistä puheeksi -järjestelmää; ääninäytteiden kerääminen ei ole triviaali juttu. Tästä syystä kehitys oli luonnollista aloittaa naisäänestä.

Näin kävi esimerkiksi Google Assistantille, johon haluttiin heti sekä mies- että naisääni. Laadukas naisääni oli kumminkin helpompi luoda, joten sillä Assistant myös lanseerattiin. Kiitos koneoppimisteknologian kehityksen, pystytään nykyään luomaan sekä luonnollisen kuuloisia mies- että naiskoneääniä.

Nykyään Google Assistantin äänivalikoima on laaja, ja äänet on nimetty neutraalisti: Red, Orange, Amber, Green, Cyan, Blue, Purple, Pink, British Racing Green ja Sydney Harbour Blue. Assistantin ääneksi on ollut mahdollista valita myös vaihtuvia cameo-ääniä, kuten näyttelijä Issa Raen tai muusikko John Legendin ääni.

Myös Applen virtuaaliavustajan Sirin ja Amazonin Alexan äänet voi itse vaihtaa haluamakseen. Alexan herätyskomennon voi jopa vaihtaa nimiin Computer, Echo, Amazon tai Ziggy, jolloin nimet eivät viittaa kumpaankaan sukupuoleen.

Täysin sukupuolineutraalejakin koneääniä on yritetty. Voittoa tavoittelemattoman EqualAI:n, Kööpenhamina Priden ja muutaman äänisuunnittelijan yhteistyönä on luotu ensimmäinen sukupuolineutraali koneääni Q. Sitä pääset kuuntelemaan täältä.

Suuret toimijat ovat ottaneet sukupuolineutraaliuden näkökulman huomioon omassa toiminnassaan. Kaikkein tärkeintä koneäänessä on kuitenkin se, että sitä on miellyttävää kuunnella.

Äänikirjojen lukijaäänet

Lukijan äänen miellyttävyys tulee erityisen vahvasti esiin äänikirjoissa. Äänikirja saatetaan pahimmassa tapauksessa jättää jo muutaman sekunnin kuuntelun jälkeen kesken, mikäli lukijan ääni ei miellytä.

Suomalaisten suosikkilukijoiksi on mainittu muun muassa Krista Putkonen-Örn, Erja Manto, Vesa Vierikko, Ville Tiihonen, Markus Niemi, Jukka Pitkänen, Pirjo Heikkilä, Krista Kosonen, Jarmo Heikkinen, Sanna Majuri ja Vuokko Hovatta. Suosikkiäänikirjalukijoissa nais- ja miesäänet ovat hyvin tasaisesti edustettuina.

Naiskoneäänien suosimista tutkittaessa vastaan tulee usein väite siitä, että kuulijat, sekä naiset että miehet, pitävät naisääntä yleensä miellyttävämpänä kuin miesääntä. Väitteen mukaan olisi siis helpompaa tehdä useampia miellyttävä ääni naisäänestä kuin miesäänestä. Tämän paikkansapitävyyttä on vaikea arvioida – joihinkin kirjoihin saattaa sopia mieslukija naislukijaa paremmin, ja päinvastoin. Loppujen lopuksi kyse on makuasiasta, mutta vaihtoehtojen lisäämisen voisi kuvitella olevan loppukäyttäjälle joka tapauksessa positiivinen asia.

Koneäänet sopivat toistaiseksi lukemaan lähinnä tieto- ja oppikirjoja, sillä ne eivät toistaiseksi pysty samaan dynamiikkaan kuin ihmislukija. Tulemme kuitenkin näkemään huomattavaa kehitystä koneäänten prosodiassa lähivuosina. Kun koneäänet ovat riittävän hyvällä tasolla lukeakseen kaunokirjallisuutta, on lopputulos kuulijalle valinnanvapauden lisääntyminen: voit valita lukijaksi joko ihmisen, tai lempilukijaltasi kuulostavan koneäänen.

Tällöin voisi itse myös päättää kuunteleeko mies- vai naisääntä.

Kiinnostuitko? Ota Yhteyttä!

Jaa artikkeli

LinkedIn
Twitter
Facebook
Tekstinlouhinta on tekoälypohjainen menetelmä, jolla tekstimassoista löydetään niihin piiloutuvaa tietoa. Kuvassa mies istuu Excelin edessä ja takana vaaleat ruudukkoikkunat kesämaisemalla.
Tekoälypohjaisilla tekstinlouhinnan työkaluilla laajoista tekstimassoista löydetään tekstisisältöön piiloutuvia tärkeitä havaintoja. Parhaimmillaan nämä oivallukset voivat jopa lisätä niitä käyttävien yritysten kilpailuetua.
Taustalla punahiuksinen nainen, jolla kuulokkeet päässä. Kuvan päällä sumennettu suorakulmio, jossa lukee: Helmikuun ääniuutiset. Tekstin alla on piirretty valkoinen ääniaalto alleviivaamaan tekstiä.
Kokosimme koko helmikuun ajalta yhteen artikkeliin mielenkiintoisimmat koneääni- ja puheentunnistusuutiset maailmalta. Voit myös kuunnella artikkelin Ilonan lukemana.
Mies istuu tietokoneen edessä kuulokkeet päässä. Hän nauhoittaa studiomikkiin puhettaan. Takana on ristikkoikkunat, joista näkyy vihreää luontoa.
Äänen kloonauksella tavoitellaan synteettistä ääntä, joka muistuttaa mahdollisimman paljon alkuperäistä puhujaa. Artikkelissa menetelmän hyödyistä ja syväväärennösten riskeistä.
Mies istuu korituolissa laiturin nokassa ja katsoo merelle. Vieressä on kirjapino, jonka päällä älypuhelin. Miehellä on t-paita päällä ja kuulokkeet päässä.
Aikakausmediat näkevät tärkeimpinä syinä äänisisältöjen tekemiselle nuoren ja uuden yleisön tavoittamisen. Suosituin äänisisällön muoto on podcastit.
Nainen makaa selällään silmät kiinni ja kuulokkeet korvilla, vierellä on lautasellinen pilkottuja hedelmiä.
Koneäänet antavat kuluttajalle mahdollisuuden päättää, missä muodossa haluaa sisältönsä kuluttaa. Samalla lisätään sisällön saavutettavuutta.
Studiolaatuinen mikrofoni. Takana ikkuna, jossa kesäiset maisemat. Pöydällä vaaleanpunainen kesäkukka.
Artikkelissa tutustutaan Microsoftin kehittämään VALL-E -tekoälymalliin, joka pystyy tuottamaan ihmisen äänestä koneääntä vain kolmen sekunnin pohjalta. Sekä Applen uutisiin julkaista äänikirjoja koneäänien lukemina.