Punatukkaisella naisella on headset päässä, takana on taimien mikroviljelmiä.

Miksi koneäänet ovat yleensä naisääniä?

Loppuvuodesta 2021 haimme puhujaa uuden koneäänen koulutusta varten tehtäviin nauhoituksiin. Mielenkiintoisessa projektissa aloimme kehittää asiakkaallemme uutta koneääntä joukkoliikenteen kuulutuksiin, ja tarkoitukseen etsimme naispuhujaa.

Oletko koskaan pannut merkille, että koneäänet tosiaan ovat usein naiselta kuulostavia? Tämän huomaa, kun kuuntelee navigaattorien, puhelinvastaajien, kuulutusten ja itsepalvelupisteiden koneääniä.

Naisääni on tyypillisesti korkeampi kuin miesääni. Muun muassa Näkövammaisten Liitolta saimme kuulla, että naisääni erottuu julkisen liikenteen ajoneuvoissa renkaiden ja moottorin tasaisesta, matalasta huminasta miesääntä paremmin.  Kenties vastaavanlaiset käytännön syyt selittävät naisäänten yleisyyttä koneäänissä muutoinkin?

Ystävälliset, avustavat äänet

Tieteiselokuvien tekoälyavustajien äänet ovat lähes poikkeuksetta naisia. Tässä syy saattaa olla se, että esimerkiksi avaruusaiheisissa elokuvissa alukseen viitataan perinteisesti pronominilla she, aivan kuten perinteisiin laivoihinkin viitataan. Tällöin on luonnollista, että avaruusaluksen käyttämä äänikin on naisääni.

Naisäänten suosimisella tietyissä käyttötarkoituksissa näyttää olevan pitkä historia. Vuonna 1878 Emma Nutt aloitti työnsä maailman ensimmäisenä naispuolisena puhelinvaihteena. Nuttin äänestä tuli niin suosittu, että muut puhelinvaihteita perustaneet yritykset alkoivat jäljittelemään sitä. Toki yritykset halusivat myös ottaa kaiken hyödyn irti: naiset olivat tunnollisia työntekijöitä, ystävällisiä asiakkaita kohtaan ja ennen kaikkea halvempaa työvoimaa kuin miehet. Vähä vähältä lumipalloefekti johti siihen, että käytännössä kaikki maailman puhelinvaihteet olivat naisten operoimia.

Koneäänten sukupuolta käsittelevässä keskustelussa tulee väkisin vastaan se, miksi naisääni on laitettu avustajan tehtäviin tai kotitöihin liittyviin tehtäviin. Naisäänten käytön yleisyyden voisi kuitenkin ajatella liittyvän sukupuolten välisen epätasa-arvon sijasta muihin, edellä mainitun kaltaisiin käytännön asioihin.

On hyvä muistaa, ettei koneäänillä kuitenkaan oikeasti ole sukupuolta – ne eivät ole miehiä tai naisia, vaan tietokonekoodia.

Alexa, tell me a story

Naisten äänitallenteita on kerääntynyt vuosien saatossa enemmän kuin miesten äänitallenteita. Olemassa olevista äänitallenteista on ollut helpompi lähteä kouluttamaan tekstistä puheeksi -järjestelmää; ääninäytteiden kerääminen ei ole triviaali juttu. Tästä syystä kehitys oli luonnollista aloittaa naisäänestä.

Näin kävi esimerkiksi Google Assistantille, johon haluttiin heti sekä mies- että naisääni. Laadukas naisääni oli kumminkin helpompi luoda, joten sillä Assistant myös lanseerattiin. Kiitos koneoppimisteknologian kehityksen, pystytään nykyään luomaan sekä luonnollisen kuuloisia mies- että naiskoneääniä.

Nykyään Google Assistantin äänivalikoima on laaja, ja äänet on nimetty neutraalisti: Red, Orange, Amber, Green, Cyan, Blue, Purple, Pink, British Racing Green ja Sydney Harbour Blue. Assistantin ääneksi on ollut mahdollista valita myös vaihtuvia cameo-ääniä, kuten näyttelijä Issa Raen tai muusikko John Legendin ääni.

Myös Applen virtuaaliavustajan Sirin ja Amazonin Alexan äänet voi itse vaihtaa haluamakseen. Alexan herätyskomennon voi jopa vaihtaa nimiin Computer, Echo, Amazon tai Ziggy, jolloin nimet eivät viittaa kumpaankaan sukupuoleen.

Täysin sukupuolineutraalejakin koneääniä on yritetty. Voittoa tavoittelemattoman EqualAI:n, Kööpenhamina Priden ja muutaman äänisuunnittelijan yhteistyönä on luotu ensimmäinen sukupuolineutraali koneääni Q. Sitä pääset kuuntelemaan täältä.

Suuret toimijat ovat ottaneet sukupuolineutraaliuden näkökulman huomioon omassa toiminnassaan. Kaikkein tärkeintä koneäänessä on kuitenkin se, että sitä on miellyttävää kuunnella.

Äänikirjojen lukijaäänet

Lukijan äänen miellyttävyys tulee erityisen vahvasti esiin äänikirjoissa. Äänikirja saatetaan pahimmassa tapauksessa jättää jo muutaman sekunnin kuuntelun jälkeen kesken, mikäli lukijan ääni ei miellytä.

Suomalaisten suosikkilukijoiksi on mainittu muun muassa Krista Putkonen-Örn, Erja Manto, Vesa Vierikko, Ville Tiihonen, Markus Niemi, Jukka Pitkänen, Pirjo Heikkilä, Krista Kosonen, Jarmo Heikkinen, Sanna Majuri ja Vuokko Hovatta. Suosikkiäänikirjalukijoissa nais- ja miesäänet ovat hyvin tasaisesti edustettuina.

Naiskoneäänien suosimista tutkittaessa vastaan tulee usein väite siitä, että kuulijat, sekä naiset että miehet, pitävät naisääntä yleensä miellyttävämpänä kuin miesääntä. Väitteen mukaan olisi siis helpompaa tehdä useampia miellyttävä ääni naisäänestä kuin miesäänestä. Tämän paikkansapitävyyttä on vaikea arvioida – joihinkin kirjoihin saattaa sopia mieslukija naislukijaa paremmin, ja päinvastoin. Loppujen lopuksi kyse on makuasiasta, mutta vaihtoehtojen lisäämisen voisi kuvitella olevan loppukäyttäjälle joka tapauksessa positiivinen asia.

Koneäänet sopivat toistaiseksi lukemaan lähinnä tieto- ja oppikirjoja, sillä ne eivät toistaiseksi pysty samaan dynamiikkaan kuin ihmislukija. Tulemme kuitenkin näkemään huomattavaa kehitystä koneäänten prosodiassa lähivuosina. Kun koneäänet ovat riittävän hyvällä tasolla lukeakseen kaunokirjallisuutta, on lopputulos kuulijalle valinnanvapauden lisääntyminen: voit valita lukijaksi joko ihmisen, tai lempilukijaltasi kuulostavan koneäänen.

Tällöin voisi itse myös päättää kuunteleeko mies- vai naisääntä.

Kysymyksiä, ajatuksia tai mahdollinen yhteistyö?

Nainen istuu toimistotuolissa tietokoneen edessä ja katsoo näyttöä. Toinen käsi on näppäimistöllä. Taustalla on isot ikkunat.
16.5.2024
Sekä ruudunlukuohjelma että verkkosivulukija lukee verkkosivuja ääneen. Oleellisen ero on, että ruudunlukijat on tarkoitettu henkilöille, joilla on näkemisen tai motorisen tai kognitiivisen puolen kanssa rajoitteita, kun taas verkkosivulukija sopii paljon
Henkilö istuu lattialla kirjan edessä tekemässä muistiinpanoja. Hänellä on kuulokkeet päässä. Kuvaotettu ylhäältäpäin.
23.4.2024
Tietoa voidaan kuluttaa monin eri tavoin: tämä monimuotoisuus tulisi huomioida myös sisältöä tuottaessa. Ääni ja teksti tukevat toisiaan ja antavat sisällön kuluttajalle valinnanvaraa päättää.
Läppäri, jonka näppäimistön päällä on kuulokkeet. Läppärin näytössä on eepressin etusivu.
2.4.2024
Konenäköä ja puhesynteesiä yhdistäneessä projektissa kehitimme ePress-näköislehtipalvelulle pipelinen, joka pystyy tunnistamaan näköislehtien artikkelit ja toimittamaan niistä ääniversiot.
Kuulokkeet tietokonepöydän päällä.
14.3.2024
Yle on ottanut käyttöön a.i.materin kehittämän kuuntelumahdollisuuden uutissivuilleen. Kuunteluominaisuus parantaa palvelun digitaalista saavutettavuutta.
Aimaterin työntekijät Roope ja Niko tutkivat työpöydän edessä tietokoneelta jotain. Roope juuri osoittaa kädellään näyttöä.
28.2.2024
Artikkelissa esitellään ja vertaillaan verkkosivulukijaa ja äänirajapintaa: miten ne toimivat ja mikä tapa sopii mihinkin tarkoitukseen.
Educa-messujen 2024 logo
29.1.2024
a.i.mater oli mukana Educa-messuilla näytteilleasettajan roolissa. Paljon kiinnostavia kohtaamisia, keskusteluja mahdollisten uusien asiakkaiden kanssa, sekä nykyisten asiakkaiden ja yhteistyökumppanien tapaamisia.