Taustalla punahiuksinen nainen, jolla kuulokkeet päässä. Kuvan päällä sumennettu suorakulmio, jossa lukee: Helmikuun ääniuutiset. Tekstin alla on piirretty valkoinen ääniaalto alleviivaamaan tekstiä.

Helmikuun ääniuutiset

Tammikuussa kirjoittamamme Alkuvuoden koneääniuutiset maailmalta -artikkeli saa nyt kuukausittaista jatkoa! Kokoamme jatkossa aina kuluneen kuukauden mielenkiintoisemmat puheteknologiauutiset yhteen artikkeliin. Uutiset voit ottaa myös kuunteluun YouTube -kanavaltamme koneääni-Ilonan lukemana.

Rekrytointeja, tunnistautumista ja koneääniä musiikkibisneksessä

Puheanalytiikkamarkkinoiden kasvu

Puheanalytiikalla tarkoitetaan tekoälyn avulla etsittävää yksityiskohtaisempaa tietoa puheesta. Tyypillisessä tapauksessa puheanalytiikan avulla tarkastellaan asiakaspuheluita, kuten puhelussa käytettyjä sanoja sekä tunteita ja vaikka puhujan äänen stressitasoja. Puheanalytiikan tutkimuksessa voidaan esimerkiksi analysoida lyhyiden ja pitkien asiakaspuheluiden eroja, sekä sitä, mitä syitä on negatiiviseksi tai positiiviseksi tulkittavien puheluiden taustalla. Markkina-analyysiyhtiö Market Research Futuren tekemän markkinatutkimuksen mukaan puheanalytiikkamarkkinat tulevat saavuttamaan maailmanlaajuisesti 9,3 miljardin arvon vuoteen 2030 mennessä. Markkinat kasvavat 20,38 prosentin vuosivauhtia. Merkittävimmät kohteet puheanalytiikan käyttöön ovat finanssialalla ja terveydenhuollossa. Muita kohteita ovat puhelinpalvelukeskukset sekä vähittäiskaupan tarpeet niin omassa raportoinnissa kuin asiakaskokemuksen luomisessa ja asiakkaan sitouttamisessa. Tietosuojahaasteet ja turvallisuusongelmat saattavat kuitenkin rajoittaa puheanalytiikkamarkkinoiden kasvua jonkin verran.

Keskustelullisen tekoälyn arvo

Maailmanlaajuisen keskustelullisen tekoälyn arvo laskettiin olevan viime vuonna 8,4 miljardia dollaria. Markkinatutkimusyhtiä P&S Intelligencen tutkimuksen mukaan arvo tulee nousemaan 41,9 miljardiin dollariin vuoteen 2030 mennessä. Keskustelullinen tekoäly perustuu koneoppimiseen, automaattiseen puheentunnistukseen ja luonnollisen kielen tunnistamiseen. Sen tyypillisimpiä käyttökohteita ovat asiakaspalvelussa käytettävät chatbotit sekä erilaiset virtuaaliassistentit, kuten Google Assistant. Keskustelullinen tekoäly on yleistä vähittäiskaupoissa ja verkkokaupoissa, pankkitoiminnassa ja telealalla. Terveydenhuollon käytössä teknologia on yleistymässä vauhdilla – sitä voidaan hyödyntää esimerkiksi aikojen varaamisessa ja terveydentilan seurannassa, jolloin asiakas saa heti palvelua ja henkilökunnalla riittää toisaalla enemmän aikaa vaativampiin tapauksiin.

Keskusteleva äänibotti rekrytoinneissa

Keskustelevaa tekoälyä käyttää muun muassa Babblebots.ai, joka julkaisi lanseeraavansa keskustelullisen äänibotin rekrytointiprosesseja helpottamaan. Äänibotti vastaa työnhakijoiden kysymyksiin ja arvioi heidän sopivuuttaan tehtävään. Äänibotti toimii yli 20 kielellä ja se sisältää yli 10 000 kysymystä, joiden pohjalta alkuhaastattelu voidaan räätälöidä. Se on ikään kuin alkukarsija, jonka avulla voidaan päättää, ketkä kutsutaan henkilökohtaiseen haastatteluun. Tämänkaltaiset työkalut säästävät valtavasti ihmisten aikaa varsinkin suurissa yrityksissä.

Äänellä tunnistautuminen kehittyy

Biometrinen tunnistautuminen, tässä tapauksessa puheella tunnistautuminen, on taas harpannut askeleen eteenpäin. VoxEQ:n kehittämällä työkalulla voidaan entistä tarkemmin  tunnistaa ikä puheesta. Tällä voidaan vähentää esimerkiksi pankkeihin ja vakuutusyhtiöihin tehtäviä tilien haltuunottoja ja identiteettivarkauksia. Kun huijarit saadaan ajoissa kiinni, asiakaskokemus ja brändimielikuva eivät pääse kärsimään.

Tekstiviestien kuuntelu lähettäjän äänellä

Apple teki patenttihakemuksen tekniikalle, jonka avulla iMessages –tekstiviestit olisi mahdollista kuunnella lähettäjän äänellä. Viestit ovat olleet tähän mennessä mahdollista lähettää pelkkinä ääniviesteinä tai kuunnella tekstiviestit Sirin lukemana. Patentin mukaan lähettäjä voisi päättää rakentaako iPhone lähettäjän omasta äänestä Sirin kaltaisen ääniprofiilin ja simuloisi jatkossa sitä viestien lukemiseksi ääneen. Apple sanoo tarjoavansa tätä kautta personointia viesteihin. Nähtäväksi kuitenkin jää, tulevatko äänitekstiviestit toteutumaan.

Puheluun vastaaminen äänikloonilla

Samsungin Bixby taas haluaa kloonata käyttäjänsä äänen, jotta koneääni voi vastata puheluihin käyttäjänsä puolesta. Kun käyttäjä ei pysty suullisesti vastaamaan puheluun, hän voi nopeasti näpytellä viestin, jonka soittaja kuulee puhelussa äänikloonin lukemana. Tämä on ollut jo mahdollista oletuksena olevien englanninkielisten koneäänien avulla, mutta jatkossa niiden sijaan pystyisi halutessaan käyttämään myös oman äänensä jäljennöstä. Oman koneäänen saa luotua Bixbyn sovelluksessa lukemalla useampia ohjelman antamia lauseita ääneen, jonka jälkeen se generoi niistä oman koneäänen. Äänen jäljennös on tällä hetkellä mahdollista vain koreaksi, mutta tulossa myös englanniksi.

Koneäänet laulajina

Synteettisiä ääni on käytetty soittimien tilalla jo pitkään. Laulajan tilalla koneääni harvemmin toimii, mutta nyt tässäkin mennään eteenpäin. Eteläkorealaisesta musiikkiyhtiö Hybestä tuli tekoäly-yritys Superstonen enemmistöosakas, noin 37 miljoonan dollarin sijoituksella. Superstone on puheteknologian startup, jossa on erikoistuttu nimenomaan musiikkiteollisuudessa käytettäviin realistisiin koneääniin. Äänet voivat laulaa ja näytellä ihmismäisellä tavalla. Musiikkiyhtiö Hyben toimitusjohtajan mukaan tavoitteena on yhdistää heidän tuotanto-osaamisensa ja Superstonen käyttämä tekniikka.

Koneääni-Eminem

Musiikkituottaja ja DJ David Guetta kertoo käyttäneensä yhdessä live-esiintymisessään räppäri Eminemin äänestä tehtyä syväväärennettyä koneääntä. Ajatus koneääni-Eminemiin lähti kuulemma vitsistä, mutta se toimi niin hyvin, ettei DJ ollut uskoa sitä. Guetta pyysi ensin yhtä tekoälytyökalua kirjoittamaan Eminemin tyyliin perustavat lyriikat ja sitten jatkojalostamaan siitä bileversion. Toisella työkalulla hän taas äänikloonasi räppärin äänen. Tämän jälkeen lyriikat laitettiin soimaan Eminemin koneäänellä. Prosessiin oli tottakai pyydetty ensin Eminemin lupa. Guettan mukaan tekoäly avaa täysin uusia mahdollisuuksia musiikkibisneksen tulevaisuuteen.

Ääniuutiset kuunneltavissa a.i.materin YouTube-kanavalta:

Kysymyksiä, ajatuksia tai mahdollinen yhteistyö?

Läppäri, jonka näppäimistön päällä on kuulokkeet. Läppärin näytössä on eepressin etusivu.
2.4.2024
Konenäköä ja puhesynteesiä yhdistäneessä projektissa kehitimme ePress-näköislehtipalvelulle pipelinen, joka pystyy tunnistamaan näköislehtien artikkelit ja toimittamaan niistä ääniversiot.
Kuulokkeet tietokonepöydän päällä.
14.3.2024
Yle on ottanut käyttöön a.i.materin kehittämän kuuntelumahdollisuuden uutissivuilleen. Kuunteluominaisuus parantaa palvelun digitaalista saavutettavuutta.
Aimaterin työntekijät Roope ja Niko tutkivat työpöydän edessä tietokoneelta jotain. Roope juuri osoittaa kädellään näyttöä.
28.2.2024
Artikkelissa esitellään ja vertaillaan verkkosivulukijaa ja äänirajapintaa: miten ne toimivat ja mikä tapa sopii mihinkin tarkoitukseen.
Educa-messujen 2024 logo
29.1.2024
a.i.mater oli mukana Educa-messuilla näytteilleasettajan roolissa. Paljon kiinnostavia kohtaamisia, keskusteluja mahdollisten uusien asiakkaiden kanssa, sekä nykyisten asiakkaiden ja yhteistyökumppanien tapaamisia.
10.1.2024
Digiaudion kulutus kasvaa edelleen, ääni on yhä tärkeämpi osa brändistrategiaa ja ääniklooneja voi hyödyntää muuhunkin kuin hupailuun. Muun muassa näihin voi hyödyntää moderneja koneääniä kuluvana vuonna.
21.12.2023
a.i.materin joulutervehdyksenä koneääni Ilonan lukema äänisatu Kiljusen perheen jouluaaton vietosta.