Taustalla punahiuksinen nainen, jolla kuulokkeet päässä. Kuvan päällä sumennettu suorakulmio, jossa lukee: Helmikuun ääniuutiset. Tekstin alla on piirretty valkoinen ääniaalto alleviivaamaan tekstiä.

Helmikuun ääniuutiset

Tammikuussa kirjoittamamme Alkuvuoden koneääniuutiset maailmalta -artikkeli saa nyt kuukausittaista jatkoa! Kokoamme jatkossa aina kuluneen kuukauden mielenkiintoisemmat puheteknologiauutiset yhteen artikkeliin. Uutiset voit ottaa myös kuunteluun YouTube -kanavaltamme koneääni-Ilonan lukemana.

Rekrytointeja, tunnistautumista ja koneääniä musiikkibisneksessä

Puheanalytiikkamarkkinoiden kasvu

Puheanalytiikalla tarkoitetaan tekoälyn avulla etsittävää yksityiskohtaisempaa tietoa puheesta. Tyypillisessä tapauksessa puheanalytiikan avulla tarkastellaan asiakaspuheluita, kuten puhelussa käytettyjä sanoja sekä tunteita ja vaikka puhujan äänen stressitasoja. Puheanalytiikan tutkimuksessa voidaan esimerkiksi analysoida lyhyiden ja pitkien asiakaspuheluiden eroja, sekä sitä, mitä syitä on negatiiviseksi tai positiiviseksi tulkittavien puheluiden taustalla. Markkina-analyysiyhtiö Market Research Futuren tekemän markkinatutkimuksen mukaan puheanalytiikkamarkkinat tulevat saavuttamaan maailmanlaajuisesti 9,3 miljardin arvon vuoteen 2030 mennessä. Markkinat kasvavat 20,38 prosentin vuosivauhtia. Merkittävimmät kohteet puheanalytiikan käyttöön ovat finanssialalla ja terveydenhuollossa. Muita kohteita ovat puhelinpalvelukeskukset sekä vähittäiskaupan tarpeet niin omassa raportoinnissa kuin asiakaskokemuksen luomisessa ja asiakkaan sitouttamisessa. Tietosuojahaasteet ja turvallisuusongelmat saattavat kuitenkin rajoittaa puheanalytiikkamarkkinoiden kasvua jonkin verran.

Keskustelullisen tekoälyn arvo

Maailmanlaajuisen keskustelullisen tekoälyn arvo laskettiin olevan viime vuonna 8,4 miljardia dollaria. Markkinatutkimusyhtiä P&S Intelligencen tutkimuksen mukaan arvo tulee nousemaan 41,9 miljardiin dollariin vuoteen 2030 mennessä. Keskustelullinen tekoäly perustuu koneoppimiseen, automaattiseen puheentunnistukseen ja luonnollisen kielen tunnistamiseen. Sen tyypillisimpiä käyttökohteita ovat asiakaspalvelussa käytettävät chatbotit sekä erilaiset virtuaaliassistentit, kuten Google Assistant. Keskustelullinen tekoäly on yleistä vähittäiskaupoissa ja verkkokaupoissa, pankkitoiminnassa ja telealalla. Terveydenhuollon käytössä teknologia on yleistymässä vauhdilla – sitä voidaan hyödyntää esimerkiksi aikojen varaamisessa ja terveydentilan seurannassa, jolloin asiakas saa heti palvelua ja henkilökunnalla riittää toisaalla enemmän aikaa vaativampiin tapauksiin.

Keskusteleva äänibotti rekrytoinneissa

Keskustelevaa tekoälyä käyttää muun muassa Babblebots.ai, joka julkaisi lanseeraavansa keskustelullisen äänibotin rekrytointiprosesseja helpottamaan. Äänibotti vastaa työnhakijoiden kysymyksiin ja arvioi heidän sopivuuttaan tehtävään. Äänibotti toimii yli 20 kielellä ja se sisältää yli 10 000 kysymystä, joiden pohjalta alkuhaastattelu voidaan räätälöidä. Se on ikään kuin alkukarsija, jonka avulla voidaan päättää, ketkä kutsutaan henkilökohtaiseen haastatteluun. Tämänkaltaiset työkalut säästävät valtavasti ihmisten aikaa varsinkin suurissa yrityksissä.

Äänellä tunnistautuminen kehittyy

Biometrinen tunnistautuminen, tässä tapauksessa puheella tunnistautuminen, on taas harpannut askeleen eteenpäin. VoxEQ:n kehittämällä työkalulla voidaan entistä tarkemmin  tunnistaa ikä puheesta. Tällä voidaan vähentää esimerkiksi pankkeihin ja vakuutusyhtiöihin tehtäviä tilien haltuunottoja ja identiteettivarkauksia. Kun huijarit saadaan ajoissa kiinni, asiakaskokemus ja brändimielikuva eivät pääse kärsimään.

Tekstiviestien kuuntelu lähettäjän äänellä

Apple teki patenttihakemuksen tekniikalle, jonka avulla iMessages –tekstiviestit olisi mahdollista kuunnella lähettäjän äänellä. Viestit ovat olleet tähän mennessä mahdollista lähettää pelkkinä ääniviesteinä tai kuunnella tekstiviestit Sirin lukemana. Patentin mukaan lähettäjä voisi päättää rakentaako iPhone lähettäjän omasta äänestä Sirin kaltaisen ääniprofiilin ja simuloisi jatkossa sitä viestien lukemiseksi ääneen. Apple sanoo tarjoavansa tätä kautta personointia viesteihin. Nähtäväksi kuitenkin jää, tulevatko äänitekstiviestit toteutumaan.

Puheluun vastaaminen äänikloonilla

Samsungin Bixby taas haluaa kloonata käyttäjänsä äänen, jotta koneääni voi vastata puheluihin käyttäjänsä puolesta. Kun käyttäjä ei pysty suullisesti vastaamaan puheluun, hän voi nopeasti näpytellä viestin, jonka soittaja kuulee puhelussa äänikloonin lukemana. Tämä on ollut jo mahdollista oletuksena olevien englanninkielisten koneäänien avulla, mutta jatkossa niiden sijaan pystyisi halutessaan käyttämään myös oman äänensä jäljennöstä. Oman koneäänen saa luotua Bixbyn sovelluksessa lukemalla useampia ohjelman antamia lauseita ääneen, jonka jälkeen se generoi niistä oman koneäänen. Äänen jäljennös on tällä hetkellä mahdollista vain koreaksi, mutta tulossa myös englanniksi.

Koneäänet laulajina

Synteettisiä ääni on käytetty soittimien tilalla jo pitkään. Laulajan tilalla koneääni harvemmin toimii, mutta nyt tässäkin mennään eteenpäin. Eteläkorealaisesta musiikkiyhtiö Hybestä tuli tekoäly-yritys Superstonen enemmistöosakas, noin 37 miljoonan dollarin sijoituksella. Superstone on puheteknologian startup, jossa on erikoistuttu nimenomaan musiikkiteollisuudessa käytettäviin realistisiin koneääniin. Äänet voivat laulaa ja näytellä ihmismäisellä tavalla. Musiikkiyhtiö Hyben toimitusjohtajan mukaan tavoitteena on yhdistää heidän tuotanto-osaamisensa ja Superstonen käyttämä tekniikka.

Koneääni-Eminem

Musiikkituottaja ja DJ David Guetta kertoo käyttäneensä yhdessä live-esiintymisessään räppäri Eminemin äänestä tehtyä syväväärennettyä koneääntä. Ajatus koneääni-Eminemiin lähti kuulemma vitsistä, mutta se toimi niin hyvin, ettei DJ ollut uskoa sitä. Guetta pyysi ensin yhtä tekoälytyökalua kirjoittamaan Eminemin tyyliin perustavat lyriikat ja sitten jatkojalostamaan siitä bileversion. Toisella työkalulla hän taas äänikloonasi räppärin äänen. Tämän jälkeen lyriikat laitettiin soimaan Eminemin koneäänellä. Prosessiin oli tottakai pyydetty ensin Eminemin lupa. Guettan mukaan tekoäly avaa täysin uusia mahdollisuuksia musiikkibisneksen tulevaisuuteen.

Ääniuutiset kuunneltavissa a.i.materin YouTube-kanavalta:

Kiinnostuitko? Ota Yhteyttä!

Jaa artikkeli

LinkedIn
Twitter
Facebook
Tekstinlouhinta on tekoälypohjainen menetelmä, jolla tekstimassoista löydetään niihin piiloutuvaa tietoa. Kuvassa mies istuu Excelin edessä ja takana vaaleat ruudukkoikkunat kesämaisemalla.
Tekoälypohjaisilla tekstinlouhinnan työkaluilla laajoista tekstimassoista löydetään tekstisisältöön piiloutuvia tärkeitä havaintoja. Parhaimmillaan nämä oivallukset voivat jopa lisätä niitä käyttävien yritysten kilpailuetua.
Mies istuu tietokoneen edessä kuulokkeet päässä. Hän nauhoittaa studiomikkiin puhettaan. Takana on ristikkoikkunat, joista näkyy vihreää luontoa.
Äänen kloonauksella tavoitellaan synteettistä ääntä, joka muistuttaa mahdollisimman paljon alkuperäistä puhujaa. Artikkelissa menetelmän hyödyistä ja syväväärennösten riskeistä.
Mies istuu korituolissa laiturin nokassa ja katsoo merelle. Vieressä on kirjapino, jonka päällä älypuhelin. Miehellä on t-paita päällä ja kuulokkeet päässä.
Aikakausmediat näkevät tärkeimpinä syinä äänisisältöjen tekemiselle nuoren ja uuden yleisön tavoittamisen. Suosituin äänisisällön muoto on podcastit.
Nainen makaa selällään silmät kiinni ja kuulokkeet korvilla, vierellä on lautasellinen pilkottuja hedelmiä.
Koneäänet antavat kuluttajalle mahdollisuuden päättää, missä muodossa haluaa sisältönsä kuluttaa. Samalla lisätään sisällön saavutettavuutta.
Studiolaatuinen mikrofoni. Takana ikkuna, jossa kesäiset maisemat. Pöydällä vaaleanpunainen kesäkukka.
Artikkelissa tutustutaan Microsoftin kehittämään VALL-E -tekoälymalliin, joka pystyy tuottamaan ihmisen äänestä koneääntä vain kolmen sekunnin pohjalta. Sekä Applen uutisiin julkaista äänikirjoja koneäänien lukemina.
Vaalean taustan keskellä iso keltainen ympyrän muotoinen logo, jossa lukee Mediapäivä 2023.
Modernit koneäänet ovat yksi vaihtoehto tehokkaaseen sisältöjen audioittamiseen. Tästä aiheesta kerromme lisää 25.1.2023 järjestettävässä Mediapäivässä.