Usein kysytyt kysymykset

Informaatiota ja vastauksia puheteknologiaan ja palveluihimme liittyen

Puheteknologian avulla voidaan käsitellä ihmisen puhetta erilaisilla menetelmillä. Puheteknologia mahdollistaa ihmisen puheen analysoinnin ja ymmärtämisen, mutta myös ihmismäisen koneäänen tuottamisen. Puheteknologiaa voidaan hyödyntää muun muassa äänisisältöjen tuottamisessa tai erilaisten ohjelmistojen ja työkalujen muodossa, jotka ratkaisevat ja tehostavat ihmiselle puuduttavia toimenpiteitä. Puheteknologian ratkaisujen avulla saavutetaan huomattavaa ajansäästöä ja luodaan digitaalisten sisältöjen saavutettavuutta.

Kieliteknologia kattaa puheteknologian lisäksi myös tekstinä esitetyn kielen analysoinnin. Kieliteknologian menetelmien ja työkalujen avulla puhe- tai tekstidataa pystytään jäsentämään tietokoneella käsiteltävään muotoon. Esimerkkejä kieliteknologiasta ovat hakukoneet, tiedonhaku sekä tekstin ja tiedon luokittelut.

Puhesynteesi on ihmismäisen puheäänen tuottamista koneellisesti. Yleensä puhetta tuotetaan syötteenä saadun tekstin pohjalta eli kone lukee tekstin ääneen. Nykyaikaiset puhesynteesijärjestelmät pohjautuvat koneoppimismenetelmiin, jotka jäljittelevät ihmismäistä puhetta kuulemansa perusteella.

Puheentunnistuksen avulla voidaan muuntaa ihmispuhetta tekstimuotoon. Käyttämämme puheentunnistusjärjestelmät perustuvat koneoppimismenetelmiin.

  • Lyhenne AI tulee englannin kielen sanoista artificial intelligence, suomeksi tekoäly.
  • NLP on lyhenne sanoille Natural Language Processing, suomeksi luonnollisen kielen käsittely – kieliteknologia on miltei synonyymi tälle termille.
  • TTS on lyhenne sanoille text to speech ja STT puolestaan sanoille speech to text. Eli suomeksi teksti puheeksi (puhesynteesi) ja puhe tekstiksi (puheentunnistus).
  • LLM lyhenne tulee sanoista large language model, eli suuri kielimalli. ChatGPT on esimerkki suuresta kielimallista.

Verkkosivulukija on tarkoitettu erityisesti julkisille toimijoille, joita velvoittaa saavutettavuusdirektiivi ja kielilaki, mutta myös muille yrityksille ja organisaatioille, jotka haluavat tarjota verkkosivuvierailijoilleen parempaa käyttäjäkokemusta.

Verkkosivulukijan avulla sivustolla vierailevat käyttäjät voivat kuunnella sivujen sisällöt ääneen napin painalluksella. Kuunteluominaisuus lisää käyttömukavuutta ja parantaa erityisesti heikomman näkö-, luku- tai kielitaidon omaavien verkkosivuvierailijoiden palvelukokemusta ja tiedon itsenäistä hankintaa. Myös iäkkäiden henkilöiden toimimista digitaalisessa palvelussa helpottaa se, että tekstisisällöt voi halutessaan kuunnella.

Verkkosivusi lähdekoodiin lisätään yhden rivin mittainen koodinpätkä. Tämän lisäksi on tärkeää miettiä, mitkä sisällöt verkkosivuilla halutaan ääneen luettuna. Tämä sisältö täytyy olla jollain tunnisteella merkittyä. Yksityiskohtaiset käyttöönotto-ohjeet pääset lukemaan tästä dokumentaatiosta: https://api.aimater.com/static/docs/reader/asiakkaan-ohjeet/

Ole meihin yhteyksissä, niin saat omat kirjautumistunnuksesi asiakasportaaliin! Asiakasportaalissa pääset muun muassa ottamaan verkkosivulukijan käyttöön, seuraamaan tilastoja kuuntelumääristä, tekemään lausumisohjeita sekä muokkaamaan soittimen ulkonäköä ja sijaintia.

Saat omat käyttäjätunnukset asiakasportaaliin, josta pystyt näkemään päivittäistä ja kuukausittaista tilastoa kuuntelumääristä. Näet montako kertaa kuuntelu on aloitettu ja kuinka pitkälle kuuntelua on tehty eli kuunteluprosentin.

Samasta asiakasportaalista pääset myös tekemään lausumisohjeita ja muokkaamaan soitinta.

Suomi, suomenruotsi ja englanti. Muitakin kieliä on mahdollista ottaa käyttöön, mutta olethan näistä toiveista aina erikseen meihin yhteydessä.

Voit. Toisto jatkuu niin kauan kuin alkuperäinen, ääntä toistava välilehti on auki.

Voit. Tämä saattaa kuitenkin vaihdella käyttäjän laitteen mukaan siten, että osa käyttöjärjestelmistä ei salli äänen toistoa ruudun ollessa pimeänä.

a.i.mater kehittää parhaillaan työkaluja myös äänikirjojen tekemiseksi puhesynteesillä. Ota yhteyttä, niin keskustellaan asiasta lisää!

Voit lukea äänirajapintadokumentaation osoitteessa https://api.aimater.com/static/docs/site/. Mikäli sinulla on vielä lisää kysyttävää TTS-API:n eli äänirajapinnan käyttöönotosta, ole meihin yhteyksissä.

a.i.mater pyrkii luomaan mahdollisimman kattavan tekstin esikäsittelysäännöstön, joka osaisi avata lyhenteet ja vierasperäiset termit oikein foneettiseen muotoonsa. Säännöstöstä on kuitenkin mahdotonta tehdä kaikenkattava. Niin numeroyhdistelmistä (esim. urheilutulokset), lyhenteistä (vrt. IBM ja NATO) kuin vierasperäisistäkin sanoista ja nimistä löytyy aina uusia esimerkkejä, joihin ei ennen olla törmätty. Sanapankkia kasvatetaan jatkuvasti.

Kun verkkosivuillasi tai sovelluksessasi on käytössä a.i.materin verkkosivulukija tai äänirajapinta, pääset itse tekemään asiakasportaalin kautta sanoille lausumisohjeita. Asiakasportaalista löydät ohjeet sanojen avaamisesta lausumismuotoonsa; esimerkiksi lyhenne IBM tulisi avata muotoon iibee-äm. Mahdollisuus muokata koneäänen lausumista on hyödyksi varsinkin silloin, kun tekstisisällöissäsi toistuu erikoissanastoa tai lyhenteitä.

  • Voit lisätä taukoja käyttämällä tekstissäsi pilkkua tai pistettä.
  • Äänirajapinta tukee taukojen lisäämistä SSML-tägien avulla.
  • Ääniverstaassa saat ylimääräisiä taukoja luentaan käyttämällä ###BREAK -tägiä.

Voit! Ota yhteyttä meihin niin keskustellaan käyttötarkoituksesta, kloonaamisesta yleisesti ja hinnoittelusta.

Jaamme asiakkaidemme dataa vain varmuuskopiointi-yhteistyökumppanimme kanssa, salatussa muodossa. Tämäkin toimija on suomalainen, joten dataa ei lähtökohtaisesti jaeta Suomen ulkopuolelle.

Syväluotaavampaa sisältöä

Blogistamme löydät alan tuoreimpia kiinnostavia artikkeleita

Kaksi henkilöä istuvat sohvalla läppärit sylissä. Kasvot on rajattu pois kuvasta.
9.9.2024
Digipalvelulaki ja esteettömyysdirektiivi laajenevat kesäkuussa 2025. Artikkelissa kerrotaan, keitä laki koskee myös jatkossa ja mitä saavutettavuusvaatimukset käytännössä ovat. Erityishuomiota kiinnitetään sähkö- ja äänikirjoihin.
Mies istuu toimistolla työpöytänsä ääressä. Valokuva on otettu takaapäin, joten kuvassa näkyy henkilön selkä ja tietokoneen näytöt, takana näkyy sumealla muuta toimistoa.
16.8.2024
Case-esimerkki Ylelle toteutetusta kieliteknologian projektista, jossa hyödynnettiin CLIP-tekoälymallia kuvahaun sujuvoittamiseen materiaaliarkistoista.
Nainen istuu ulkona maalaustelineen kanssa ja katsoo juuri väripalettia kädessään. Taustalla on abstrakti maalaus. Valo tulee naisen takaa, joten hänen hiukset korostuvat muuten tummasta kuvasta. Naisella on kuulokkeet korvilla.
13.6.2024
Käsittelyssä kielimuurien häviäminen, henkilökohtaisemmat ääniassistentit, älykodit, äänikloonit, tekoälyllä tuotettava musiikki, median kulutus, terveyssovellukset, asiakaspalvelu, biometrinen tunnistautuminen ja smart city -ajatus.
Kaksi henkilöä istuvat sohvalla läppärit sylissä. Kasvot on rajattu pois kuvasta.
9.9.2024
Digipalvelulaki ja esteettömyysdirektiivi laajenevat kesäkuussa 2025. Artikkelissa kerrotaan, keitä laki koskee myös jatkossa ja mitä saavutettavuusvaatimukset käytännössä ovat. Erityishuomiota kiinnitetään sähkö- ja äänikirjoihin.
Mies istuu toimistolla työpöytänsä ääressä. Valokuva on otettu takaapäin, joten kuvassa näkyy henkilön selkä ja tietokoneen näytöt, takana näkyy sumealla muuta toimistoa.
16.8.2024
Case-esimerkki Ylelle toteutetusta kieliteknologian projektista, jossa hyödynnettiin CLIP-tekoälymallia kuvahaun sujuvoittamiseen materiaaliarkistoista.