Usein kysytyt kysymykset

Informaatiota ja vastauksia puheteknologiaan ja palveluihimme liittyen

Puheteknologian avulla voidaan käsitellä ihmisen puhetta erilaisilla menetelmillä. Puheteknologia mahdollistaa ihmisen puheen analysoinnin ja ymmärtämisen, mutta myös ihmismäisen koneäänen tuottamisen. Puheteknologiaa voidaan hyödyntää muun muassa äänisisältöjen tuottamisessa tai erilaisten ohjelmistojen ja työkalujen muodossa, jotka ratkaisevat ja tehostavat ihmiselle puuduttavia toimenpiteitä. Puheteknologian ratkaisujen avulla saavutetaan huomattavaa ajansäästöä ja luodaan digitaalisten sisältöjen saavutettavuutta.

Kieliteknologia kattaa puheteknologian lisäksi myös tekstinä esitetyn kielen analysoinnin. Kieliteknologian menetelmien ja työkalujen avulla puhe- tai tekstidataa pystytään jäsentämään tietokoneella käsiteltävään muotoon. Esimerkkejä kieliteknologiasta ovat hakukoneet, tiedonhaku sekä tekstin ja tiedon luokittelut.

Puhesynteesi on ihmismäisen puheäänen tuottamista koneellisesti. Yleensä puhetta tuotetaan syötteenä saadun tekstin pohjalta eli kone lukee tekstin ääneen. Nykyaikaiset puhesynteesijärjestelmät pohjautuvat koneoppimismenetelmiin, jotka jäljittelevät ihmismäistä puhetta kuulemansa perusteella.

Puheentunnistuksen avulla voidaan muuntaa ihmispuhetta tekstimuotoon. Käyttämämme puheentunnistusjärjestelmät perustuvat koneoppimismenetelmiin.

  • Lyhenne AI tulee englannin kielen sanoista artificial intelligence, suomeksi tekoäly.
  • NLP on lyhenne sanoille Natural Language Processing, suomeksi luonnollisen kielen käsittely – kieliteknologia on miltei synonyymi tälle termille.
  • TTS on lyhenne sanoille text to speech ja STT puolestaan sanoille speech to text. Eli suomeksi teksti puheeksi (puhesynteesi) ja puhe tekstiksi (puheentunnistus).
  • LLM lyhenne tulee sanoista large language model, eli suuri kielimalli. ChatGPT on esimerkki suuresta kielimallista.

Verkkosivulukija on tarkoitettu erityisesti julkisille toimijoille, joita velvoittaa saavutettavuusdirektiivi ja kielilaki, mutta myös muille toimijoille, jotka haluavat tarjota verkkosivuvierailijoilleen parempaa käyttäjäkokemuksta.

Verkkosivusi lähdekoodiin lisätään yhden rivin mittainen koodinpätkä. Tämän lisäksi on tärkeää miettiä, mitkä sisällöt verkkosivuilla halutaan ääneen luettuna. Tämä sisältö täytyy olla jollain tunnisteella merkittyä.

Suomi, suomenruotsi ja englanti. Muitakin kieliä on mahdollista ottaa käyttöön, mutta olethan näistä toiveista aina erikseen meihin yhteydessä.

Voit. Toisto jatkuu niin kauan kuin alkuperäinen, ääntä toistava välilehti on auki.

Voit. Tämä saattaa kuitenkin vaihdella käyttäjän laitteen mukaan siten, että osa käyttöjärjestelmistä ei salli äänen toistoa ruudun ollessa pimeänä.

a.i.mater kehittää parhaillaan työkaluja myös äänikirjojen tekemiseksi puhesynteesillä. Ota yhteyttä, niin keskustellaan asiasta lisää!

Voit lukea äänirajapintadokumentaation osoitteessa https://api.aimater.com/static/docs/site/index.html. Mikäli sinulla on vielä lisää kysyttävää API:n käyttöönotosta, ole meihin yhteyksissä.

a.i.mater pyrkii luomaan mahdollisimman kattavan tekstin esikäsittelysäännöstön, joka osaisi avata lyhenteet ja vierasperäiset termit oikein foneettiseen muotoonsa. Säännöstöstä on kuitenkin mahdotonta tehdä kaikenkattava. Niin numeroyhdistelmistä (esim. urheilutulokset), lyhenteistä (vrt. IBM ja NATO) kuin vierasperäisistäkin sanoista ja nimistä löytyy aina uusia esimerkkejä, joihin ei ennen olla törmätty.

  • Voit lisätä taukoja käyttämällä tekstissäsi pilkkua tai pistettä.
  • TTS-API tukee taukojen lisäämistä SSML-tägien avulla.
  • Ääniverstaassa saat ylimääräisiä taukoja luentaan käyttämällä ###BREAK -tägiä.

Voit! Ota yhteyttä meihin niin keskustellaan käyttötarkoituksesta, kloonaamisesta yleisesti ja hinnoittelusta.

Jaamme asiakkaidemme dataa vain varmuuskopiointi-yhteistyökumppanimme kanssa, salatussa muodossa. Tämäkin toimija on suomalainen, joten dataa ei lähtökohtaisesti jaeta Suomen ulkopuolelle.

Syväluotaavampaa sisältöä

Blogistamme löydät alan tuoreimpia kiinnostavia artikkeleita

Läppäri, jonka näppäimistön päällä on kuulokkeet. Läppärin näytössä on eepressin etusivu.
2.4.2024
Konenäköä ja puhesynteesiä yhdistäneessä projektissa kehitimme ePress-näköislehtipalvelulle pipelinen, joka pystyy tunnistamaan näköislehtien artikkelit ja toimittamaan niistä ääniversiot.
Kuulokkeet tietokonepöydän päällä.
14.3.2024
Yle on ottanut käyttöön a.i.materin kehittämän kuuntelumahdollisuuden uutissivuilleen. Kuunteluominaisuus parantaa palvelun digitaalista saavutettavuutta.
Aimaterin työntekijät Roope ja Niko tutkivat työpöydän edessä tietokoneelta jotain. Roope juuri osoittaa kädellään näyttöä.
28.2.2024
Artikkelissa esitellään ja vertaillaan verkkosivulukijaa ja äänirajapintaa: miten ne toimivat ja mikä tapa sopii mihinkin tarkoitukseen.
Läppäri, jonka näppäimistön päällä on kuulokkeet. Läppärin näytössä on eepressin etusivu.
2.4.2024
Konenäköä ja puhesynteesiä yhdistäneessä projektissa kehitimme ePress-näköislehtipalvelulle pipelinen, joka pystyy tunnistamaan näköislehtien artikkelit ja toimittamaan niistä ääniversiot.
Kuulokkeet tietokonepöydän päällä.
14.3.2024
Yle on ottanut käyttöön a.i.materin kehittämän kuuntelumahdollisuuden uutissivuilleen. Kuunteluominaisuus parantaa palvelun digitaalista saavutettavuutta.