Usein kysytyt kysymykset

Informaatiota ja vastauksia puheteknologiaan ja palveluihimme liittyen

Puheteknologian avulla voidaan käsitellä ihmisen puhetta erilaisilla menetelmillä. Puheteknologia mahdollistaa ihmisen puheen analysoinnin ja ymmärtämisen, mutta myös ihmismäisen koneäänen tuottamisen. Puheteknologiaa voidaan hyödyntää muun muassa äänisisältöjen tuottamisessa tai erilaisten ohjelmistojen ja työkalujen muodossa, jotka ratkaisevat ja tehostavat ihmiselle puuduttavia toimenpiteitä. Puheteknologian ratkaisujen avulla saavutetaan huomattavaa ajansäästöä ja luodaan digitaalisten sisältöjen saavutettavuutta.

Kieliteknologia kattaa puheteknologian lisäksi myös tekstinä esitetyn kielen analysoinnin. Kieliteknologian menetelmien ja työkalujen avulla puhe- tai tekstidataa pystytään jäsentämään tietokoneella käsiteltävään muotoon. Esimerkkejä kieliteknologiasta ovat hakukoneet, tiedonhaku sekä tekstin ja tiedon luokittelut.

Puhesynteesi on ihmismäisen puheäänen tuottamista koneellisesti. Yleensä puhetta tuotetaan syötteenä saadun tekstin pohjalta eli kone lukee tekstin ääneen. Nykyaikaiset puhesynteesijärjestelmät pohjautuvat koneoppimismenetelmiin, jotka jäljittelevät ihmismäistä puhetta kuulemansa perusteella.

Puheentunnistuksen avulla voidaan muuntaa ihmispuhetta tekstimuotoon. Käyttämämme puheentunnistusjärjestelmät perustuvat koneoppimismenetelmiin.

  • Lyhenne AI tulee englannin kielen sanoista artificial intelligence, suomeksi tekoäly.
  • NLP on lyhenne sanoille Natural Language Processing, suomeksi luonnollisen kielen käsittely – kieliteknologia on miltei synonyymi tälle termille.
  • TTS on lyhenne sanoille text to speech ja STT puolestaan sanoille speech to text. Eli suomeksi teksti puheeksi (puhesynteesi) ja puhe tekstiksi (puheentunnistus).
  • LLM lyhenne tulee sanoista large language model, eli suuri kielimalli. ChatGPT on esimerkki suuresta kielimallista.

Verkkosivulukija on tarkoitettu erityisesti julkisille toimijoille, joita velvoittaa saavutettavuusdirektiivi ja kielilaki, mutta myös muille toimijoille, jotka haluavat tarjota verkkosivuvierailijoilleen parempaa käyttäjäkokemuksta.

Verkkosivusi lähdekoodiin lisätään yhden rivin mittainen koodinpätkä. Tämän lisäksi on tärkeää miettiä, mitkä sisällöt verkkosivuilla halutaan ääneen luettuna. Tämä sisältö täytyy olla jollain tunnisteella merkittyä.

Suomi, suomenruotsi ja englanti. Muitakin kieliä on mahdollista ottaa käyttöön, mutta olethan näistä toiveista aina erikseen meihin yhteydessä.

Voit. Toisto jatkuu niin kauan kuin alkuperäinen, ääntä toistava välilehti on auki.

Voit. Tämä saattaa kuitenkin vaihdella käyttäjän laitteen mukaan siten, että osa käyttöjärjestelmistä ei salli äänen toistoa ruudun ollessa pimeänä.

a.i.mater kehittää parhaillaan työkaluja myös äänikirjojen tekemiseksi puhesynteesillä. Ota yhteyttä, niin keskustellaan asiasta lisää!

Voit lukea äänirajapintadokumentaation osoitteessa https://api.aimater.com/static/docs/site/index.html. Mikäli sinulla on vielä lisää kysyttävää API:n käyttöönotosta, ole meihin yhteyksissä.

a.i.mater pyrkii luomaan mahdollisimman kattavan tekstin esikäsittelysäännöstön, joka osaisi avata lyhenteet ja vierasperäiset termit oikein foneettiseen muotoonsa. Säännöstöstä on kuitenkin mahdotonta tehdä kaikenkattava. Niin numeroyhdistelmäistä (esim. urheilutulokset), lyhenteistä (vrt. IBM ja NATO) kuin vierasperäisistäkin sanoista ja nimistä löytyy aina uusia esimerkkejä, joihin ei ennen olla törmätty.

  • Voit lisätä taukoja käyttämällä tekstissäsi pilkkua tai pistettä.
  • TTS-API tukee taukojen lisäämistä SSML-tägien avulla.
  • Ääniverstaassa saat ylimääräisiä taukoja luentaan käyttämällä ###BREAK -tägiä.

Voit! Ota yhteyttä meihin niin keskustellaan käyttötarkoituksesta, kloonaamisesta yleisesti ja hinnoittelusta.

Jaamme asiakkaidemme dataa vain varmuuskopiointi-yhteistyökumppanimme kanssa, salatussa muodossa. Tämäkin toimija on suomalainen, joten dataa ei lähtökohtaisesti jaeta Suomen ulkopuolelle.

Syväluotaavampaa sisältöä

Blogistamme löydät alan tuoreimpia kiinnostavia artikkeleita

Lähikuva kädestä, joka on tietokoneen hiiren päällä. Taustalla näppäimistä, kaksi näyttöä, läppärin kulma ja kahvimuki.
29.11.2023
Turun yliopiston tutkimusryhmä TurkuNLP on avannut sivuston, jonka kautta sinäkin voit osallistua suomenkielisen keskustelevan tekoälyn kehitykseen. Artikkelissa avataan enemmän kielimallien kehityksen taustoja.
Nainen makoilee sängyllä kuulokkeet päässä, katselee vieressä olevaa kulhollista hedelmiä.
29.9.2023
Käydään läpi digiaudiotutkimusta, jossa syvennytään suomalaisten kuuntelutottumuksiin. Vastauksissa näkyy, miten digiaudion kuuntelusta on tullut valtavirtaa.
Nainen istuu kesällä puutarhassa taidemaalaustarvikkeiden kanssa. Päässä on kuulokkeet.
14.9.2023
Yhdysvalloissa parhaillaan käynnissä olevassa näyttelijöiden ja käsikirjoittajien lakossa on kysymys myös tekoälyn käytöstä. Huolenaiheet koskevat muun muassa työpaikkoja ja taiteellista luovuutta.
Lähikuva kädestä, joka on tietokoneen hiiren päällä. Taustalla näppäimistä, kaksi näyttöä, läppärin kulma ja kahvimuki.
29.11.2023
Turun yliopiston tutkimusryhmä TurkuNLP on avannut sivuston, jonka kautta sinäkin voit osallistua suomenkielisen keskustelevan tekoälyn kehitykseen. Artikkelissa avataan enemmän kielimallien kehityksen taustoja.
Nainen makoilee sängyllä kuulokkeet päässä, katselee vieressä olevaa kulhollista hedelmiä.
29.9.2023
Käydään läpi digiaudiotutkimusta, jossa syvennytään suomalaisten kuuntelutottumuksiin. Vastauksissa näkyy, miten digiaudion kuuntelusta on tullut valtavirtaa.