Studiomikrofoni ja taustalla valoisa ikkuna.

Litterointi on työläs prosessi – Automaattinen puheentunnistus apuna

Litterointi on hidasta ja uuvuttavaa työtä. Äänitteen sisällöstä ja litteroinnin tarkkuudesta riippuen ihmiseltä menee sen tekemiseen 4–12 tuntia per tunnin äänite. Litteroinnin avuksi kannattaa ottaa automaattinen puheentunnistus, jolloin kone hoitaa litteroinnin ja ihmisen tehtäväksi jää viimeistely.

Litterointi tarkoittaa ääni- tai videotallenteen kirjoittamista tekstimuotoon. Hyvän litteroinnin ansiosta alkuperäiseen aineistoon ei tarvitse palata, vaan tekstimuotoisesta aineistosta voidaan hahmottaa kokonaisuus nopeallakin silmäilyllä.

Litterointia käytetään yleisesti mediatoimituksissa, korkeakouluissa ja tutkimuslaitoksissa, terveystaloissa, asianajotoimistoissa, sekä virastojen ja järjestöjen toiminnassa.

Litteroinnin tasot

Litterointi tapahtuu kuuntelemalla tallennetta ja kirjoittamalla sisältö ylös. Tämä voidaan tehdä useammalla tarkkuustasolla:

  • Tarkimmassa mahdollisessa, eksaktissa litteroinnissa kaikki toistetaan tekstissä sanatarkasti mukaan lukien täytesanat (niiku, tota, no), äännähdykset (hmm, öö, naurahdus) sekä taustalta kuuluvat äänet (puhelin soi, koira haukkuu)
  • Peruslitteroinnissa edellä luetellut jätetään pois, mutta muuten kirjoitetaan kaikki puhe niin kuin puhujat puhekielellään puhuvat
  • Yleiskielisessä litteroinnissa murteet jätetään pois ja puhe kirjoitetaan kirjakielellä
  • Selkokielisessä litteroinnissa puhe muutetaan kirjakielellä ja vaikeimpia lauserakenteita selkeytetään
  • Osittaisessa litteroinnissa vain aiheeseen liittyvä sisältö kirjoitetaan ylös ja sivuraiteille menevät puheet jätetään tekstistä pois
  • Referoivassa litteroinnissa tallenteesta tehdään pelkät tiivistävät muistiinpanot esimerkiksi ranskalaisin viivoin
  • Käännöslitteroinnissa tallenne puretaan suoraan halutulle vieraalle kielelle

Litteroitavasta aineistosta voidaan tehdä uusia huomioita

Litteroitavat aineistot ovat saneluja, haastatteluja, lausuntoja, asioiden valmisteluja, luentoja ja seminaareja, muistioita ja pöytäkirjoja sekä juridisia aineistoja, kuten oikeudenkäyntinauhoitteita ja sovittelutilaisuuksia.

Nämä tekstimuotoon siirrettävät aineistot muodostavat uuden tietolähteen, jossa puhemassasta saa asian selville nopealla silmäilyllä. Aineistosta pystyy tekemään tärkeitä syvällisempiä havaintoja, tulkintoja, järjestelyjä, luokitteluja, hakutoiminnon käyttöä, sekä yhtäläisyyksien ja eroavaisuuksien löytämisiä.

Litterointiprosessin yleisimpiä ongelmia ovat:

  • menetelmän hitaus, jota epäselvä puhe ja taustameteli hidastavat entisestään
  • ruuhkahuiput, jolloin äänitiedostojen purkamiset viivästyvät
  • litteroitsijan osaamisesta johtuvat kirjoitusvirheet ja alan sanastoon liittyvien termien hallitsemattomuus.

Automaattisen puheentunnistuksen käyttäminen nopeuttaa tekstimuotoon saattamista merkittävästi:

Litterointi tukee saavutettavuutta

Puhesisältöjen siirtäminen tekstimuotoon on aiemmin mainittujen hyötyjen lisäksi saavutettavuutta tukevaa.

Saavutettavuusdirektiivin vaatimusten mukaan videoissa ja äänitteissä oleva tieto on oltava tekstimuodossa 14 vuorokauden kuluttua julkaisemisesta, joko verkkosivun omana tekstisisältönä tai erillisenä saavutettavana tiedostona.

Podcastit ovat uusi litteroinnin kohde perinteisten aineistojen rinnalle. Niille tehdään mahdollisimman tarkka tekstivastine, joka sisältää puheet, olennaiset muut äänet, kuten musiikki ja nauru, puhujien jaottelun, kappalejaon sekä mahdollisen tiivistelmän sisällöstä. Automaattinen puheentunnistus nopeuttaa huomattavasti sellaisten podcastien litterointia, joita ei ole etukäteen käsikirjoitettu.

Suomenkielinen puheentunnistus ja automaattinen litterointi

Suomenkielellä automaattinen puheentunnistus toimii jo kelvollisesti, kun puhe on selkeää eikä taustamelua ole merkittävästi. Virheiden korjaamiseen on kuitenkin syytä varautua. Parempiin lopputuloksiin päästään, kun käytössä on puheentunnistusmalli, joka voidaan mukauttaa käyttäjän puheeseen ja toimialan sanastoon, jolloin puheentunnistuksen laatu paranee merkittävästi jo lyhyen käytön jälkeen.

Haastavimpia puheentunnistuksessa ovat keskustelulliset tilanteet, joissa puhe on katkonaista ja keskustelijat saattavat puhua toistensa päälle.

Puheentunnistusteknologia ja ohjelmistojen suomenkielen ymmärtäminen kehittyvät koko ajan paremmiksi. Puheentunnistusta hyödyntäen litterointia voidaan nopeuttaa automaattisella purkamisella. Aikaa säästetään tunneilla, kun kone tekee alustavan tekstiluonnoksen, jonka ihminen lopuksi editoi ja viimeistelee arkistoitavaan muotoonsa.

Meiltä onnistuvat laadukkaat ja tarpeisiisi räätälöidyt puheesta tekstiksi -palvelut, ota yhteyttä! 

Kiinnostuitko? Ota Yhteyttä!

Jaa artikkeli

Kuulokkeet tietokonepöydän päällä.
14.3.2024
Yle on ottanut käyttöön a.i.materin kehittämän kuuntelumahdollisuuden uutissivuilleen. Kuunteluominaisuus parantaa palvelun digitaalista saavutettavuutta.
Aimaterin työntekijät Roope ja Niko tutkivat työpöydän edessä tietokoneelta jotain. Roope juuri osoittaa kädellään näyttöä.
28.2.2024
Artikkelissa esitellään ja vertaillaan verkkosivulukijaa ja äänirajapintaa: miten ne toimivat ja mikä tapa sopii mihinkin tarkoitukseen.
Lähikuva kädestä, joka on tietokoneen hiiren päällä. Taustalla näppäimistä, kaksi näyttöä, läppärin kulma ja kahvimuki.
29.11.2023
Turun yliopiston tutkimusryhmä TurkuNLP on avannut sivuston, jonka kautta sinäkin voit osallistua suomenkielisen keskustelevan tekoälyn kehitykseen. Artikkelissa avataan enemmän kielimallien kehityksen taustoja.
Selko Digitalin logo, jossa silmä ja teksti Selko Digital.
19.6.2023
Saavutettavuuteen erikoistunut yhteistyökumppanimme Selko Digital avaa vieraskynäblogissa koneäänien ja puheentunnistuksen vaikutusta digimaailman yhdenvertaisuuteen.
Keskellä lukee toukokuun ääniuutiset. Taustalla kuva kuulokkeista kirjapinon päällä, kuulokkeiden vieressä on juomalasi, jossa sitruunaviipale ja kukkiva omenapuun oksa.
31.5.2023
Toukokuun ääniuutisten aiheina Google Bard, Metan uusi kielimalli, Applen uudet saavutettavuusominaisuudet, kielivähemmistöille suunnattu chatbot ja älykkäät NPC:t.
Nainen istuu auton etupenkillä kuulokkeet päässä ja pädi sylissä.
17.5.2023
Tekoäly ja kieliteknologia mahdollistavat uudenlaisia ja kiinnostavampia tapoja oppia uusia kieliä. Esimerkiksi kieltenoppimissovellukset hyödyntävät luonnollisen kielen käsittelyä.