Tekstinlouhinta on tekoälypohjainen menetelmä, jolla tekstimassoista löydetään niihin piiloutuvaa tietoa. Kuvassa mies istuu Excelin edessä ja takana vaaleat ruudukkoikkunat kesämaisemalla.

Tekstinlouhinta – Tekstisisältöjen hyödyntäminen liiketoiminnassa

Laajoista ja jäsentelemättömistä tekstisisällöistä saadaan purettua nopeammin ja kattavammin tietoa tekoälypohjaisia työkaluja hyödyntäen. Kohteena oleva tekstisisältöjen joukko on laaja: tilauslistat, mielipidetutkimukset, asiakaspalautteet, haastattelut, digitaaliset kirjat, dokumentit ja tiedostot, uutisartikkelit, chat-keskustelut, keskustelupalstat ja somekeskustelut. Tässä artikkelissa tutustutaan tarkemmin, miten strukturoimattomista testimassoista saadaan enemmän irti tekstinlouhinnan työkaluilla.

Tekstinlouhinta (text mining) tarkoittaa jäsentelemättömän tekstisisällön järjestämistä sellaiseen muotoon, että siitä voidaan havaita jotain tärkeää, kuten tiettyjä näkemyksiä, ilmiöitä, kokonaisuuksia tai trendejä, jotka auttavat edelleen tekemään päätöksiä, parantamaan prosesseja, säästämään aikaa, alentamaan kustannuksia tai esimerkiksi ymmärtämään asiakkaiden mieltymyksiä.

Tekstinlouhinnassa NLP:llä (natural languege processing) ja koneoppimisella on tärkeä rooli. NLP:n avulla koneet saadaan ymmärtämään tekstiä ja puhetta samaan tapaan kuin ihmiset. Koneoppimisen avulla taas koneet voidaan kouluttaa tekemään haluttua asiaa tietyllä tavalla, toimimaan jatkossa oppimansa perusteella ja oppimaan siitä taas edelleen.

Tekstinlouhinta auttaa löytämään tietoja, jotka muuten piiloutuisivat massaan

Jäsentämättömän digitaalisen tekstidatan määrä kasvaa koko ajan hurjaa tahtia. Tietomäärää onkin miltei mahdotonta jäsentää kattavasti havaintojen löytämiseksi, jos apuna ei olisi tekstinlouhinnan työkaluja. Tekoälypohjaisten työkalujen avulla tekstisisällöstä voidaan:

  • Huomata ilmiöitä ja trendejä: Suuresta jäsentämättömästä määrästä tekstiä, kuten asiakaspalautteesta, tutkimusdatasta tai somesta havaitaan helpommin ilmiöitä ja trendejä, jotka eivät välttämättä muuten näkyisi.
  • Hahmottaa kokonaisuuksia: Tekstisisällöstä nähdään helpommin eri kokonaisuuksia ja voidaan ymmärtää suhteet ja loogiset yhteydet näiden välillä.
  • Löytää mielipiteitä ja tunteita: Suuresta määrästä tekstidataa löydetään nopeammin, mitä mieltä ihmiset ovat tietystä tuotteesta, brändistä tai asiasta; koetaanko tuote tai brändi positiivisena, negatiivisena vai neutraalina.
  • Tunnistaa aiheita ja teemoja: Datasta löydetään nopeasti pinnalla olevat puheenaiheet. Tämä auttaa tutkimaan viimeisimpiä trendejä ja tunnistamaan mahdollisia ongelmia esimerkiksi  tuotteessa tai tuotantoprosessissa.
  • Luokitella tekstiä: Dataa saadaan nopeasti luokiteltua eri kategorioihin ja ryhmiin, jotka perustuvat tiettyyn sisältöön. Esimerkiksi tutkimushaastattelujen vastaukset voidaan luokitella automaattisesti niissä käytetyn kielen perusteella, tai sen mukaan, mitä mieltä vastaajat ovat.
  • Poimia tietoja: Tekstistä saadaan kerättyä tärkeitä ja eniten käytettyjä avainsanoja. Myös tiettyjä ominaisuuksia voidaan poimia lauseista. Esimerkiksi tekstissä esiintyvät puhelinnumerot, osoitteet, vaatekoot yms. Tai sitten tekstistä voidaan poimia kaikki vierasperäiset sanat; tästä artikkelin viimeisessä kappaleessa lisää!

Päätöksentekoprosessin parantaminen ja asiakasymmärryksen kerääminen

Mielipidetutkimuksissa ja asiakaspalautteissa on usein avoimia kysymyksiä, joihin asiakasta pyydetään kuvailemaan tuotetta myös omin sanoin. Näistä avoimista vastauksista saadaan poimittua arvokkaita oivalluksia, mutta niiden manuaalinen läpikäynti vie paljon aikaa. Tämä sama pätee asiakasarvostelujen, sähköpostien, verkkosivujen palautelomakkeiden ja somejulkaisujen kommenttien läpikäyntiin.

Tekoälypohjaisen työkalun avulla vastauksia voidaan esimerkiksi lajitella automaattisesti negatiivisiin ja positiivisiin, tai poimia niistä tiettyjä asioita, jolloin saadaan kokonaisvaltainen käsitys asiakkaiden suhtautumisesta yrityksen tuotteisiin tai brändiin. Vastaustuloksiin päästään lisäksi reagoimaan nopeammin.

Parhaimmillaan tekstinlouhinnalla saadaan kilpailuetua omalla toimialalla: kehitettyä asiakasymmärrystä, tuotetta, prosessia tai markkinointia.

Muutamia esimerkkejä tekstinlouhinnan mahdollisuuksista:

  • Terveydenhuollossa ja sosiaalipalveluissa: Mahdollisuus analysoida nopeammin terveystietoja ja havaita esimerkiksi lääkkeiden haittavaikutuksia. Tunnistaa tilastollisia riippuvuuksia ja huomata sen perusteella mikä ilmiö tai oire aiheuttaa toisen ilmiön tai oireen taas toisaalla. Näin voidaan nähdä esimerkiksi riskitekijöitä ja suojaavia tekijöitä, jotka voivat auttaa tai nopeuttaa muun muassa tuotekehityksessä.
  • Rahoitus- ja vakuutusalalla: Pystytään analysoimaan uutisartikkeleita ja talousraportteja, havaitsemaan niistä markkinatrendejä ja ennustamaan osakekurssien liikkeitä, sekä tekemään riskianalyysejä. Vakuutusalalla voidaan nopeuttaa käytäntöjen tarkastusta sekä automatisoida korvausvaatimuksia ja riskisuunnittelua.
  • Kaupan alalla ja teollisuudessa: Asiakaspalautteiden ja -arvostelujen analysointi asiakasymmärryksen lisäämiseksi, tuoteongelmien löytäminen, markkinoinnin optimointi ja asiakaspalvelun kehittäminen. Tekstinlouhinta nopeuttaa lisäksi tilauslistojen luokittelussa ja käsittelyssä sekä valmistus- ja toimitusongelmien tunnistamisessa.

Hakukone koneoppimispohjaisella elementillä

Tekstinlouhinta mahdollistaa myös hakukoneiden olemassaolon; internetin valtavasta määrästä löydetään nopeasti ja tarkasti haluttua tietoa. Hakukoneisiin saadaan liitettyä koneoppimispohjaisia elementtejä, jolloin tekstistä saadaan haettu tietoja esimerkiksi tiettyjen teemojen ja aiheiden mukaan.

Näin toimii myös kehittämämme Erin-työkalu, joka poimii digitaalisesta tekstistä vierasperäiset sanat automaattisesti. Tämä hyödyttää kustantamoita ja studioita, jotka tuottavat äänikirjoja. Äänikirjan lukijalle tehtävät lausumisohjeet valmistuvat tekoälypohjaista työkalua käyttäen huomattavasti nopeammin kuin tapauksessa, jossa kaikki vierasperäiset sanat etsittäisiin kirjasta ensin manuaalisesti; Erin-työkalu etsii sanat noin vartissa, kun taas ihmiseltä tähän kuluisi noin työpäivän verran aikaa. Vastaavanlaisilla työkaluilla voidaan siis muuttaa manuaalisia prosesseja paljon kustannustehokkaammiksi.

Pystymme toteuttamaan monipuolisesti erilaisia tekoälypohjaisia kieliteknologian ratkaisuja, joilla säästetään työaikaa ja helpotetaan halutun tiedon löytymistä tekstimassoista. Ota yhteyttä!

Kiinnostuitko? Ota Yhteyttä!

Jaa artikkeli

LinkedIn
Twitter
Facebook
Nainen istuu kesällä puutarhassa taidemaalaustarvikkeiden kanssa. Päässä on kuulokkeet.
Yhdysvalloissa parhaillaan käynnissä olevassa näyttelijöiden ja käsikirjoittajien lakossa on kysymys myös tekoälyn käytöstä. Huolenaiheet koskevat muun muassa työpaikkoja ja taiteellista luovuutta.
Keskellä lukee toukokuun ääniuutiset. Taustalla kuva kuulokkeista kirjapinon päällä, kuulokkeiden vieressä on juomalasi, jossa sitruunaviipale ja kukkiva omenapuun oksa.
Toukokuun ääniuutisten aiheina Google Bard, Metan uusi kielimalli, Applen uudet saavutettavuusominaisuudet, kielivähemmistöille suunnattu chatbot ja älykkäät NPC:t.
Nainen istuu auton etupenkillä kuulokkeet päässä ja pädi sylissä.
Tekoäly ja kieliteknologia mahdollistavat uudenlaisia ja kiinnostavampia tapoja oppia uusia kieliä. Esimerkiksi kieltenoppimissovellukset hyödyntävät luonnollisen kielen käsittelyä.
Keskellä lukee huhtikuun ääniuutiset. Taustalla kuva henkilöstä kuulokkeet päässä ja avonaisesta kirjasta lattialla. Henkilö tekee muistiinpanoja postit-lappuun.
Kokosimme yhteen artikkeliin huhtikuun kiinnostavimmat puheteknologiauutiset maailmalta. Aiheina muun muassa AutoGPT, äänikloonien teko artistien äänistä, älysilmälasit ja tekoälyuutisankkurit.
Nainen makaa ylhäältäpäin otetussa valokuvassa sohvalla silmät kiinni, kuulokkeet päässä ja hymyilee.
Suomalaisten lukuharrastusta tutkittiin Kirjakauppaliiton ja Suomen Kustannusyhdistyksen teettämässä Suomi lukee 2023 -tutkimuksessa. Artikkelissa katsaus tutkimukseen ääni- ja sähkökirjojen osalta sekä Suomen Kustannusyhdistyksen todelliset myyntitilastot vuodelta 2022.
Aimaterin työntekijä Antti Virtanen kuvattuna ylhäältä, istumassa tietokoneen äärellä.
Mikä on GPT ja mihin sitä voidaan käyttää? Miten ChatGPT on kehitetty? a.i.materin koneoppimisinsinööri Antti Virtanen kirjoitti näistä kysymyksistä ja GPT:n kehityshistoriasta asiantuntija-artikkelin.