Lahjoita Puhetta -aineiston käsittelyyn liittyvä tietosuojaseloste

Rekisterinpitäjä

a.i.mater oy, 1900079-9, Kairiskulmantie 12, 20760 Piispanristi

Rekisterinpitäjän tietosuojavastaavan yhteystiedot

Lauri Falck, lauri.falck@aimater.com, 0407257050

Henkilötietojen käsittelyn tarkoitus ja oikeusperuste

Palveluiden tuottaminen ja kehittäminen

Kehitämme Ohjelmistoa, jonka avulla asiakkaamme voi luoda äänikloonin omistamastaan äänestä, esimerkiksi uutissisältönsä lukemiseksi.

Ohjelmiston toimittajana ja siihen liittyvien palveluiden tarjoajana a.i.materilla on itsenäisiä tarpeita käsitellä Lahjoita Puhetta -aineistoon sisältyviä henkilötietoja. Käsittelemme henkilötietoja yksinomaan Ohjelmiston kehittämiseksi ja testaamiseksi. Aineistossa olevia ääniä ei ole tarkoitus tarjota Ohjelmistoa käyttävien tahojen käyttöön, vaan puhetta käytetään yksinomaan Ohjelmiston pohjalla olevan koneoppimismallin koulutukseen. Tämän mallin tarkoitus on mahdollistaa äänikloonin luominen lyhyestä, asiakkaan omistamasta ja itse Ohjelmistoon lataamasta lähtömateriaalista.

Käytämme Lahjoita Puhetta -aineistoa yllä kuvaillun kaltaisen palvelun tuottamiseen, laadun varmistamiseen, kehittämiseen ja turvallisuuden takaamiseen. Kyseisenlaisen ohjelmiston kehittäminen vaatii koulutusmateriaaliksi luonnollista puhetta mahdollisimman monelta eri puhujalta.

Henkilötietojen käsittely edellä mainittuihin tarkoituksiin perustuu seuraaviin GDPR:n mukaisiin oikeusperusteisiin:

  • a.i.materille syntyy ohjelmistotoimittajan roolissa oikeutettu etu, joka liittyy kiinteästi edellä lueteltuihin käsittelyn tarkoituksiin ja joiden toteuttamiseksi on välttämätöntä käsitellä henkilötietoja

Käsiteltävät henkilötiedot

  1. Helsingin yliopisto (2022). Lahjoita puhetta -aineisto: Näyte (yrityskäyttöön) [korpus]. Kielipankki. Saatavilla http://urn.fi/urn:nbn:fi:lb-2022060126
  2. Helsingin yliopisto (2022). Lahjoita puhetta: Annotoitu aineisto (yrityskäyttöön) [korpus]. Kielipankki. Saatavilla http://urn.fi/urn:nbn:fi:lb-2022060128

Aineistot on saatu Kielipankin kautta, osoitteesta: https://www.kielipankki.fi/aineistot/puhelahjat-commercial/

Käsiteltävien henkilötietojen tarkempi kuvaus

1. Äänitteet

Alkuperäinen Aineisto koostuu puheäänitteistä, äänitteiden tallennukseen liittyvistä teknisistä oheistiedoista sekä puhettaan lahjoittaneiden henkilöiden vapaaehtoisesti antamista taustatiedoista. Kuhunkin äänitallenteeseen voi liittyä myös puheen sanallisen sisällön tekstimuotoinen kuvaus eli litteraatti sekä muita kuvauksia ja merkkauksia, joita on tuotettu käsin tai koneellisesti.

Aineistoon kuuluvat äänitteet ovat alkuperäisen sisältönsä osalta muokkaamattomia, vaikka äänitiedostojen tallennusformaatti saattaa käytännön syistä vaihdella. Joissakin tapauksissa puhujan henkilöllisyys voi käydä ilmi joko suoraan tai epäsuorasti esimerkiksi hänen oman puheäänensä tai äänitteessä mainittujen asioiden perusteella. a.i.mater ei käytä aineistoa puhujien henkilöllisyyksien selvittämiseen.

2. Äänitteiden oheistietoihin sisältyvät

  • puheen lahjoittajan käyttämä käyttöjärjestelmä ja selainversio
  • äänitteen tekninen tarkkuus
  • äänitteen kesto
  • äänityksen tarkka ajankohta
  • teeman ja aiheen numerot, ts. tiedot lahjoittajalle annetuista virikkeistä, esimerkiksi kuvista, videoista ja ohjeteksteistä, joiden kohdalla kyseinen puhetallenne syntyi.

Tekniset oheistiedot on tallennettu Aineistoon siten, että laitetietojen perusteella ei voi selvittää tallenteen tekijän tai laitteen käyttäjän henkilöllisyyttä.

3. Puheen lahjoittajien vapaaehtoisesti antamiin taustatietoihin kuuluu seuraavia tietoja:

  • puhujan oma käsitys edustamastaan murrealueesta (suljettu joukko karkeasti määriteltyjä vaihtoehtoja kuten esim. Uusimaa, Etelä-Savo, Satakunta jne.)
  • puhujan sukupuoli
  • äidinkieli/-kielet
  • ikäryhmä (ryhmiteltynä 10 vuoden tarkkuudella)
  • asuinpaikka (vapaatekstinä)
  • syntymäpaikka (vapaatekstinä),
  • ammatti (vapaatekstinä)
  • koulutustaso (suljetusta listasta valittu vaihtoehto).

Taustatietojen oikeellisuutta ei ole mahdollista jälkikäteen tarkistaa. Puheen lahjoittajat ovat voineet halutessaan jättää taustatietokysymyksiä väliin tai he ovat saattaneet antaa niihin vääriä tietoja. Vapaatekstinä kirjoitettavat vastaukset on voinut antaa haluamallaan tarkkuudella. Jos puhetta on lahjoitettu samalla laitteella useita kertoja, lahjoittaja on voinut antaa samoihin taustatietokysymyksiin useita erilaisia vastauksia.

Tietojen vastaanottajat

Aineiston tietoja voidaan siirtää a.i.materin laskentaresursseja tarjoavan kumppanin palvelimille (Tieteen Tietotekniikan Keskus, CSC) sekä a.i.materin varmuuskopionnista vastaavalle palveluntarjoajalle ainoastaan kryptatussa (henkilötietojen tapauksessa pseudonymisoidussa) muodossa varmuuskopiointia varten.

Kun henkilötietoja siirretään a.i.materin palveluntarjoajalle, a.i.mater varmistaa sopimuksellisin järjestelyin, että henkilötietoja käsitellään vain a.i.materin kirjallisten ohjeiden perusteella tässä tietosuojaselosteessa kuvattuihin tarkoituksiin.

Tietojen siirtäminen ETA-maiden ulkopuolelle

Tietoja ei siirretä ETA-maiden ulkopuolelle

Automatisoitu päätöksenteko

Tietoja ei käytetä automatisoituun päätöksentekoon tai profilointiin.

Henkilötietojen säilytysaika

Kielipankista ladattujen aineistojen sisältämien henkilötietojen käsittelytarve päättyy arviolta 31.12.2029

Rekisteröidyn oikeudet

Jokaisella rekisteröidyllä on oikeus pyytää saada pääsy itseään koskeviin henkilötietoihin, pyytää itseään koskevien tietojen oikaisemista tai käsittelyn rajoittamista tai poistamista, esimerkiksi suostumuksen peruuttamisen nojalla.

Henkilötiedon voit poistaa tietokannasta ottamalla yhteyttä Kielipankkiin ja kertomalla heille tunnisteesi sekä ilmaisemalla tahtosi poistaa lahjoituksesi tietokannasta (linkki yhteystietoihin alla).

Jokaisella rekisteröidyllä on oikeus milloin tahansa vastustaa tietojensa käsittelyä henkilökohtaiseen erityiseen tilanteeseensa liittyvällä perusteella.

Koska a.i.materilla ei ole mahdollisuutta tunnistaa rekisteröityjä Aineistosta, tulee kaikki Lahjoita Puhetta -ainestoon liittyvät henkilötietoihin liittyvät kysymykset tai vaateet osoittaa Kielipankille osoitteeseen fin-clarin@helsinki.fi. Täältä kysymykset välitetään tarvittaessa alkuperäisen aineiston rekisterinpitäjälle.

Jos rekisteröity katsoo, ettei hänen henkilötietojaan käsitellä lainmukaisesti, hänellä on oikeus tehdä asiasta valitus valvontaviranomaiselle (tietosuojavaltuutetulle). Lisätietoa löydät täältä: https://tietosuoja.fi/onko-tietosuojaoikeuksiasi-loukattu