Analyytikot hyödyntävät useasta rekisteristä koostuvaa aineistoa selvittääkseen ja kaventaakseen lapsiperheiden hyvinvointieroja Suomessa. “Hakemuksen viimeistely vei yllättävän paljon aikaa”, sanoo hankkeen tietolupahakemukset tehnyt Pasi Lehtimäki konsulttiyhtiö Goforesta.
Hakemus oli yksi laajimmista, jonka Sosiaali- ja terveysalan tietolupaviranomainen Findata oli siihen mennessä vastaanottanut.
Suomalaisten kuntien yhteishanke halusi käyttää kuuden eri rekisterinpitäjän tiedoista koottua aineistoa selvittääkseen, miten kaupungit voivat kaventaa lapsiperheiden hyvinvointiin liittyviä eroja.
Lapsiperheiden edistynyt analytiikka (LEA) -hankkeen tavoitteena oli ymmärtää lapsiperheiden kokonaistilannetta ja kehittää parempia palveluita. Tutkimus toteutettiin neljässä osassa eri kunnissa ja kaupungeissa. Mukana olivat Vaasa ja Laihia, Tampere ja Ylöjärvi, Vantaa, Pori ja konsulttiyhtiö Gofore.
Goforen konsultin Pasi Lehtimäen mukaan harva viranomainen näkee lapsiperheen hyvinvoinnin riittävän monipuolisesti. Yksi siilo voi tarkastella lapsen mielenterveyttä, toinen oppimistuloksia.
“Mikään taho ei ole tähän mennessä tutkinut perheen hyvinvoinnin monia ulottuvuuksia samaan aikaan. Aineiston avulla voimme lisäksi tutkia lapsiperheitä perheyksikköä laajemmin, eli huomioida myös vaikkapa isovanhempia tai eri asuinpaikalla asuvaa etävanhempaa koskevan datan”, Lehtimäki sanoo.
Eri rekisteriaineistot piirtävät monipuolista kuvaa perheistä
Goforen analyytikot hyödynsivät hankkeessa aineistoja väestötietojärjestelmästä, THL:n hoitoilmoitusrekistereistä ja Kelasta. Lisäksi he analysoivat Eläketurvakeskuksen, Verohallinnon ja Tilastokeskuksen rekisteriaineistoja. Aineistot piirtävät kuvaa esimerkiksi perheiden terveystiedoista, tuloista ja koulutustasosta.
Goforen Pasi Lehtimäki haki Findatalta tietoluvan hankkeessa käytettäviin sosiaali- ja terveystietoihin. Periaatteessa hakemusprosessi on yksinkertainen: tutkija lähettää verkossa tietolupahakemuksen ja Findatan käsittelijä tarkistaa, että hakemus sisältää lupaan tarvittavat tiedot ja selvittää rekisterinpitäjiltä, paljonko tietojen poiminta maksaa. Tarvittaessa käsittelijä ohjaa hakijaa täsmentämään EU:n yleisen tietosuoja-asetuksen ja Suomen lainsäädännön vaatimia asioita – kuten sitä, että vain välttämättömiä tietoja haetaan.
Käytännössä luvan saanti oli kuitenkin odotettua haasteellisempaa. Lehtimäki ja muut datatieteilijät olivat suunnitelleet hankkeen aikataulun tarkasti. Se kuitenkin venyi. Monta kuukautta kului sen määrittämiseen, että poiminnat ja haetut tiedot vastaavat käyttötarvetta.
“Rekisterinpitäjät tarvitsevat tarkat määritelmät muuttujista voidakseen tehdä poimintoja aineistosta. Meidän piti määritellä huolellisesti esimerkiksi se, kuka lasketaan lapseksi. Tavoitteena oli löytää määritelmä, jonka avulla tarvittavat tiedot saadaan poimittua kaikilta eri rekisterinpitäjiltä.”, Lehtimäki sanoo.
Hankkeesta syntyi aarrearkullinen tietoa
Tietoturva ja ihmisten yksityisyyden suojan säilyminen olivat korkealla LEA-hankkeen prioriteettilistalla. Findata pseudonymisoi kaikki tiedot, eli kenenkään ihmisen henkilöllisyys ei selviä aineistosta. Tietoluvan saatuaan tutkijat käsittelivät aineistoa Findatan tietoturvallisessa Kapseli-etäkäyttöympäristössä, jota pääsevät käyttämään vain nimetyt henkilöt salassapitovelvollisuuden turvin.
“Analyysiympäristössä pystyimme käyttämään vain Findatan sinne lataamia työkaluja. Emme voineet viedä sinne itse mitään tietoja emmekä ladata mitään ulos”, Lehtimäki sanoo.
Henkilötietoaineisto halutaan pseudonymisoitunakin suojata erityisen hyvin. Kapseliin on kuitenkin mahdollista viedä omia aineistoja ja ohjelmistoja Findatan kautta.
Hankkeen tuloksia Lehtimäki ei pysty kommentoimaan, sillä aineiston ruuvaaminen johtopäätöksiksi ja palveluiksi jää hankkeessa mukana olevien kaupunkien kontolle. Kaupungit pyrkivät datan avulla tunnistamaan ja tasaamaan alueellisia hyvinvointieroja lapsiperheissä. Hankkeen kokoama aineisto on siihen tarkoitukseen aarreaitta.
“Aineiston perusteella tuottamastamme toimintamallista voi löytää uutta pitkälle tulevaisuuteen.”
Tutkijan vinkki tietolupaa hakevalle
“Jos aineistopoimintoja koskevia määritelmiä joudutaan tarkentamaan, se hoidetaan pääasiassa sähköpostitse. Mitä enemmän hakemuksessa on täydennettävää, sitä enemmän asiaa joudutaan selvittämään Findatan kanssa. Tähän kannattaa varata aikaa. Vastaa sähköposteihin mahdollisimman nopeasti! Jos käyt puoli vuotta keskustelua viikon vastausviiveellä, hukkaat hankkeesta kallisarvoista aikaa.”
– Pasi Lehtimäki, tekniikan tohtori, Gofore
Mikä on Findata?
- Findata on vuonna 2020 aloittanut sosiaali- ja terveystietojen yhden luukun tietovarantopalvelu. Sen toiminta perustuu vuonna 2019 voimaan tulleeseen toisiolakiin, eli lakiin sosiaali- ja terveystietojen toissijaisesta käytöstä.
- Findata myöntää tietolupia aineistojen käyttöön muun muassa tieteelliseen tutkimukseen, tilastointiin ja viranomaisten selvitystehtäviin.
- Sen tavoitteena on parantaa sosiaali- ja terveystietoja sisältävien aineistojen tietoturvaa ja mahdollistaa niiden tehokas hyödyntäminen.
- Findata toimii Terveyden ja hyvinvoinnin laitos THL:n yhteydessä, eriytettynä THL:n muusta toiminnasta.
Artikkeli on ensimmäinen osa Findatan julkaisemaa Datasta tutkimukseen -artikkelisarjaa, joka avaa toisiolain tutkimuskentälle tuomia muutoksia ja Findatan toimintaa. Sarjassa esittelemme hankkeita, joissa on hyödynnetty Findatan kautta saatavia aineistoja.