Esimerkkejä poimintakuvauksista

Alla on listattu esimerkkejä, mitä erityyppiset poiminnat maksavat ja miten tutkijan tekemä poimintakuvaus vaikuttaa hinta-arvion antamiseen. Poimintakuvaus vaatii aina tapauskohtaista arviota, johon määritelty hinta perustuu.

Hyvinvointialueiden välillä on huomattavasti vaihtelua hinnoittelussa, joka johtuu esimerkiksi käytettävissä olevista resursseista ja tietojärjestelmistä. Tämä esimerkkitaulukko on tehty yhteistyössä HUS:n, Varhan ja Pirhan kanssa. Hinta-arviot on annettu kevään 2024 hintojen mukaan.

Mahdollisimman selkeä ja Aineistokatalogin mukaan tehty poimintakuvaus nopeuttaa kustannusarvion saamista. Lisäksi poiminnan määrittelyyn kuluu vähemmän aikaa, jolloin poiminnan kokonaiskulut ovat yleensä alhaisemmat.

Tutustu ennen poimintakuvauksen tekemistä alta löytyviin aineistokuvauksiin ja koodistoihin.

Aineistokuvaukset ja koodistot

Esimerkki A

  • Lyhenteet avattu ja konteksti selvennetty tarvittaessa.
  • Selkeä ja rakenteiseen dataan liittyvä poiminta, jossa kohortti perustuu pariin diagnoosikoodiin ja toimenpidekoodiin rajatulla ajalla, esim. 1.1.2020–31.12.2023.
  • Poimintakuvaus annettu diagnoosi-, toimenpide- ja labrakoodein, sekä selkeä ja lyhyt aikajana, joka sama kaikelle poimittavalle datalle, esim. 1.1.2020–31.12.2023.
Tutkijan poimintakuvausPoiminnan hinta-arvioRekisterinpitäjien kommentit
Kohortille, jolla on erikoissairaanhoidon tapahtuma diagnoosilla E11 ajalla 1.1.2020–31.12.2022.

Tarvitaan samalta ajalta päivämäärät toimenpiteille KAE* tai KEB00, sekä laboratoriotutkimusten fP-Gluk = Glukoosi, fP-Insu = Insuliini, S -CK = Kreatiinikinaasi tulokset.
Akateemiset tutkimukset
HUS: n. 1 450 € (aloitusmaksu + 5 h työ. HUS-tutkimuksille maksuton)
Pirha: n. 1 350 €
Varha: n. 400 €

Kaupalliset toimeksiannot
HUS: n. 3 400 € (aloitusmaksu + 5 h työ)
Pirha: n. 2 200 €
Varha: n. 3 000 €
 
HUS
Aikarajaus sijoittuu juuri Apotin aikaan, eli vähentää kustannuksia, kun ei tarvitse sisällyttää kuin Apotin sekä Multilabin aineisto.
Labratutkimukset toivotaan kuntaliiton tunnistenumerolla. Työhön kuuluu kohdejoukon muodostus, aineiston poiminta, katselmointi ja toimitus.

Varha
Kustannusarvio on helppo antaa pyynnön ollessa aineistokatalogin mukainen ja selkeä.

Esimerkki B

  • Kuten esimerkki A, mutta sisältää myös tekstinlouhintaa.
  • Selkeä poiminta, jossa kohortti perustuu pariin diagnoosikoodiin ja toimenpidekoodiin rajatulla ajalla esim. 1.1.2020–31.12.2023.
  • Poimintakuvaus annettu diagnoosi-, toimenpide- ja labrakoodein, sekä selkeä ja lyhyt aikajana, joka sama kaikelle poimittavalle datalle, esim. 1.1.2020–31.12.2023.
  • Tekstinlouhinnasta selkeästi listattu, että mitä sanarakenteita halutaan etsittäväksi, tekstit +-50 merkkiä löydöksestä.
  • Poimintakuvauksessa selvillä, että mistä teksteistä löydöksiä etsitään: potilaskertomus, hoitokertomus, patol. lausunto, labralausunto, ja tiedossa myös tarvitut erikoisalan välilehdet.
  • Kuvattu etsittävä haluttu tulos teksteistä.
Tutkijan poimintakuvausPoiminnan hinta-arvioRekisterinpitäjien kommentit
Kohortille, jolla on erikoissairaanhoidon tapahtuma diagnoosilla E11 ajalla 1.1.2020 – 31.12.2022.

Tarvitaan samalta ajalta päivämäärät toimenpiteille KAE* tai KEB00, sekä laboratoriotutkimusten fP-Gluk = Glukoosi, fP-Insu = Insuliini, S -CK = Kreatiinikinaasi tulokset.

Tekstinlouhinta sanalistalle: ecog, puutu* (etsitään puutua, puutuminen jne.).
Akateemiset tutkimukset
HUS: n. 1 900€ (aloitusmaksu + 10 h, HUS-tutkimuksille maksuton)
Pirha: n. 2 500 €
Varha: 550 €

Kaupalliset toimeksiannot
HUS: n. 5 800€ (aloitusmaksu + 10 h työ)
Pirha: n. 4 050 e
Varha: 4 200€
HUS
Aikarajaus vain Apotin ajalle lyhentää työhön kuluvaa aikaa. Tekstinlouhinnalle lähdejärjestelmiä on silti useita, joten vie aikaa.

Varha
Kustannusarvio on helppo antaa pyynnön ollessa aineistokatalogin mukainen ja selkeä.

Esimerkki C

  • Kohdejoukko muodostetaan HUSin, Varhan ja Pirhan tiedoista, diagnoosi-, toimenpide- ja lääkkeiden antotietojen avulla, aikarajauksena kohdejoukolle 2014–2024.
  • Findata kokoaa kohdejoukon ja toimittaa takaisin hyvinvointialueille aineiston poimintaa varten.
  • Kohdejoukosta halutaan Aineistokatalogin mukaiset asiakas-, diagnoosi-, toimenpide-, leikkaus-, lääkitys-, laboratorio-, patologian, kuvantamisen, lähete- ja potilaskontaktitiedot, sekä tupakointistatus teksteistä.
  • Lisäksi Varhalta, Pirhalta, LUVNilta, Helsingin kaupungilta, Vantaa-Keravalta, Keusotelta ja Itä-Uusimaalta vastaavat tiedot myös perusterveydenhuollon osalta.
  • Näiden lisäksi pyydetään HUSilta Terveyskylä-aineistoja, jotka eivät ole Aineistokatalogissa.
Tutkijan poimintakuvausPoiminnan hinta-arvioRekisterinpitäjien kommentit
Potilaalla myelooma-diagnoosi C90 ja jokin seuraavista toimenpiteistä WW300, WW302, WW304, WW306.

Lisäksi lääkkeen antokirjaus jostakin lääkkeestä, jossa vaikuttavana aineena daratumumabi, isatuksimabi ja elotutsumabi, vuosien 2014–2024 välillä.

Tekstinlouhinta “tupak”, “smok”.
Akateemiset tutkimukset
HUS: 1 000e aloitusmaksu + 25-30 h työ (90 €/h)
Pirha: 1 900 € (tupakointialgoritmi sisältyy hintaan)
Varha: 1 400€ (tupakointialgoritmi sisältyy hintaan)

Kaupalliset toimeksiannot
HUS: 3 000e aloitusmaksu + 25-30 h työ (282,79 e/h)
Pirha: 3 100 € (tupakointialgoritmi sisältyy hintaan)
Varha: 11 300€ ( tupakointialgoritmi sisältyy hintaan)
HUS
Datasettejä HUSista 38 kpl tällaisella pyynnöllä, lisäksi Terveyskylän aineistojen sisällöt pitää tarkentaa ja kuvata, jotta saadaan rajattua tarvittavat tiedot sekä lopullinen datasettien määrä.
Mitä enemmän eri järjestelmien dataa tarvitaan, sitä kauemmin aineiston haku ja kokoaminen vie. Terveyskylä-osuutta lukuun ottamatta pyyntö on selkeä ja toteutettavissa.
Huom. HUSilla on tietojenkäsittelysopimukset Uudenmaan hyvinvointialueiden kanssa, ja mahdollisuus poimia aineistoon laboratorio-, patologian ja kuvantamisen tiedot näiltä rekisterinpitäjiltä. Muut tiedot tulee pyytää Findatan kautta kyseisiltä rekisterinpitäjiltä.

Varha
Hinnat koskevat erikoissairaanhoidon aineistoa. Varhalla ei toistaiseksi ole poimittavissa perusterveydenhuollon aineistoja, vaan niihin liittyvät kustannusarviot sekä aineistotoimitukset pyydetään järjestelmätoimittajilta.
Jos halutaan myös kuvia, näistä pyydetään erillinen kustannusarvio kuvantamiskeskuksesta. Varhalla on käytössä tupakointialgoritmi, joka poimii tupakointistatuksen potilasteksteistä.

Esimerkki D

  • Epäselvä tai monimutkainen rakenteisen datan pyyntö.
  • Halutaan ensidiagnoosiin perustuva kohortti.
  • Kohortin valinta-aika on diagnoosiin perustuva, mutta aikajana pitkä esim. 2000–2023.
  • Toimenpiteet halutaan eri ajalta esim. ”2015–2022, laboratoriotulokset kolme viikkoa ennen toimenpidettä ja seurantatulokset 3 kk ja 6 kk.”
  • Toimenpiteistä ei ole toimenpidekoodeja, halutaan esim. tiettyihin sairauksiin ”liittyvät toimenpiteet”.
  • Labrakokeista ei ole labrakoodeja, halutaan esim. tiettyihin diagnooseihin ”liittyvät labrat”.
  • Lisäksi heikosti määritelty tekstinlouhinta: halutaan tiettyihin lyhenteisiin liittyvät lauseet, mutta ei ole määritelty, mistä teksteistä louhinta halutaan. Sanalista annettu, mutta toivotaan, että tiedon louhija täydentää sitä.
Tutkijan poimintakuvausPoiminnan hinta-arvioRekisterinpitäjien kommentit
Kohorttina kaikki potilaat, joilla myelooman C90 ensidiagnoosi alle 50-vuotiaana.

Kaikki syöpätoimenpiteet ajalta 2015–2022, ja syöpäsairauksiin liittyvät laboratoriotulokset 3 viikkoa ennen toimenpidettä, ja seurantatulokset 3 kk ja 6 kk kohdalla.

Halutaan sairaalajaksoilla annetut lääkkeet, hoitovaste eri hoitolinjoille ja syyt hoitolinjojen muutoksille ja päättämisille.

Halutaan lyhenteisiin pe, PD, ac, tse liittyvät lauseet.
Halutaan myelooman esiintyvyys lähisukulaisilla.
HUS: Pyydämme tietoluvan hakijaa tarkentamaan pyyntöä mm. toimenpidekoodien ja labratutkimusten osalta ennen kustannusarvion antamista. Sanalistaa ei voida hyödyntää, sillä se tuottaa runsaasti vääriä hakutuloksia. Pitää olla spesifit sanahaut ja lisäksi esimerkissä C mainitut asiat.

Pirha: Epäselvän pyynnön selvittäminen aiheuttaa kustannuksia (yhteydenotot tai palaverit). Esim. mitä tehdään, jos labratuloksia ei ole juuri 3 kk ja 6 kk kohdalla?
Tällaisenaan pyyntö ei ole toteutettavissa, vaan vaatii selvitystyötä tutkijoiden kanssa.

Varha: Varha ei pysty antamaan kustannusarviota tämänkaltaiseen pyyntöön, sillä pyyntö on epätarkka ja vaatii selvennystä, jolloin käsittelykulut nousevat. Lisäksi itse poiminnassa tulee huomioida eri aikamääreet.
Ensidiagnoosiin perustuva kohortti on usein haastava löytää, koska ei usein näy erikoissairaanhoidossa, tai on todettu kaukana historiassa.

Laboratoriotulosten ajankohdan rajaus on epäselvä. Mitä toimenpidettä ennen laboratoriotulokset halutaan? Halutaanko juuri kolme viikkoa ennen olevalta ajankohdalta vai ajalta toimenpiteeseen asti? Entä halutaanko laboratoriotuloksia myös toimenpiteen jälkeen?

Seurantalaboratoriotulosten osalta epäselväksi jää, mitkä koodit halutaan, miltä ajalta ja verrattuna mihin ajankohtaan? Halutaanko ne esimerkiksi jonkin tietyn toimenpidekoodin mukaisesti?

Lyhenteet liian tyypillisiä, tulokseksi mitä sattuu.

Hyvä tietää

HUS

  • HUSilla on valtava määrä eri lähdejärjestelmiä ja datasettejä – kannattaa tutustua niihin huolellisesti ennen tietolupahakemusta:
  • Aineistokatalogin mukaiset aineistopyynnöt voidaan toteuttaa huomattavasti sujuvammin, mikä vie vähemmän aikaa.
  • Suuren lähdejärjestelmä- ja datasettivalikoiman vuoksi laajojen pyyntöjen toteuttaminen vie aikaa ja lisää kustannuksia.
  • Yksiselitteiset rajauskriteerit ja koodistojen hyödyntäminen selkeyttävät pyynnön käsittelyä ja toteutusta huomattavasti.

Pirha

  • Pirhassa esimerkkihinnat koskevat erikoissairaanhoidon aineistoja.
  • Pirhassa on käytössä tupakointialgoritmi, joka ennustaa tupakointistatuksen erikoissairaanhoidon potilasteksteistä (tupakoi, ex-tupakoija, ei ole tupakoinut).
  • Perusterveydenhuollon aineisto pyydetään toistaiseksi järjestelmätoimittajien kautta, mikä nostaa kustannuksia ja tuo viivästyksiä aineistotoimitukseen.
  • Louhittava tieto haetaan spesifeillä termeillä (esim. ’ekstravasaatio’, ’ecog’, ’sähköpotkulau’) ja tekstistä luovutetaan löydön ympäriltä esimerkiksi +/- 50 merkkiä tai termin sisältävä virke. Kohortin koko ja termien spesifisyys vaikuttavat jossain määrin louhinnan työmäärään.
  • Vältä louhittavissa termeissä yleisiä sanavartaloita tai -osia, joiden tuloksena saadaan ei-toivottuja osumia. Huonoja esimerkkejä: ’resis’, ’kastr’, ’pe’, ’PD’, ’ac’, ’tse’.

Varha

  • Varhalla toistaiseksi poimittavissa vain erikoissairaanhoidon aineistoja, esimerkkihinnat koskevat niitä.
  • Varhalla on käytössä tupakointialgoritmi, joka poimii tupakointistatuksen potilasteksteistä.
  • Perusterveydenhuollon aineisto pyydetään toistaiseksi järjestelmätoimittajien kautta, mikä nostaa kustannuksia ja aiheuttaa viivästyksiä aineistotoimitukseen.
  • Louhittava tieto: mitä enemmän louhittavia sanoja, sitä enemmän kuluu aikaa ja kustannuksia
  • Vältä sanoja, joita louhimalla ei tule toivottua lopputulosta, esim. TT*, PASI* jne.