Ohje tekstiaineistojen poiminnan määrittelyyn
- Harkitse, onko tekstiaineisto välttämätön tutkimuksen suorittamiselle. Rakenteettoman tiedon tarpeelle tulee aina olla perustelut. Monesti vastaavanlaista tietoa voidaan poimia rakenteisessa muodossa. Peitämme tekstiaineistoista suorat tunnisteet, mikä vaikuttaa aineistojen käytettävyyteen. Tekstiaineistojen käsittely vie aikaa ja kasvattaa kustannuksia huomattavasti.
- Pyydä rekisterinpitäjältä näkemystä sopiviin hakusanoihin. Rekisterinpitäjä on paras arvioimaan, millä hakusanoilla saadaan parhaiten kattava tulos, joka ei sisällä ylimääräistä tietoa.
- Esim. hakusana *paine* tuottaa kaikki painetta koskevat merkinnät, kuten verenpaine, silmänpaine ym. Jos tutkimuksen kiinnostuksen kohde on verenpaine, poimittava tekstiaineisto sisältää huomattavasti tarpeetonta tietoa.
- Määrittele poimittavan tekstipätkän pituus muuttujakohtaisesti. Tekstipätkän tulisi olla mahdollisimman lyhyt. Pyydä rekisterinpitäjältä näkemystä poimittavan tekstin pituudesta.
- Esim. hakusana +/- 50 merkkiä.
- Huolehdi poiminnan rajauksesta. Jos poiminta voidaan rajata tietyn osaston tai hoitoalan tietoihin koko sairaanhoitopiirin tietokannan sijasta, ovat poimittavan tekstin määrä ja käsittelykustannukset huomattavasti pienemmät.