Vinkkejä tekstiaineistojen poiminnan määrittelyyn
- Harkitse, onko tekstiaineisto välttämätön tutkimuksen suorittamiselle.
- Rakenteettoman tiedon tarpeelle tulee aina olla perustelut. Monesti vastaavanlaista tietoa voidaan poimia rakenteisessa muodossa.
- Peitämme tekstiaineistoista suorat tunnisteet, mikä vaikuttaa aineistojen käytettävyyteen.
- Tekstiaineistojen käsittely vie aikaa ja kasvattaa kustannuksia huomattavasti.
- Pyydä rekisterinpitäjältä näkemystä sopiviin hakusanoihin.
- Rekisterinpitäjä on paras arvioimaan, millä hakusanoilla saadaan parhaiten kattava tulos, joka ei sisällä ylimääräistä tietoa.
- Esim. hakusana *paine* tuottaa kaikki painetta koskevat merkinnät, kuten verenpaine, silmänpaine ym. Jos tutkimuksen kiinnostuksen kohde on verenpaine, poimittava tekstiaineisto sisältää huomattavasti tarpeetonta tietoa.
- Määrittele poimittavan tekstipätkän pituus muuttujakohtaisesti.
- Tekstipätkän tulisi olla mahdollisimman lyhyt.
- Pyydä rekisterinpitäjältä näkemys poimittavan tekstin pituudesta. Esim. hakusana +/- 50 merkkiä.
- Huolehdi poiminnan rajauksesta.
- Jos poiminta voidaan rajata tietyn osaston tai hoitoalan tietoihin koko sairaanhoitopiirin tietokannan sijasta, ovat poimittavan tekstin määrä ja käsittelykustannukset huomattavasti pienemmät.