1. Harkitse, onko tekstiaineisto välttämätön tutkimuksen suorittamiselle.
    • Rakenteettoman tiedon tarpeelle tulee aina olla perustelut. Monesti vastaavanlaista tietoa voidaan poimia rakenteisessa muodossa.
    • Peitämme tekstiaineistoista suorat tunnisteet, mikä vaikuttaa aineistojen käytettävyyteen.
    • Tekstiaineistojen käsittely vie aikaa ja kasvattaa kustannuksia huomattavasti.
  2. Pyydä rekisterinpitäjältä näkemystä sopiviin hakusanoihin.
    • Rekisterinpitäjä on paras arvioimaan, millä hakusanoilla saadaan parhaiten kattava tulos, joka ei sisällä ylimääräistä tietoa.
    • Esim. hakusana *paine* tuottaa kaikki painetta koskevat merkinnät, kuten verenpaine, silmänpaine ym. Jos tutkimuksen kiinnostuksen kohde on verenpaine, poimittava tekstiaineisto sisältää huomattavasti tarpeetonta tietoa.
  3. Määrittele poimittavan tekstipätkän pituus muuttujakohtaisesti.
    • Tekstipätkän tulisi olla mahdollisimman lyhyt.
    • Pyydä rekisterinpitäjältä näkemys poimittavan tekstin pituudesta. Esim. hakusana +/- 50 merkkiä.
  4. Huolehdi poiminnan rajauksesta.
    • Jos poiminta voidaan rajata tietyn osaston tai hoitoalan tietoihin koko sairaanhoitopiirin tietokannan sijasta, ovat poimittavan tekstin määrä ja käsittelykustannukset huomattavasti pienemmät.