Skip to Main Content

Avoin TKI-toiminta Lapin ammattikorkeakoulussa - aineistonhallinnan opas: Hankkeen toteutus

Avoimuuden hallinta TKI-hankkeen toteutusvaiheessa

Hankkeen aikana kertyy paljon erilaista dataa ja muuta aineistoa. Aineiston organisointitavoista ja säilyttämisestä on sovittava kaikkien hankkeessa toimivien kesken. Aineistojen tallennusohjeet vähentävät virheitä ja sekaannuksia sekä helpottavat aineiston jakamista eri toimijoiden kesken.

Hyvällä aineistojen organisoinnilla varmistetaan:

  • aineistojen saatavuus
  • aineistojen sisältöjen ymmärrettävyys (käytettäyys)
  • käyttöoikeuksien määrittely
  • tietosuoja ja tietoturva

Hankkeen avoimuus sisältää myös avoimet tutkimusmenetelmät ja avointen ohjelmistojen käytön.

Aineistonhallinnassa huomioitavaa

TKI-aineistojen systemaattisessa hallinnassa on huomioitava: 

  • Miten tiedostot ja niiden eri versiot nimetään?
  • Mitä tallennusformaatteja käytetään?
  • Mihin aineistot tallennetaan?
  • Miten luodaan toimiva kansiorakenne?
  • Miten kansiot nimetään?                            
  • Miten käyttöoikeudet hallinnoidaan esim. projektin sisällä?
  • Miten varmistetaan tietosuoja?
  • Miten varmuuskopiointi hoidetaan?
  • Miten tarpeeton aineisto ja väliaikaistiedostot poistetaan?
  • Miten TKI-hankkeen / tutkimusprosessin kulku ja työmenetelmät dokumentoidaan / avataan?

Aineistojen keruutapoja

  • Kvantitatiivisia aineistoja voidaan kerätä haastattelemalla, postikyselyinä, verkkokyselyinä, poimimalla tiedot erilaisista lähdedokumenteista tai mittaamalla.
  • Kvalitatiivinen aineisto kuten haastattelut, ryhmähaastattelut ja asiakas- ja asiointitilanteet kerätään yleensä tallentaen ne ääni- tai äänikuvatiedostoiksi. Kirjoitukset kerätään tavallisesti kirjoituspyyntöjen tai -kutsujen avulla sähköpostitse, postitse tai tarkoitusta varten luodun verkkosivuston kautta.
  • Virallisista dokumenteista saa nykyisin suuren osan suoraan verkosta, mutta osan dokumenteista saa vain erikseen pyytämällä tai anomalla lupaa niiden tutkimuskäyttöön.
  • Rekisteriaineistojen saaminen edellyttää lupamenettelyä. Ohjeita lupien hakemiseen saa Rekisteritutkimuksen tukikeskuksesta.
  • Tutkija tai projekti voi kerätä ja tallentaa aineiston itse, tai aineisto voidaan tilata joltain tiedonkeruu- tai haastatteluorganisaatiolta. Jos tutkimusprojekti päättää ostaa tiedonkeruun, tarjouspyyntö kannattaa lähettää usealle tiedonkeruuorganisaatiolle. Tarjouspyynnön laatimisessa voi ja kannattaa käyttää apuna tutkimusaineiston aineistonhallintasuunnitelmaa.

Lähde: Tietoarkisto: Aineistonhallinnan käsikirja: Aineistonhallinnan suunnittelu

TKI-prosessin dokumentointi

Hankkeen dokumentoinnilla varmistetaan toistettavuus sekä tiedonvälitys hankkeen toimijoille ja muille hankkeen aineistoja ja materiaaleja tarvitseville.

ATT-hankkeen Datanhallintaoppaassa ohjeistetaan kirjaamaan muistiin:

  • käytetyt instrumentit ja laitteet
  • niiden kalibrointi ja eri muuttujien arvot
  • käytetyt koodit ja ohjelmistot
  • aineiston keruutapa
  • miten, kuka ja milloin aineisto on käsitelty
  • muut prosessit
  • eri versioiden hallinta
  • laadunvarmistusprosessit

Käytännöt vaihtelevat tieteenalakohtaisesti, mikä on huomioitava hanke-/tutkimuskohtaisesti. Datan yhteyteen kannattaa luoda readme.txt-tiedosto, jossa kokonaisuus ja dokumentointi on kuvailtu. Koodia voi tallentaa esimerkiksi sopivaan tietoarkistoon tai GitHubiin, jonne voi Zenondo-palvelun kautta saada DOI-tunnisteen.

Tietoturva

TKI-aineistojen tietoturva perustuu korkeakoulujen tietohallinnon järjestelmiin ja tietoturvaohjeistuksiin.

Tietoturvan varmistamiseen kuuluu aineiston tuhoutumisen, vahingoittumisen ja muuttumisen tai varastamisen estäminen aineiston käsittelyn ja säilytyksen aikana. Tietoturvaan sisältyy myös pääsy- ja käyttöoikeuksien hallinta.

Tietoturvasta huolehtiminen on tärkeää aina, mutta erityisen tärkeää arkaluontoisissa aineistoissa.

Myös varmuuskopiointi on osa tietoturvaa. Säilyvyyden varmistamiseksi aineistot on tallennettava useaan eri paikkaan tai välineelle. Varsinaiset työ- ja varmuuskopiot on säilytettävä erikseen.

Tietosuoja

Henkilötietojen tietosuojaan kuuluvat ihmisten yksityiselämän suoja ja muut sitä turvaavat oikeudet henkilötietoja käsiteltäessä.

  • Henkilötietoja ei saa kerätä tarpeettomasti ja ne on suojattava asiattomalta käsittelyltä. Henkilötietojen keräämisen tarve ja laajuus on suunniteltava jo TKI-hankkeen valmisteluvaiheessa ja sisällyttää osaksi aineistonhallintasuunnitelmaa.
  • Mikäli tutkimusaineiston muodostamiseen tarvitaan henkilötunnusta, tulee sopia erikseen, ketkä ovat oikeutettuja tunnisteellisen aineiston käsittelyyn.

Henkilötietolain 14§:ssä säädetään siitä, miten henkilötietoja voi käyttää tutkimuksessa.

Arkaluonteisen tietoja ovat tiedot, jotka koskevat

  • rotua tai etnistä alkuperää
  • henkilön yhteiskunnallista, poliittista tai uskonnollista vakaumusta tai ammattiliittoon kuulumista
  • rikollista tekoa, rangaistusta tai muuta rikoksen seuraamusta
  • henkilön terveydentilaa, sairautta tai vammaisuutta taikka häneen kohdistettuja hoitotoimenpiteitä tai niihin verrattavia toimia henkilön seksuaalista suuntautumista tai käyttäytymistä
  • henkilön sosiaalihuollon tarvetta tai hänen saamiaan sosiaalihuollon palveluja, tukitoimia ja muita sosiaalihuollon etuuksia.

Arkaluonteista tietoa saa käsitellä vain Henkilötietolain 12 §:ssä määritellyissä tilanteissa, joihin sisältyy mm. sellaisten tietojen käsittely, joihin tutkittava on antanut suostumuksensa.

Tiedonlähteitä

Tietosuojavaltutetun toimisto oppaat:

Henkilötietolaki 523/1999

Avoimet tutkimusmenetelmät

Tutkimusmenetelmiä ovat mallit, ohjelmistot, työvuot ym., joilla tutkimustuloksia tuotetaan. Avoimuuden periaatteiden tulee kattaa myös tutkimusympäristö (tutkimusvälineet, laitteet ja hyödynnetyt palvelut), koska vasta silloin tutkimus on tarpeeksi läpinäkyvää muiden arvioitavaksi ja hyödynnettäväksi. http://avointiede.fi/att-n-avoimet-ohjelmistot

Tiedon tallennusformaatit

Ohjelmistojen ja tiedostoformaattien jatkuva muuttuminen on haasteellista tiedon säilyttämisen näkökulmasta. Tallennusformaattien valintaan tulee kiinnittää huomiota, jotta aineiston käytettävyys säilyisi mahdollisimman pitkään. Kokonaan ohjelmistoriippumattomia tallennusformaatteja ei kuitenkaan ole tarjolla. Tiedon siirtäminen formaatista toiseen ei yleensä onnistu täydellisesti, jotain tietoa saattaa hävitä, esim. tekstin muotoilut, taulukoiden tietosisältö, kuvien resoluutio ja äänenlaatu.

Käytettävyyden varmistamiseksi on suositeltavaa tallentaa yksi tiedostokopio sellaisessa muodossa, joka on mahdollisimman yleisesti käytössä ja jota useimmat eri ohjelmistot tukevat. Tällaisia ovat esimerkiksi:

Teksti: txt, odt, rtf, csv, PDF/A, html, xml
Kuvat: jpeg, tiff
Video: MPEG-4 (mp4)
Ääni: FLAC

TKI-hankkeen työmenetelmien avaaminen

Avoimessa tieteessä ja tutkimuksessa puhutaan ns. avoimen muistikirjan menetelmästä tai avoimesta tutkimuspäiväkirjasta (Open Notebook Science).  Tällä tarkoitetaan hankkeen aineistonkeruun, mittaustulosten yms. avaamista julkiseen tarkasteluun jo toteuttamisvaiheessa. Tavoitteena on hankkeen läpinäkyvyyden varmistaminen.

Avoimuutta voidaan toteuttaa mm. erilaisilla sosiaalisen median välineillä, kuten blogilla, esim. http://nmrlipids.blogspot.fi/

Käytännön työkaluina voi käyttää esim. myös web-sivuja. Dokumentteja voi jakaa lisäksi erilaisten pilvipalveluiden kautta.

Avoimia tutkimuspäiväkirjoja Zenodossa

Sosiaalinen media tutkimusprosessin avaamisessa

Liittyykö tutkimukseesi ihmisiä?

Jessica Parland-von Essenin kirjoitus henkilötietojen ja arkaluonteisen tiedon käsittelystä.
Portti-verkkolehti 21.9.2016