Datan keruu-, tallennus- ja käsittelyvaiheessa siirrytään suunnitelmasta toimintaan. Data- ja tekoälykehittämiseen liittyy väistämättä toimivaan ratkaisuun tähtäävä kokeileminen. Hankkeissa on kuitenkin varmistuttava, että alkuperäinen käyttötarkoitus, toimintaperiaate ja lainmukaisuus eivät muutu kokeilujen seurauksena. Alla olevassa kuvassa on esitetty datan keräämisen ja käsittelyn tyypilliset vaiheet.



Turvallisen kehittämisen kannalta kriittiset toimenpiteet liittyvät aineistoihin, jotka sisältävät henkilötietoja. Tällöin oleellista on tunnistaa kerättyjen tietojen alkuperäinen käyttötarkoitus, ja mahdolliseen uuteen käyttötarkoitukseen liittyvät tietolupaprosessit ja mahdollisten rekisteröityjen suostumusten kerääminen. Toiminnan ohjeistus riippuu hyvin paljon tietojen käyttötarkoituksesta. Lisätietoa turvallisen arkkitehtuurin suunnittelusta ja toteutuksesta löytyy Virta-arkkitehtuurista (3).

Henkilötietoja sisältävien data-aineistojen käsittelyssä on välttämätöntä tuntea seuraavat avainkäsitteet:

  • Anonymisointi: henkilötietojen suorien tunnisteiden (nimi, henkilötunnus, osoite, jne.) salaaminen siten, että rekisteröidyn identiteetti ei ole jälkikäteen kohtuullisilla resursseilla palautettavissa.
  • Pseudonymisointi: henkilötietoaineiston suorien tunnisteiden (nimi, henkilötunnus, osoite, jne.) salaaminen siten, että rekisteröidyn identiteetti ei paljastu. Identiteetti on kuitenkin jälkikäteen palautettavissa.