Ennen tekoälyn opettamista tulee suunnitella kehittämisessä käytettävä prosessi ja niissä tarvittavat järjestelmät. Tekoälyn opettaminen voi tapahtua joko kokonaan mallia kehittävän organisaation infrastruktuurissa, jolloin malli ja mallin opettamisessa tarvittavat tiedot ovat ainoastaan asianmukaisten henkilöiden saavutettavissa. Joissain tilanteissa tekoälyn kehittämiseen liittyvä ohjelmointi kannattaa toteuttaa kehittäjän omalla laitteistolla, ja kehittämisessä syntyvä lähdekoodi viedään versionhallintaan. Versionhallinnasta julkaistaan uusimmat versiot tuotantoon. Kuhunkin tilanteeseen sopiva lähestymistapa riippuu opettamisessa tarvittavista tiedoista sekä mallin käyttötarkoituksesta. Alla olevassa taulukossa on kuvattu kaksi erilaista lähestymistapaa ohjeineen.


Taulukko 14: Ohjeita erilaisiin kehitysprosesseihin.

Kehitysprosessin arkkitehtuuri

Ohjeet kehittämiseen

Ympäristöt ja kehittäminen tapahtuvat ainoastaan organisaation järjestelmissä.

Huolehdi, että ratkaisun tuotantoversion ja kehitysversioiden tarpeisiin sopivat tietokannat ja datan tallennuspaikat ovat tietoturvallisia, ja niihin on pääsy ainoastaan asianmukaisilla henkilöillä.

 

Huolehdi, että tiedonsiirto tietojen ja ratkaisun välillä on turvallista.

Kehittäminen tapahtuu kehittäjän omalla laitteella, josta lähdekoodi viedään versionhallinnan kautta tuotantoon.

Huolehdi, että tiedonsiirto kehittäjän laitteen ja organisaation muun infrastruktuurin välillä on turvallinen, ja pääsy järjestelmiin on ainoastaan asianmukaisilla henkilöillä.

 

Huolehdi, että kehittäjän laitteistolle ei missään olosuhteissa tallennu henkilötietoa.

 

Itse mallin opettamisessa on tärkeää noudattaa yleisiä koneoppimisen kehittämisen käytäntöjä. Näin varmistetaan mallin toimivuus sille suunnitellussa käyttötarkoituksessa. Mallinnusvaiheen tyypilliset työvaiheet ovat mallinnusasetelman määrittäminen, datan esikäsittely, mallin opettaminen, mallin analysointi. Tämän jälkeen mallia ja asetelmaa muokataan, kunnes malli toimii odotusten mukaisesti.



Alla olevassa taulukossa on kuvattu mallin opettamisen vaiheet, sekä ohjeita vaiheiden toteuttamiseen. Mallin reiluutta ja mahdollista oikaisua koskevia ohjeita on kuvattu mm. syrjimättömän tekoälyn arviointikehikossa (1).


Taulukko 15: Ohjeita mallin opettamisen eri vaiheisiin.

Vaihe

Ohjeita vaiheen toteuttamiseen

Mallinnusasetelman määrittäminen

Valitaan mallinnuksessa käytettävät muuttujat. Jos toteutetaan ennustava malli (ohjattu oppiminen), ennustamisen syötemuuttujina ei käytetä kiellettyjä syrjintäperusteita.

Datan esikäsittely

Varmista, että datan käsittelyssä on huomioitu anonymisointi ja pseudonymisointi asianmukaisesti.

 

Toteuta datan jakaminen opetus, testaus ja validointijoukkoihin sopivassa jakosuhteessa. Jako opetusjoukkoihin tehdään mallin arkkitehtuurin ja kompleksisuuden valitsemiseksi ja hyvyyden realistisen arvioinnin toteuttamiseksi. Heikosti suunniteltu asetelma voi johtaa huonosti toimivaan tekoälymalliin.

 

Toteutetaan muuttujien esikäsittely ja normalisointi. Normalisointi on tehtävä erikseen opetus, testi ja validointijoukoille.

 

Datajoukkojen muutostenhallinnan toteuttamiseksi datajoukoilla tulee olla versionumerot ja versionhallinta.

Mallin opetus

Valitaan mallin rakenne ja arkkitehtuuri.

 

Opetetaan malli tai joukko erilaisia malleja.

 

Mallien muutostenhallinnan toteuttamiseksi malleilla tulee olla versionhallinta.

 

Jos opetusdata sisältää henkilötietoa, selvitä differential privacy -tekniikoiden käyttämisen mahdolliset hyödyt. Tässä lähestymistavassa mallin opettamiseen lisätään satunnaisuutta, jonka tehtävä on taata henkilötietojen säilyvyyttä, ja estää henkilötietojen palauttamisen opetetusta mallista.

Mallin analysointi

Analysoidaan opetettujen mallien suorituskyky: ennustetarkkuus, sekä mahdollinen mallin reiluus (kts. 5.10.2 Reiluusmetriikat)

Asetelman ja mallin muokkaaminen analyysin perusteella

Asetelman muuttaminen, mallin arkkitehtuurin korjaaminen, datan esikäsittelyn muutos, vinoumien oikominen (kts. 5.10.3 Oikomismenetelmät)