Turvallisen kehittämisen kannalta tärkeimmät työvaiheet ovat henkilötietojen hyödyntämiseen liittyvien ennustemallien tasapuolisuuden tai reiluuden varmistaminen. Reiluusmetriikat pyrkivät tunnistamaan, toteuttaako malli systemaattisesti erilaista kohtelua muodostaessaan ennusteita tai luokitteluita. Reiluusmetriikoita on kolmea kategoriaa:

  • Yksilöreiluus: kohteleeko malli samalla tavalla henkilökohtaisilta ominaisuuksiltaan erilaisia, mutta muilta ominaisuuksiltaan samanlaisia yksilöitä
  • Ryhmäreiluus: ryhmien välisten erojen tutkiminen tilastollisin testein
  • Syrjintäperusteiden vaikutusta ennusteisiin arvioiviin menetelmiin

Reiluusmetriikoita on esitetty sekä regressio, luokittelu että klusterointimenetelmille. Turvallisen kehittämisen kannalta oleellista on tiedostaa, mitkä reiluusmetriikat soveltuvat erilaisiin sovelluksiin, ja tarpeen vaatiessa, ratkaisun toteutuksessa voidaan toteuttaa myös tilanteeseen paremmin sopivampia metriikoita (1).


Taulukko 17: Reiluusmetriikoita mallin hyvyyden mittaamiseen.

Metriikka

Kuvaus

Tilastollinen pariteetti

Positiivisen luokittelun todennäköisyys on yhtä suuri eri kohderyhmissä.

Ehdollinen tilastollinen pariteetti

Positiivisen luokittelun todennäköisyys on yhtä suuri kahdessa eri syrjintäperusteiden avulla määritetyssä ryhmässä, jos ne saavat samoja muuttujan arvoja. Laina myönnetään samalla todennäköisyydellä sekä naimissa olevalle, että naimattomalle, jos heidän tulonsa ovat samat.

Virhetasojen yhtäläisyys

Väärän positiivisen ja väärän negatiivisen ennusteen todennäköisyys tulee olla sama etnisestä ryhmästä riippumatta.

Yksilöreiluus

Kaikkien kahden yksilön parien ennusteiden ero riippuu ainoastaan hyväksyttävissä olevista eroista yksilöiden välillä. Ero etnisessä taustassa ei saa vaikuttaa ennusteissa esiintyviin eroihin.

Kalibraatio

Tavoitemuuttujan todellisten arvojen tulee olla yhtä suuria etnisestä ryhmästä riippumatta.