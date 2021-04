Volgens de Rekenkamer is het algoritme om het risico op uitkeringsfraude in te schatten getraind met bevooroordeelde data. Er zijn vooral data gebruikt van uitkeringsontvangers die eerder al een heronderzoek gekregen hebben, in plaats van data van alle uitkeringsontvangers. Daardoor kan het zijn dat het algoritme mensen met bepaalde kenmerken die niet per se relevant zijn er eerder uitpikt voor heronderzoek.

De gemeente Rotterdam voerde in 2018 het programma Datagedreven Werken in, om zo digitaler en efficiënter te werk te kunnen gaan. Daarbij worden verschillende algoritmes ingezet. Eén van de algoritmes die is onderzocht is 'analytics uitkeringsfraude'. Daarbij stelt de computer op basis van verschillende achtergrondkenmerken van uitkeringsontvangers vast wie van hen een hoog risico vormt op frauderen . Een deel van hen wordt vervolgens onderworpen aan een heronderzoek.

Er is in de gemeente Rotterdam onvoldoende aandacht voor ethische principes bij het gebruik van algoritmes. Dat kan ertoe leiden dat er vooringenomen besluiten genomen worden bij bijvoorbeeld het opsporen van uitkeringsfraude. Die conclusie trekt de Rekenkamer Rotterdam in een onderzoek naar het gebruik van algoritmes door de gemeente.

Alleen is een algoritme niet zo objectief als het lijkt, want de achtergrondkenmerken die de basis vormen voor het algoritme, worden door mensen bedacht. Daardoor kan het zijn dat het algoritme menselijke vooroordelen juist bevestigt. Als bij de selectie van profvoetballers in het verleden bijvoorbeeld nooit iemand uit Groningen heeft gezeten, dan zal het algoritme iemand uit Groningen dus eerder overslaan.

Stel: je wilt als voetbalclub met hulp van machine learning nieuwe spelers scouten. Dan kun je bijvoorbeeld de gegevens invoeren van alle spelers die in de afgelopen dertig jaar in de eredivisie hebben gespeeld, met achtergrondkenmerken zoals woonplaats, leeftijd, of hun ouders gevoetbald hebben en hoeveel doelpunten ze in de jeugd gescoord hebben. Op basis van die dataset zou de computer dan kunnen vaststellen welke kenmerken belangrijke voorspellende waarde hebben bij het bepalen wie een goede profvoetballer is en potentiële nieuwe spelers langs die meetlat leggen.

Een algoritme is een set instructies die aan een computer gegeven wordt om tot een bepaalde conclusie of een besluit te komen. Voorbeeld: een zoekmachine analyseert jouw zoekgedrag en laat je op basis daarvan en andere kenmerken, zoals je leeftijd, persoonlijke advertenties zien. Algoritmes kunnen getraind worden om zelf te leren. Op basis van data van eerdere gevallen wordt aan een computer gevraagd verbanden te ontdekken. Dat wordt machine learning genoemd.

Vanwege discriminatiewetgeving mag er niet op bepaalde achtergrondkenmerken zoals afkomst geselecteerd worden. Maar indirect kan via het algoritme toch geconcludeerd worden of iemand van niet-Nederlandse komaf is, zegt de Rekenkamer: "Een voorbeeld hiervan is het niveau van spreekvaardigheid van de Nederlandse taal, maar ook of een burger inburgeringsbehoeftig is en de buurt waarin hij staat ingeschreven."

De Rekenkamer is verder kritisch op de gebrekkige transparantie rondom het algoritme. Het onderzoek stelt dat het "niet navolgbaar [is] welke keuzes rondom ethische vraagstukken zijn gemaakt". Voor de burger is het daarnaast "onmogelijk goed zicht te krijgen op hoe het algoritme een rol speelt bij de uitnodiging voor een heronderzoek".

Er is geen centrale regisseur voor de algoritmes en niemand is "integraal eindverantwoordelijk". Daarnaast wordt niet geëvalueerd of het gebruik van algoritmes beter werkt dan de traditionele methode. Officieel is het gebruik van het uitkeringsalgoritme nog een pilot, maar volgens de Rekenkamer is niet duidelijk gedefinieerd wanneer het algoritme goed genoeg werkt om definitief in gebruik genomen te worden.

Risico-inschatting

De gemeente Rotterdam kan zich voor een groot deel vinden in het onderzoek, maar is het niet eens met alle conclusies, staat in een reactie in het rapport. Volgens de gemeente is het algoritme bedoeld om juist minder burgers te belasten met heronderzoek, als daar geen reden voor is. De kans dat er een vooringenomen besluit genomen wordt, wordt verkleind doordat de heronderzoeken altijd door mensen plaatsvinden, stelt de gemeente: "Hierbij willen we benadrukken dat het algoritme niet de uitkomst geeft of iemand een fraudeur is. Het gaat echt om een risico-inschatting."

Eerder liep in Rotterdam-Zuid een proef met het omstreden SyRI-systeem. Daarbij werden systemen van verschillende instanties aan elkaar gekoppeld om risicoprofielen van fraudeurs op te stellen. De rechter zette vorig jaar een streep door het gebruik van SyRI. Begin dit jaar concludeerde de Algemene Rekenkamer dat er beter toezicht moet komen op het gebruik van algoritmes door overheidsinstanties.