Data-gedreven aanpak re-integratie

Hoe kan data science helpen om mensen sneller aan het werk te krijgen? Eind maart 2018 zijn er in Nederland 459.000 gerechtigden. Er wordt fors geïnvesteerd om deze mensen weer aan het werk te krijgen. Maar hoe zorg je ervoor dat je deze re-integratievoorzieningen effectief inzet? Re-integratieprofessionals hebben vaak wel een algemeen beeld van wat bij wie werkt. Maar wat is nu, volgens de data, de beste ondersteuning voor wie? 

Samen met de gemeente ’s-Hertogenbosch zijn we in 2016 een pilot gestart om de toepassingen van data science op het gebied van re-integratie te bepalen. Deze pilot is uiteindelijk verder ontwikkeld om diverse gemeenten meer inzicht te geven in de optimalisatie van re-integratiemiddelen. De vraag die bij deze projecten centraal staat is: hoe kunnen we integratievoorzieningen efficiënter inzetten? 

Om hier inzicht in te krijgen leggen we allereerst bloot welke patronen in de cliëntkenmerken leidt tot een snellere uitstroom uit de bijstand. Zo kunnen we het effect van de voorzieningen meten en voorspellen. Hiervoor gebruiken we onderstaand onderzoekmodel.

Wat is de slimste interventie/voorziening bij welk type werkzoekenden?

Om vervolgens inzicht te krijgen in de meest effectieve re-integratieaanpak gebruikten we een aantal machinelearning-technieken op een dataset met ruim 5 jaar aan uitkeringsgegevens.

  1. Analyse van het cliëntenbestand door middel van clusteranalyse: welke op elkaar lijkende cliëntgroepen (op basis van overeenkomstige kenmerken) zijn er in het bestand?
  2. Analyse van invloed van persoonskenmerken op uitstroom met behulp van survivalanalyse en classificatie: welke combinatie van persoonskenmerken bepalen de kans of iemand uitstroomt? Welke cliëntgroepen met opvallend hoge en lage kansen volgen hieruit?
  3. Verbinden van personen en persoonskenmerken aan de inzet/interventies, en het effect daarvan op uitstroom: Welke interventies lijken effectief te zijn? Welke (combinatie van) persoonskenmerken zijn bij specifieke interventies bepalend voor de kans op succes?

Eén van de aspecten van deze projecten is om te voorspellen of een cliënt gaat uitstromen naar een full-timebaan of dat hij in de uitkering zal blijven. We gebruiken hier verschillende methoden voor, maar om dit inzichtelijk te maken gebruiken we in dit project Classification Trees. Zie hieronder een voorbeeld van een Classification Tree.

Een Classification Tree, zoals gebruikt bij het project ‘Datagedreven aanpak re-integratie’. Deze boom is niet gebaseerd op de oorspronkelijke data om de privacy te beschermen. In de groene knoop stromen de meeste mensen uit en in de rode knopen stromen de meeste mensen niet uit.

Van hindsight naar foresight

Kenmerkend voor de analyses is dat we ons niet beperken tot ‘hindsight’-analyse (feitelijke beschrijving van het bestand en de gerealiseerde uitstroom), maar dat we ons vooral richten op ‘insight’ (inzicht in verklarende kenmerken, patronen) en waar mogelijk ook ‘foresight’ (verwachte uitkomsten bij specifieke cliënten en inzet). Naast dat je dit model kan gebruiken om inzicht te krijgen in de doelgroepen, kan je het dus ook gebruiken als een eerste stap voor voorspellingen. 

Algoritmes om deze modellen te genereren kiezen namelijk op een slimme manier kenmerken voor de splitsingen in de boom. Dat biedt ons weer mooi inzicht in de combinatie van factoren die samenhangen met de uitkomstvariabele. In bovenstaand voorbeeld kan het bijvoorbeeld interessant zijn om te kijken hoeveel mensen boven de 26 toch uitstromen of welke mensen onder de 26 zonder kinderen niet uitstromen. Ofwel: waar is de uitkomst beter of slechter dan verwacht?

Voor de gemeente ’s-Hertogenbosch hebben we onder andere een tool gemaakt waarbij je interactief classification trees kan genereren uit de data. Denk hierbij aan het filteren op groepen mensen (leeftijd, lengte van de uitkering), het aanpassen van de uitstroomredenen waar we in geïnteresseerd zijn (werk, scholing, inkomsten, handhaving, verloop of overig) of het aanpassen van de variabelen.  

Inzichten voor effectievere inzet

Uit de analyses komen interessante inzichten. Zo is de invloed van het aantal kinderen van een cliënt op de lengte van de uitkering veel groter dan gedacht. Ook blijkt het hebben van een parttime inkomen nadelig voor cliënten met een hoge loonwaarde. Met dergelijke kennis kunnen professionals voorzieningen effectiever inzetten. ’s-Hertogenbosch kan met deze machinelearning-modellen ook veel preciezer inschatten wie in de toekomst extra begeleiding nodig heeft en welke personen snel uitstromen. Deze datagedreven aanpak helpt mensen sneller te laten participeren in de samenleving. Een data-oplossing die publieke waarde oplevert.

Ben je benieuwd wat we voor jouw gemeente op het gebied van re-integratie kunnen betekenen? Neem dan contact op om hier eens over van gedachten te wisselen. 

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *