Home » Actueel » Data Gedreven Werken – De valkuilen waarin ik trap

Data Gedreven Werken – De valkuilen waarin ik trap

Jeugdzorg Voorspelmodel

Gemeenten en datagedreven werken is een combinatie die in de kinderschoenen staat. Het overgrote deel van de gemeenten (circa 300) wordt gezien als starter[1]. Zelf sta ik ook aan een nieuw leertraject, sinds september volg ik aan de Jheronimus Academy of Data Science (JADS) een opleiding in Data Science. Tijdens deze opleiding ontwikkel ik een voorspelmodel jeugdzorg. Via deze terugkerende blog neem ik jullie mee in mijn leerschool in de (on)zin van datagedreven werken en de valkuilen waar ik ongetwijfeld in zal stappen.

Model voor data-projecten

Het CRISP-DM model[2] vormt een theoretisch, maar ook praktisch kader voor een dataproject (figuur 1). Aan de hand van dit model zal ik de komende maanden een dataproject doorlopen. Het doel hiervan is gemeenten inzicht te geven wat de verwachte groei of afname wordt van het aantal jeugdhulptrajecten de komende jaren.

Figuur 1 CRISP-DM model voor dataprojecten

Mismatch tussen behoefte en uitkomst

Wat mij gelijk opvalt bij de visualisatie van het CRISP-DM model is de centraliteit van de data in het figuur. Uiteraard is een dataproject niets zonder data. De verleiding is daarmee groot om de data leidend te laten zijn voor een project. De data bepaalt dan welke vraag beantwoord wordt, terwijl de behoefte van de business (in dit geval de gemeente) altijd centraal moet staan in een project. Deze mismatch tussen behoefte en uitkomst is dan ook een veelvoorkomende reden waarom dataprojecten niet slagen.[3] Het inrichten van een datawarehouse en de data marts, zonder concrete datavraagstukken voor ogen, zie ik regelmatig gebeuren. Soms moet de gehele inrichting opnieuw gedaan worden, omdat met de data marts (= subsets van data vanuit het datawarehouse voor analyse) de businessvragen niet beantwoord kunnen worden.

Het klinkt zo voor de hand liggend: een geslaagd dataproject beantwoordt aan de vraag vanuit de business. De praktijk is dus blijkbaar weerbarstiger.

Afbakening grip op jeugdzorg

Neem mijn project als voorbeeld. Gemeenten worstelen met tekorten op de begroting, waarvan de meeste uitgaven in het sociaal domein zitten.[4] Grip op het sociaal domein en specifiek de jeugdzorg is een behoefte die groot is.[5] Maar grip op sociaal domein is geen praktisch dataproject. Ook de afbakening grip op jeugdzorg is nog vele malen te groot. Hoe maak je een dataproject behapbaar, wat de kans op slagen vergroot[6], zonder de businessbehoefte uit het oog te verliezen? De vraag aan welke beleidsknoppen kan gedraaid worden met welk mogelijk financieel resultaat klinkt dan al veel praktischer (en wenselijk!). Deze vraag blijkt dan weer te ambitieus. Bij het volwassenheidsmodel van Gartner zitten we dan gelijk op de hoogste analytische trede van een dataproject (figuur 2). Dit is nog te ambitieus voor mij, en voor gemeenten waarschijnlijk ook, die voornamelijk op het laagste niveau van dit model zitten[1].

Figuur 2 Gartner’s Data Science Volwassenheidsmodel

Al snel wordt de verleiding dan groot om aan de hand van de data de scope van de vraag te gaan bepalen. Ik denk dat dit in veel gevallen niet verkeerd is, maar afstemming of dit de vraag is die aan de behoefte voldoet is dan wel cruciaal. Steek dus veel tijd in het pingpongen tussen het gedeelte business doorgronding (understanding) en data doorgronding (understanding) uit het CRISP-DM model. Op basis van deze ping-pongsessies waarbij behoefte, scope en beschikbaarheid aan data zijn besproken, is voorlopig de volgende vraag geformuleerd voor het dataproject: Hoeveel jeugdzorgtrajecten zorg in natura (ZIN) zijn er te verwachten per wijk en per jaar (t/m 2023).

Suggesties voor onderzoeksvraag?

Ik noem het bewust een voorlopige onderzoeksvraag, omdat met inzichten in het vervolg van de cyclus deze vraag met enige zekerheid aan verandering onderhevig zal zijn. Daarom kom ik graag met je in contact als je suggesties hebt voor aanscherping van het project, andere invalshoeken hebt/kent of interesse hebt om dit bij je gemeente uit te voeren.

De komende maanden zal ik jullie meenemen in mijn ontdekkingstocht, waarbij ik hopelijk niet over een half jaar schrijf: ik had mezelf nog zo gewaarschuwd om niet in die valkuil te trappen, maar toch….

Meer weten?

Voor meer informatie kunt u contact opnemen met Tim van der Pol, adviseur bij Telengy, via tel. nr.  06 21 36 68 58 of via e-mail: t.v.d.pol@telengy.nl.

 

[1] VNG Rapport – Opschaling Datagedreven Werken (september 2020)

[2] CRISP-DM (Cross-industry standard process for data mining) – https://www.the-modeling-agency.com/crisp-dm.pdf

[3] https://towardsdatascience.com/why-data-science-projects-fail-revisited-85fe242c3931

[4] https://www.binnenlandsbestuur.nl/financien/nieuws/tekort-gemeenten-minstens-1-miljard-euro.12993839.lynkx 

[5] https://www.binnenlandsbestuur.nl/Uploads/2020/3/visitatiecommissie-financiele-beheersbaarheid-20200316.pdf

[6] https://www.gartner.com/en/newsroom/press-releases/2018-02-13-gartner-says-nearly-half-of-cios-are-planning-to-deploy-artificial-intelligence