Deel dit artikel

“Wij willen als (semi-)overheid meer doen met onze informatie. Maar hoe doen we dat eigenlijk?”

De afgelopen twee decennia zijn semi-overheden steeds meer digitaal en informatie-bewust geworden. De voordelen zijn legio: Efficiëntere dienstverlening, lagere kosten, blijere klanten en gelukkige werknemers. Maar hoe zet je die volgende stap? Er leiden veel wegen naar Rome, maar hoed je voor beren op de weg. In deze blogserie ga ik in op een aantal aandachtspunten rondom dit thema. In deze eerste blog: Waarom de context van data zo belangrijk is.

Vinex-wijken zijn ‘hot property’

Jaarlijks publiceert het Verbond van Verzekeraars de Risicomonitor Woningbranden. De editie van 2014 haalde de media met een opvallende bevinding: De kans op woningbrand is groter in een Vinex-wijk dan in omringende wijken. In het bijgaande persbericht werden gelijk een aantal mogelijke verklaringen gegeven: De afwezigheid van bewoners (veel tweeverdieners die overdag werken en dus niet thuis zijn om een beginnende brand in de kiem te smoren), vandalisme door verveelde jeugd, ongelukjes door aspirant-deelnemers aan “Help! Mijn man is klusser” en een grote hoeveelheid aan elektrische apparatuur aan de oplader.

Klinkt allemaal niet geheel onredelijk. Maar… Zou je als beleidsmaker op basis van deze gegevens bijvoorbeeld meer brandweerkazernes bouwen in Vinex-wijken? Nee, want je wilt eerst onderzoeken of uitbreiding van het kazernenetwerk  een positieve invloed heeft op brandpreventie. Daarnaast moeten we kritisch kijken naar de brongegevens waar het Verbond zich op baseert. De hoofdbron voor de Risicomonitor Woningbranden zijn ingediende brandschadeclaims – waar mogelijk aangevuld met gegevens van het CBS en Brandweer Nederland. Waar deze aanvullende gegevens zijn gebruikt staat dit in de monitor vermeld. Dit is bij het gegeven over brandrisico in Vinex-wijken niet het geval, dus mogen wij er van uitgaan dat hier alleen de eigen gegevens (brandschadeclaims) zijn gebruikt.

Het Verbond lijkt hier ‘ingediende brandclaim’ in zekere zin gelijk te stellen aan ‘risico op brand’. Hoe meer ingediende brandclaims per abstractieniveau (provincie of wijk), hoe groter het risico op brand. Is dit echter wel wat er wordt gemeten? Brandschade die niet is gemeld bij een verzekeraar valt buiten het model. Slachtoffers van brandschade zonder inboedelverzekering, of mensen die een doorgebrande tosti-ijzer niet bij de verzekering melden, vallen dus buiten het model. Vermindert dit dan ook het risico op woningbrand? De vraag stellen is haar beantwoorden.

Data loves context

Cijfers alleen zeggen dus niets zonder context. Wil je data toepassen, dan moet je altijd het verhaal kennen achter de gegevens. Waar komen ze vandaan? Met welk doel zijn ze oorspronkelijk verzameld? Welke verklarende waarde hebben de gegevens? Brandschadeclaims zeggen op zichzelf niets over vandalisme door hangjeugd. In binnenstedelijke gebieden heb je óók vandalisme door hangjeugd. Stichten die minder brandjes dan jeugd in Vinex-wijken? Om deze hypothese van het Verbond te toetsen heb je dus meer, andere gegevens nodig. Bijvoorbeeld over typen vandalisme door jongeren.

De context van data is niet alleen belangrijk bij het beantwoorden van informatievragen. De context wordt nog belangrijker wanneer je informatie wilt delen met anderen buiten het eigen domein. Eenduidige definities worden dan absoluut noodzakelijk. Dezelfde of vergelijkbare concepten kunnen opeens heel verschillend worden geïnterpreteerd. Dit klinkt misschien heel abstract, maar ik zal het proberen te illustreren met een aantal voorbeelden. Neem bijvoorbeeld het verschil tussen ‘ingangsdatum zorgprofiel’ en ‘aanvang zorg’. Die eerste verwijst naar de datum vanaf wanneer een zorgprofiel is toegekend, die tweede verwijst naar de daadwerkelijke startdatum van de zorg. Meestal zit er een verschil tussen beide waarden. Er wordt doorgaans eerst een indicatie gesteld alvorens wordt aangevangen met zorgverlening. Vergelijkbare concepten, maar met grote gevolgen voor bijvoorbeeld stuurinformatie als ze door elkaar worden gebruikt!

Een meer absurd voorbeeld om het belang van context te benadrukken. Deze kun je zelf toetsen. Browse eens naar Google Search en vul ‘Houten, Bank’ in de zoekbalk. Ik voorspel dat je voornamelijk hits zult krijgen over houten bankjes (leuk voor op het terras). Vul dezelfde zoekterm nu eens in Google Maps. Je zult de locaties van verschillende banken (en wat andere financiële dienstverleners) in de plaats Houten te zien krijgen. Dit komt omdat Google Maps “weet” dat ‘Houten’ in deze context waarschijnlijk verwijst naar de plaats en niet naar de grondstof!

Van Dam & Oosterbaan kan helpen bij het inzichtelijk maken van je data, bij het helder krijgen van de context. Als organisatie kun je echter zelf al heel veel doen. Daar zal ik in een volgende blog meer over schrijven.

Bronnen:

Risicomonitoren Verbond van Verzekeraars ps://www.verzekeraars.nl/publicaties/risicomonitoren

Media-aandacht/perbericht n.a.v. Risicomonitor Woningbrand 2014 https://www.ad.nl/binnenland/onderzoek-verzekeraars-vaker-brand-in-vinex-wijk~a0aa1bb