Artikelenreeks Datageletterdheid – Verdieping: Datakwaliteit

In deze reeks artikelen neem ik je mee hoe datageletterdheid centraal staat in het proces van datagedreven werken. Elke paar weken post ik een artikel en daarin komt stap voor stap het belang van datageletterdheid binnen datagedreven werken aan bod. Vandaag gaan we dieper in op: datakwaliteit. 

In het artikel “stap 2: betrouwbare data” heb ik het onderwerp datakwaliteit ook besproken,  lees hier. We stonden hier stil bij dataregistratie en hoe datakwaliteit een onderdeel is binnen het proces van dataregistratie. In het artikel van vandaag gaan we dieper in op datakwaliteit in relatie tot het eindresultaat, de output, en hoe jij als eindgebruiker zelf de datakwaliteit kunt toetsen bijvoorbeeld door middel van een grafiek, tabel, rapportage of dashboard.  

 

Definitie datakwaliteit 

Wat is een gangbare definitie van datakwaliteit? Gebruik je vanuit de business, bijvoorbeeld als beleidsmedewerker, dezelfde definitie als bijvoorbeeld een applicatiebeheerder vanuit de afdeling informatievoorziening? 

Datakwaliteit is een samengesteld woord uit de worden ‘data’ en ‘kwaliteit’.  

Data= dit zijn feitelijkheden. De welbekende 1’tjes en 0’tjes. Denk aan cijfers in Microsoft Excel, maar ook aan onderzoekrapportages, de krant, social media en alles wat je smartphone vandaag de dag registreert. Data vloeit voort uit activiteiten binnen een proces. 

Kwaliteit= de technische eigenschappen van een stof en geschiktheid voor een bepaald gebruik aan te duiden en de mate van voldoening aan een vastgestelde norm. 

Vrij technisch allemaal nog. Als je deze twee combineert krijg je ‘datakwaliteit’ en een praktische definitie voor de business zou bijvoorbeeld kunnen zijn: een middel om te bepalen of jij in jouw positie wel of niet iets kunt met de data. En zo ja, in welke mate dan. Technisch gezien, of vanuit de bril van een data-analist, applicatiebeheerder of informatieanalist, wordt anders naar de definitie gekeken. Dit gebeurt aan de hand van enkele technische criteria. Deze zes gangbare criteria binnen informatiemanagement zijn: 

  • Accuraat: is de data punctueel, zonder fouten en interrupties?  
  • Volledig: is de data allemaal aanwezig, juist ingevuld? 
  • Type/formaat: wordt alle data volgens dezelfde manier geregistreerd? Denk aan geboortedata (22/01/1980 of jan/22/’80). 
  • Consistentie: wordt (bijv. vanuit verschillende bronnen) de data op dezelfde manier opgesteld? 
  • Dubbelingen: zijn alle records uniek of staat data er dubbel in? 
  • Integriteit: is elke record volledig herkenbaar inclusief alle onderdelen van de data of ontbreken er bijvoorbeeld van een klant of zorgaanbieder er onderdelen waardoor je de data niet kunt koppelen aan andere data. Bijvoorbeeld categorieën of subonderdelen.

 

Elke keer als je vanuit de business een tabel of een grafiek bekijkt, ga je natuurlijk niet al deze criteria langs om de datakwaliteit te toetsen. We maken dus onderscheid tussen technische (vanuit informatievoorziening) datakwaliteit en praktische (vanuit de business) datakwaliteit. 

 

Hoe kan ik vanuit de business dan wel naar een tabel of grafiek kijken? 

Het zou fijn zijn als er vanuit de techniek reeds de eerder genoemde criteria zijn verwerkt in de totstandkoming van de tabel of grafiek. Als je bijvoorbeeld met je muis over de tabel of grafiek heen gaat dat er achterliggende informatie getoond wordt over de criteria. Daarmee wordt de technische datakwaliteit in ieder geval alvast bevestigd en kun jij je als eindgebruiker focussen op de datakwaliteit vanuit jouw positie. Waar ‘moet’ jij dan nog op letten? Stel jezelf (enkele van) de volgende vragen: 

  • Welke data had ik verwacht en komt dit in de buurt bij wat ik nu zie? 
  • Uit welke bronnen is deze data ontsloten? 
  • Welke berekeningen liggen hier eventueel onder? 
  • Hoe ziet het primaire proces van dataregistratie eruit? 
  • Welke collega’s of partners hebben zich gemoeid met deze data? 
  • Wie heeft deze grafiek of tabel gebouwd? 
  • Over welke periode of tijdslijn gaat deze data? 
  • Wat zegt mijn interpretatiegevoel over deze data? 
  • Herken ik deze cijfers als ik vanuit mijn domeinkennis hier naar kijk? 
  • Klopt dit wel?!

 

Je hoeft natuurlijk niet op alle vragen een compleet antwoord op te hoesten of in elke situatie deze vragen toe te passen. Voornamelijk bij nieuwe data, eerste publicaties en vernieuwde rapportages of dashboards doe je er wijs aan om uitgebreider deze praktische toetsen toe te passen. Naar mate je dezelfde data over nieuwe periodes en ververste indicatoren krijgt, zul je minder tijd te hoeven besteden aan deze praktische toetsen. Er helemaal niet meer bij stil staan is nou ook niet de bedoeling…  

Het toetsen en bepalen van de datakwaliteit is een samenspel van techniek en praktijk, een samenwerking tussen de applicatiebeheerder dan wel analist en de inhoudelijke collega dan wel beleidsmedewerker. 

Ik kan me voorstellen dat je na dit artikel nog met enkele vragen zit zoals: 

  • Wat als de technische datakwaliteit-check niet reeds is uitgevoerd? Of als jij als eindgebruiker dit niet zelf kunt toetsen/checken? 
  • Hoe ga je de technische criteria van datakwaliteit in de praktijk brengen?  
  • Hoe maak je deze onderdeel van de informatievoorzieningsprocessen?  
  • Hoe bevorder je de datageletterdheid bij de business om de datakwaliteit te kunnen toetsen? 
  • Hoe zorg je er voor dat de business en de IT het besef krijgen van elkaars taal, inzicht en behoeften en pro actief met elkaar constructief het gesprek aan gaan?

 

Meer weten?

Neem contact op met onze Business Consultant Esrah Jellema via esrah.jellema@vandamdatapartners.nl of bel 085- 112 4371 

Deel via

Op de hoogte blijven van Van Dam Datapartners?

Schrijf je in voor onze nieuwsbrief!

Solliciteren

Vul hieronder jouw gegevens in om te solliciteren.

Inschrijven

Training Inleiding Power BI

10 november

Vul hieronder jouw gegevens in om je in te schrijven voor de training. Voor deze training geldt het speciale actietarief van € 280,- per persoon.

Inschrijven

Training Datagedreven Communicatie en Storytelling

3 november

Vul hieronder jouw gegevens in om je in te schrijven voor de training. Voor deze training geldt het speciale actietarief van € 280,- per persoon.

Inschrijven

Training Datagedreven Cultuur en Organisatie

16 oktober

Vul hieronder jouw gegevens in om je in te schrijven voor de training. Voor deze training geldt het speciale actietarief van € 280,- per persoon.

Inschrijven

Training Data Ethiek

26 oktober

Vul hieronder jouw gegevens in om je in te schrijven voor de training. Voor deze training geldt het speciale actietarief van € 280,- per persoon.

Inschrijven

Leerlijn Datagedreven Werken

Vul hieronder jouw gegevens in en vink de trainingen aan die je zou willen volgen om je in te schrijven voor de Leerlijn Datagedreven Werken. Onze Academy neemt vervolgens zo snel mogelijk contact met je op om je inschrijving te bespreken.

Offerte aanvragen

Vink hieronder de door jou gewenste configuratie aan en vul je contactgegevens in. Onze Business Consultants nemen dan zo snel mogelijk contact met je op.

Offerte aanvragen

Vink hieronder de door jou gewenste configuratie aan en vul je contactgegevens in. Onze Business Consultants nemen dan zo snel mogelijk contact met je op.

Offerte aanvragen

Vink hieronder de door jou gewenste configuratie aan en vul je contactgegevens in. Onze Business Consultants nemen dan zo snel mogelijk contact met je op.