Vooringenomenheid (bias), aannames, persoonlijke belangen en andere eenzijdige perspectieven. Onbedoelde discriminatie, profileren en het bewust of onbewust bevoordelen of benadelen van individuen, groepen en locaties is een steeds aanwezig risico bij het gebruik van (locatie)data. Geen enkele dataset kan alle relevante facetten van een persoon, gemeenschap, situatie of locatie volledig representeren. Eerlijk gebruik van data erkent en herkent dit. Door niet alleen te steunen op data, maar ook diversiteit aan te brengen in de expertise en perspectieven die worden geraadpleegd. Zodat ook vertrouwd kan worden op de juistheid, volledigheid en betrouwbaarheid van de data. Inclusiviteit en kwaliteit gaan verder dan data. Ook de vraagstelling, de betrokken mensen, de gebruikte bronnen vereisen een eerlijke afspiegeling van inclusiviteit en kwaliteit. Dit verdient aandacht en aanpak bij het ontwerp en gedurende de hele levenscyclus van data en informatieproducten.

strip met voorbeeld van eerlijk kwalitatief

Pas toe en leg uit ontwerpprincipes

  1. Herken en erken de altijd aanwezige vooringenomenheid (bias). In jezelf en in anderen. Om het bewust of onbewust bevoordelen of benadelen, onbedoelde discriminatie en profileren van individuen, groepen mensen en locaties te vermijden.
  2. Gebruik altijd een divers en inclusief geheel van bronnen om te komen tot verantwoorde beeld-, beleids- en besluitvorming. In ieder geval: interne en/of externe domeinexpertise; de situatie en locatie ter plekke (gaan kijken); de primaire belanghebbenden (gaan praten); en verantwoorde data.
  3. Maak data voldoende inclusief. Voor een representatieve uitwerking van de voorliggende vraag. Erken dat geen enkele dataset alle relevante facetten van een persoon, gemeenschap, situatie of locatie volledig kan representeren.
  4. Definieer en hanteer de minimaal benodigde kwaliteit van de data om de voorliggende vraag goed te kunnen beantwoorden (zie ook de waarde ‘rechtvaardig doelgericht’). Nog voordat data verzameld en gebruikt worden. Bijvoorbeeld in termen van juistheid, volledigheid, nauwkeurigheid, betrouwbaarheid en actualiteit. Dit dient als startpunt en referentie om data te kunnen beoordelen, waarderen en organiseren.
  5. Ontwerp, presenteer, visualiseer en interpreteer data, services en informatieproducten op basis van de inzichten uit bovenstaande ontwerpprincipes.

Speciaal aan locatiedata

We gaan er vaak vanuit dat mensen die dezelfde locaties bezoeken of dichtbij elkaar wonen, meerdere overeenkomsten hebben met elkaar. Zoals gedeelde interesses, eigenschappen, behoeftes of demografische kenmerken. Dit kan leiden tot stereotyperingen, die overduidelijk niet al te serieus genomen moeten worden, zoals in een illustratie van Victor Van in Trouw. Of stereotyperingen die (onbewust) juist serieus genomen worden. En daardoor (groepen) individuen onrechtvaardig profileren en typeren. Stel bijvoorbeeld dat de locatiegeschiedenis van een persoon aantoont dat hij/zij regelmatig dezelfde zorginstelling bezoekt. Dan kan het zijn dat diegene gezondheidsproblemen heeft, maar deze persoon kan ook een gezondheidsmedewerker zijn. Die twee gevallen kunnen moeilijk te onderscheiden zijn met het gebruik van enkel persoonlijke locatiedata. En aannames liggen op de loer: Wat als bekend is welk opleidingsniveau, inkomen, nationaliteit, geslacht en leeftijd die persoon heeft?

Bovendien kan de focus op bepaalde overeenkomsten in kenmerken juist leiden tot onterechte vergelijkingen. Gedurende de Covid-19 crisis ontpopten bijvoorbeeld verschillende kaarten met het aantal besmettingen op postcode vier of zes niveau van wijken en buurten, waarbij geen aandacht werd besteed aan het feit dat het ene gebied dichter bevolkt, van grotere omvang en meer stedelijk is dan een ander gebied. Zonder die verschillen te benoemen, ontkoppel je de data van de specifieke ruimtelijke eigenschappen waarvan de data afhankelijk zijn.

En wat als de conclusies die worden onttrokken uit data niet onterecht zijn wegens vooringenomenheid, maar omdat de locatiedata zelf onjuist zijn? Een gezin in Dronten wordt vanwege de coördinaten van hun adres al jaren bedreigd door onbekenden. Ze ontvangen geregeld onaangename berichten als: "We weten je te vinden" en “We zullen je een lesje leren” omdat ze wonen op een plek die foutief gekoppeld is aan meerdere IP-adressen. Organisaties waarvan de fysieke locatie onbekend is, krijgen namelijk de coördinaten van het middelpunt van een land toegewezen. Het land wordt bepaald aan de hand van het IP-adres van de organisatie. Daardoor komen ontevreden mensen die contact zoeken met dergelijke organisaties met een Nederlands IP-adres in hun online zoektocht vaak uit bij de coördinaten 52°30 0 N, 5°45 0 E. Oftewel het huis van het gezin in Dronten. Ditzelfde komt ook voor in de Verenigde Staten waarbij een gezin in Kansas wordt bedreigd. Hun adres is gekoppeld met 600 miljoen IP-adressen van organisaties. Een ogenschijnlijk onschuldige fout kan dus directe nadelige consequenties hebben. Daarom is het zo belangrijk om de kwaliteit van locatiedata te waarborgen.

Waar de wet stopt en ethiek verder gaat

Met uitdrukkelijke toestemming mogen persoonsgegevens worden gedeeld. Daarbij geldt wel de verwachting dat die persoonsgegevens kloppen. Die verwachting is wettelijk vastgelegd in artikel 1(d) van de AVG: “Persoonsgegevens moeten juist zijn en zo nodig worden geactualiseerd; alle redelijke maatregelen moeten worden genomen om de persoonsgegevens die, gelet op de doeleinden waarvoor zij worden verwerkt, onjuist zijn, onverwijld te wissen of te rectificeren ("juistheid").” Maar wie bepaalt wat juist is? Volgens artikel 16 van de AVG is dat de betrokkene. Die kan namelijk eisen dat de hem betreffende onjuiste en onvolledige persoonsgegevens gecorrigeerd en/of aangevuld worden.

Maar wat zijn persoonsgegevens? De luchtkwaliteit op een balkon kan bijvoorbeeld suggereren dat de bewoner rookt, maar data van een luchtmeetsensor worden doorgaans niet gezien als persoonsgegevens. Heeft die bewoner dan ook zeggenschap over de juistheid en volledigheid van de data? En wat als metingen aantonen dat de luchtkwaliteit in de wijk doorgaans slecht is, terwijl de buren (die geen sensor hebben en niet meedoen aan het meetproject) hun huis proberen te verkopen? Zij worden indirect belast met de conclusies die worden getrokken uit data die buiten hun om verzameld, verwerkt en gedeeld worden. Hebben zij zeggenschap over de juistheid en volledigheid van die data? Wie definieert datakwaliteit?De INSPIRE richtlijn schiet te hulp met artikel 5(1): “De lidstaten zorgen ervoor dat metagegevens worden opgesteld en bijgewerkt voor de verzamelingen ruimtelijke gegevens en diensten.” Metagegevens zijn belangrijk omdat ze onder andere aangeven welke data zijn opgenomen, welke actualiteit de data hebben en met welke kwaliteit de data zijn vastgelegd. Om die metadata op een begrijpelijke, consistente en heldere wijze te presenteren zijn standaarden nodig. Geonovum heeft verschillende handreikingen gepubliceerd waarin Nederlandse- en EU metadata standaarden worden uitgewerkt en toegelicht. Een mooi voorbeeld hiervan is de Gegegevenscatalogus van de Basisregistratie Grootschalige Topografie. Geografische gegevens moeten wettelijk voldoen aan bepaalde kwaliteitseisen. Deze catalogus geeft inhoud aan de begrippen: actualiteit, nauwkeurigheid, volledigheid en consistentie.

Maar, eerlijk datagebruik is niet alleen afhankelijk van de kwaliteit van de data. Dit is waar de wet stopt en de ethiek verder gaat: het punt waarop niet meer wordt gekeken naar de data zelf, maar naar de eisen die we stellen aan het gebruik ervan. Waar zijn de standaarden voor gelijkheid, inclusiviteit en integriteit in het datagebruik? Waar kan ik de beperkingen ten aanzien van aannames en vooroordelen vinden in de metadata? In artikel 1 van de Grondwet staat: “Allen die zich in Nederland bevinden, worden in gelijke gevallen gelijk behandeld. Discriminatie wegens godsdienst, levensovertuiging, politieke gezindheid, ras, geslacht of op welke grond dan ook, is niet toegestaan.” Hoe voorkomen we (onbedoelde) profilering, stereotypering en discriminatie bij het gebruik van data? Die vragen worden overgelaten aan de ethiek.

Handelingsinspiratie Eerlijk kwalitatief en inclusief

 

herken biasHerken bias

Herken en erken de altijd aanwezige vooringenomenheid (bias). In jezelf en in anderen. Om het bewust of onbewust bevoordelen of benadelen, onbedoelde discriminatie en profileren van individuen, groepen mensen en locaties te vermijden.

 

 

Opdrachtgever

Is in de opdracht of opgave inclusieve betrokkenheid als leidend principe opgenomen? Inclusieve betrokkenheid van de mensen die geraakt worden door het project of product. Zodat hun verschillende perspectieven en belangen leidend zijn, in plaats van ‘mijn’ vooringenomenheid.
Vind ik dit zelf intrinsiek belangrijk? Hoe draag ik dat uit? Neem ik zelf deel aan het gesprek.


Projectleider

Welke aannames zitten verscholen in het doel, de opgave en de uitvoering van het project? Hoe kan ik, samen met het team, deze aannames inventariseren, benoemen en bespreken? Hoe beperk ik het risico dat dit project of product discriminatie van bepaalde mensen, groepen of locaties provoceert?
Heeft het team de ruimte en de vrijheid om aannames, vooroordelen, (persoonlijke) belangen, overtuigingen, patronen en andere eenzijdige perspectieven te adresseren en te bespreken? Is hier een proces voor ingericht?
Zijn de mensen die geraakt worden door het project of product uitgenodigd om hun perspectieven en belangen te delen? Is er voldoende ruimte om vragen of opmerkingen in te dienen, om risico's aan de orde te stellen, om beslissingen te betwisten of om onbedoelde effecten te melden? Hoe wordt dit gehoord en zorgvuldig verwerkt?

Uitvoerende team

Zijn wij betrokken bij gesprekken met mensen die geraakt worden door het project of product? Zodat hun verschillende perspectieven en belangen leidend zijn, in plaats van ‘onze’ vooringenomenheid.
Hoe worden de verzameling, uitsluiting, analyse, interpretatie, visualisatie en (geautomatiseerde) besluiten van data beoordeeld op vooringenomenheid? Om eventuele ongewenste effecten te voorkomen, waaronder het ontstaan van onbedoelde discriminatie. Weerspiegeld de data een waarheidsgetrouwe representatie?
Zijn er vaste contact/feedback momenten tussen data- en inhoudelijke specialisten over beperkingen en risico’s in de data? Bespreek samen bevindingen, zorgen en twijfels.
Bestaat er een mogelijk risico op discriminatie van een locatie of gebied? Bijvoorbeeld wanneer een relatie tussen locatie, inkomen, geslacht en/of etniciteit leidt tot oneerlijke geografische modellen die bepaalde groepen of personen (onbedoeld) discrimineert? Gebruik in dat geval meerdere gegevensbronnen om de validiteit van de data te verhogen.

Eindgebruiker

Welke aannames, vooroordelen, (persoonlijke) belangen, overtuigingen, patronen en andere eenzijdige perspectieven heb ik bij het gebruik van het product? Hoe beïnvloedt dit mijn gebruik van het product?
Begrijp ik welke aannames zijn gemaakt gedurende het project? Weet ik wie betrokken is geweest bij het formuleren en bespreken van deze aannames?
Zijn de perspectieven en belangen van betrokken individuen, groepen en locaties voldoende doorleefd en vertegenwoordigd in het project? Niet alleen gedurende het ontwerp en de uitvoering van het project, maar ook bij de monitoring? En is dat inzichtelijk? Hoe uit zich dat in het product?

 

Iconen-ethiek_VerzamelGebruik diverse bronnen

Gebruik altijd een divers en inclusief geheel van bronnen om te komen tot verantwoorde beeld-, beleids- en besluitvorming. In ieder geval: interne en/of externe domeinexpertise; de situatie en locatie ter plekke (gaan kijken); de primaire belanghebbenden (gaan praten); en verantwoorde data.

 

Opdrachtgever

Heb ik een goed beeld van de benodigde bronnen voor een zorgvuldige beantwoording van de voorliggende vraag of opdracht? Niet datagedreven, maar zelf doorleven.
Zijn de verschillende gegevensbronnen inclusief verwerkt in de opdracht of opgave?
Zijn er voldoende middelen (zoals tijd en budget) beschikbaar om een divers en inclusief geheel van bronnen te kunnen raadplegen?

Projectleider

Welke bronnen zijn relevant voor dit project? Wie bepaalt dat?
Is het onderzoeken en gebruiken van iedere benodigde bron verwerkt als hoofdactiviteit in mijn breakdown structure?
Heb ik voldoende toegang tot de bronnen om deze verantwoord te kunnen gebruiken?
Hoe breng ik samenhang in de resultaten en inzichten vanuit de verschillende bronnen?

Uitvoerend team

Is duidelijk welk proces we volgen om iedere bron optimaal te kunnen betrekken, bevragen en benutten? Welke methodieken worden gebruikt?
Hoe brengt het uitvoerende team de verschillende bronnen samen en in samenhang? Zodat een inclusief beeld ontstaat.
Hoe wordt verzekerd dat de bronnen gelijkwaardig worden behandeld?

Eindgebruiker

Hoe zijn de verschillende bronnen meegenomen in het product? Welke keuzes zijn daarbij gemaakt? Heb ik inzichten in de resultaten en inzichten vanuit de afzonderlijke bronnen?
Vind ik dat alle relevante bronnen zijn geraadpleegd? Volgens de juiste methode?
Welke rol speel ik bij het betrekken, bevragen en benutten van de diverse bronnen?

 

 

Iconen-ethiek_AfstemmingMaak data voldoende inclusief

Erken dat geen enkele dataset alle relevante facetten van een persoon, gemeenschap, situatie of locatie volledig kan representeren.

 

 

 

Opdrachtgever

Heb ik voldoende zicht op de data? Ben ik in staat om in te schatten of deze voldoende representatief zijn?
Wat kan ik in de opdracht opnemen over de inclusiviteit van de data?

Projectleider

Wanneer zijn de data voldoende representatief? Wie bepaalt dat?
Hoe zijn de juiste mensen vanuit verschillende perspectieven en (domein)expertise betrokken bij het ontwerpen en beoordelen van de data? Is deze groep mensen voldoende inclusief, volledig, integer en bekwaam?
Hoe organiseer ik dat de data het juiste beeld schetsen en de werkelijkheid zo goed mogelijk reflecteren?

Uitvoerend team

Zijn alle relevante personen, groepen en locaties voldoende vertegenwoordigd in de data? Wat ontbreekt en wat is ondervertegenwoordigd? Hoe compenseren we dat? Benoem, bespreek en verklaar beperkingen, afwijkingen, inconsequenties en andere ongelijkheden in de data.
Zijn alle relevante eigenschappen van de gebruikte data afdoende gedefinieerd? Zodat helder is hoe en welke personen, groepen en locaties terugkomen in het product?
Hebben wij helder en begrijpelijk uitgelegd welke stappen we hebben genomen om voldoende inclusiviteit in de data te garanderen?

Eindgebruiker

Kan ik aan de hand van het eindproduct duiden welke data zijn gebruikt in het product? En kan ik uitleggen hoe personen, groepen, objecten en locaties zijn gerepresenteerd?
Zijn alle relevante data volgens jou gebruikt? Volgens de juiste methode?
Welke rol speel ik bij het betrekken, bevragen en benutten van de diverse data?

 

Iconen-ethiek_SpecificeerDefinieer en hanteer minimaal benodigde kwaliteit data

Weet welke kwaliteit de data minimaal nodig heeft om de voorliggende vraag goed te kunnen beantwoorden (zie ook de waarde ‘rechtvaardig doelgericht’). Nog voordat data verzameld en gebruikt worden. Bijvoorbeeld in termen van juistheid, volledigheid, nauwkeurigheid, betrouwbaarheid en actualiteit. Dit dient als startpunt en referentie om data te kunnen beoordelen, waarderen en organiseren.

 


Opdrachtgever

Is een begrijpelijke uitleg en verantwoording van de gekozen datakwaliteit beschikbaar en deelbaar? En de mate waarin daadwerkelijk gebruikte data aan deze kwaliteit voldoen?
Waak voor 'data jumping'. Waarbij de kwaliteit van reeds beschikbare data de kwaliteitsnorm bepaalt, in plaats van de voorliggende vraag.

Projectleider

Heb ik vroegtijdig ruim aandacht ingepland voor het bepalen van de kwaliteitsstandaarden die ik wil hanteren? Beleg verantwoordelijkheid voor de datakwaliteit. Wie hebben de kennis hiervoor in huis?
Hoe betrek ik hierbij mensen vanuit verschillende perspectieven? Zodat de relevante belanghebbenden en (domein)expertise zijn vertegenwoordigd.
Hoe zorg ik voor een transparante uitleg en verantwoording van de gekozen datakwaliteit?
Op welke momenten gedurende het project en het datagebruik controleer ik of de definitie van de benodigde datakwaliteit nog steeds geldend is?
Hoe richt ik een proces in waarbij de eindgebruiker invloed kan uitoefenen op de juistheid, volledigheid, nauwkeurigheid, betrouwbaarheid en actualiteit van de data?

Uitvoerend team

Is samen met de bronhouders een gesprek gevoerd over de datakwaliteit, de voorliggende vraag en de behoefte van de eindgebruiker?
Hoe is de controle op de datakwaliteit geregeld? Gedurende de levenscyclus van data en informatieproducten.
In welke mate voldoen de gebruikte data aan de benodigde kwaliteit? Benoem en bespreek beperkingen, inconsistenties en onduidelijkheden in de data.

Eindgebruiker

Kan ik uitleggen welke datakwaliteit is gehanteerd? Voldoen de kwaliteitsstandaarden aan mijn behoefte(n)?
In hoeverre worden de kwaliteitsstandaarden nagestreefd en nageleefd? Hoe kan ik de benodigde input/correcties leveren om de datakwaliteit te behouden of te verbeteren?

 

 

Iconen-ethiek_By-designBenut de ontwerpprincipes

Ontwerp, presenteer, visualiseer en interpreteer data, services en informatieproducten op basis van de inzichten uit bovenstaande ontwerpprincipes (de principes voor eerlijke kwaliteit en inclusiviteit).

 

 


Opdrachtgever

Zijn de ontwerpprincipes voor eerlijke kwaliteit en inclusiviteit voldoende benadrukt in de opdracht en het eindresultaat? Wat heb ik nodig om daarop te kunnen sturen?
Ben ik in staat om de projectleider en het uitvoerende team kritisch te bevragen op deze ontwerpprincipes?
Is het naleven van deze ontwerpprincipes voorwaardelijk voor de acceptatie van het eindresultaat (de data, services of informatieproduct)?

Projectleider

Zijn de principes voor eerlijke kwaliteit en inclusiviteit opgenomen als hoofdactiviteiten in de breakdown structure van het project? Zijn hier voldoende middelen (zoals tijd en budget) voor gereserveerd?
Hoe zorg ik ervoor dat alle keuzes en overwegingen met betrekking tot inclusiviteit en -kwaliteit eerlijk worden weerspiegeld in de presentatie of visualisatie van het eindresultaat?

Uitvoerend team

Is er een duidelijk werkproces voor ieder ontwerpprincipe voor eerlijke kwaliteit en inclusiviteit? Is het werkproces duidelijk en belegd.
Wordt bij het ontwerpen, presenteren en visualiseren van het eindresultaat voldoende stilgestaan bij de ontwerpprincipes?
Let op kleurgebruik, accentueringen, (geo)grafische weergaven en andere keuzes die mogelijk vanuit een eenzijdig perspectief zijn gemaakt. Hoe voorkomen we misleidende conclusies?

Eindgebruiker

In hoeverre zijn de principes voor eerlijke kwaliteit en inclusiviteit naar mijn tevredenheid uitgewerkt in het eindproduct?
Hoe verwerk ik de ontwerpprincipes in mijn uitleg, interpretatie en gebruik van het eindproduct?

Laat ons weten wat je ervan vindt!

De ethische referentie is een levend document. Kan er iets beter of duidelijker in deze beschrijving? Heb je  voorbeelden die je kan delen waarmee we de kernwaarde meer tot leven kunnen brengen? We horen het graag!

Dien je opmerkingen in