Essay: Privacy en Big Data…

INLEIDING
Hogeschool van Arnhem en Nijmegen Docenten: Frans Huijgen en Emiel Ruis Inleverdatum: 15 januari 2015
Het verzamelen van data is dusdanig verweven met de huidige maatschappij dat we het moeten accepteren in plaats van ons er tegen blijven verzetten.
Big Data brengt in de kern niet meer of minder tot uitdrukking dan dat er heel veel data is, die een niet te bevatten hoeveelheid gegevens op het internet heeft net als daarbuiten en iedere seconde uitbreidt (Lodder, Van der Meulen, Wisman, Meij & Zwinkels, 2014). Mayer-Scho??nberger en Cukier (Mayer-Scho??nberger & Cukier, 2013) hebben de volgende visie hierop: ‘Het verwijst naar dingen die je op een grote schaal kunt doen en die op een kleinere schaal niet mogelijk zijn, en waarmee je nieuwe inzichten verkrijgt of nieuwe vormen van economische waarde cree??ert op een manier die invloed heeft op onder andere markten, organisaties en de relatie tussen burgers en overheden.’
Er zal tijdens dit essay gebruik worden gemaakt van theoriee??n uit boeken die geschreven zijn over Big Data in onze huidige maatschappij zoals de ‘Big Data Revolutie'(Kenneth Cukier & Mayer-Schonberger Viktor, 2013) en ‘Wij zijn Big Data’ (Sander Klous, Nart Wielaard, 2014). Hierin wordt de ontwikkeling van Big Data toegelicht en wat de impact hiervan is in ons dagelijks leven.
Dit essay is opgebouwd aan de hand van relevante wetenschappelijke artikelen over privacy gevoeligheid en het gebruik van Big Data. Het zal bestaan uit de ontwikkeling van Big Data en verschillende theoriee??n en bevindingen over dit onderwerp om tot slot een conclusie omtrent deze stelling te kunnen trekken.
In het boek ”Wij zijn Big Data” (Sander Klous, Nart Wielaard, 2014) lichten de auteurs Klous en Wielaard de ontwikkeling van Small Data naar Big Data als volgt toe: Tot voor kort was het verzamelen, analyseren en opslaan van data tijdrovend en kostbaar. Daarom verzamelden we de minimale hoeveelheid data die nodig was om onze vragen te beantwoorden. In het tijdperk van ‘Small Data’ was zelfs de manier waarop we inzicht verwierven uit data ingegeven door de schaarste ervan.
”’2
We maakten gebruik van steekproeven, niet van alle data. We konden alleen zelden dieper ingaan op een interessant resultaat, omdat we gewoon niet genoeg gegevens hadden. Nog ongunstiger was dat we met zo’n benadering alleen vragen konden beantwoorden die we al vanaf het begin hadden, en de data niet effectief konden gebruiken om nieuwe vragen te stellen die konden leiden tot werkelijk vernieuwde inzichten.
Tegenwoordig zijn veel van de grenzen aan het verzamelen, analyseren en opslaan van grote hoeveelheden data sterk vervaagd. Dat maakt het veel makkelijker om alle of bijna alle data te verzamelen. Het resultaat is dat we de wereld nu in een zo’n detail kunnen bekijken en Big Data- analyse levert nieuwe vragen op, die ons waardevolle inzichten bieden die we nog niet hadden. Zo kan bijvoorbeeld Google de verspreiding van griep voorspellen door de miljarden zoekopdrachten te analyseren die binnenkomen (Google, flutrends) en is in het ziekenhuis voor zieke kinderen in Toronto zelfs een manier gevonden om levens van premature baby’s te redden door gebruik te maken van Big Data. In dit tijdperk hebben meer en ”messy” data het overgenomen van schone, maar kleine data. (Sander Klous, Nart Wielaard, 2014)
In het boek ‘De Big Data-revolutie: Hoe de data-explosie al onze vragen gaat beantwoorden’ wordt door Viktor Mayer-Scho??nberger en Kenneth Cukier beschreven hoe Big Data heeft bijgedragen aan cruciale gebeurtenissen binnen de maatschappij. In 2009 werd er een nieuw griepvirus ondekt. Deze griep bevatte elementen van de virussen die de vogelgriep en varkensgriep veroorzaken en verspreidde zich snel. Binnen enkele weken vreesden volgsgezondheidsinstellingen overal ter wereld dat er een verschrikkelijke pandemie te gebeuren stond. In de VS verzochten de CDC (Centers for Disease Control and Prevention) artsen hen te informeren over nieuwe griepgevallen. Maar het beeld van de pandemie dat daaruit naar voren kwam, was altijd dat van een paar weken geleden. Mensen voelden zich misschien wel al dagenlang ziek, maar wachtten nog even met naar de dokter gaan. Bij een ziekte die zich snel verspreidt is een vertraging van twee weken veel te veel. Door deze vertraging tastten de instanties voor gezondheidszorg op de meest cruciale momenten
””3
volledig in het duister. Slechts een paar weken voordat het virus de voorpagina’s haalde, publiceerde Google een artikel in het wetenschappelijke tijdschrift Nature. De auteurs verklaarden daarin dat Google de verspreiding van de wintergriep in de VS kon voorspellen, niet alleen op landelijk niveau, maar ook per regio en zelfs per deelstaat. Dat kreeg Google voor elkaar door te kijken waar mensen op internet naar zochten. Aangezien Google elke dag meer dan drie miljard zoekopdrachten krijgt en die allemaal bewaart, waren er meer dan genoeg gegevens om mee te werken. De bedoeling was de mensen die met het griepvirus gei??nfecteerd waren aan te wijzen op basis van dingen waar ze op internet naar zochten. Ze konden net als de CDC’s aangeven waar de griep zich had verspreid, maar anders dan de CDC’s konden ze dat bijna realtime in plaats van pas een paar weken later. Het Google systeem bleek in 2009 een bruikbaardere en snellere indicator dan de overheidsstatistieken met hun meldingsvertragingen. (Mayer-Scho??nberger & Cukier, 2013)
Door gebruik van Big Data heeft de wereld tegen de tijd dat de volgende pandemie zich aandient een beter instrument ter beschikking om de verspreiding van de ziekte te voorspellen en dus te voorkomen. Gezondheidszorg is maar een van de terreinen waarop de Big Data revolutie haar invloed doet gelden volgens Mayer-Scho??nberger en Cukier. Hele sectoren van het zakenleven veranderen op de moment ingrijpend door Big Data. Onderstaand wordt hierop verder in gegaan. (Mayer- Scho??nberger & Cukier, 2013)
In recent onderzoek (Bronner et al., 2015) wordt beargumenteerd waarom Big Data wel degelijk een ontwikkeling is die de manier waarop bedrijven data verzamelen, analyseren en hier inzichten aan ontlenen blijvend veranderd heeft. Dit wordt in het onderzoek beschreven aan de hand van de drie V’s, die door Laney (2001) werden gei??ntroduceerd: volume, velociteit en varie??teit. De ‘V” van volume betekend dat de data zo groot zijn dat het niet meer op e??e??n computer past. Dit heeft consequenties voor de manier waarop gegevens worden opgeslagen en ook consequenties voor de analyses die op de data uitgevoerd worden. Als
‘4
gevolg van de ‘V” van velocity zijn data snel, in sommige gevallen zelfs real time, beschikbaar. Wat ook gevolgen heeft voor de manier waarop inzichten uit data verkregen worden. De gevolgen van de ‘V” van varie??teit hebben te maken met het feit dat er tegenwoordig veel meer databronnen toegankelijk zijn geworden. Het samenbrengen en analyseren van de verschillende databronnen en het genereren van meer en betere
inzichten die uit die combinatie heeft wellicht de grootste waarde en genereert daarmee het meeste impact op de organisatie.
‘Waarom is Big Data dan toch geen hype die vanzelf weer overwaait? Doordat de bovengenoemde ontwikkelingen samenkomen en elkaar bei??nvloeden en versterken is de manier waarop organisaties data verzamelen, opslaan, visualiseren en hier inzichten vanuit cree??ren blijvend veranderd. Omdat niet alle bedrijven mee veranderen, maakt dat sommige organisaties beter profiteren van de mogelijkheden die Big Data bieden dan hun concurrenten.” (Bronner et al., 2015)
Vanuit de andere kant bekeken zijn burgers lang niet altijd positief over de mogelijkheden die big data biedt. Kijk naar de discussie over de NSA/Snowden. Big Data biedt enorme kansen, maar heeft aan de andere kant ook gevaren. Daar ligt ook direct de link naar procesmanagement. Klous (Klous, 2014): ‘Je kunt geweldige ontwikkelingen realiseren met data-analyse en nieuwe technologische mogelijkheden. De truc is alleen om het procesmatig zo in te richten, dat het geen negatieve implicaties heeft. Een schoolvoorbeeld van hoe het niet moet is het meisje van zestien dat ongewild synoniem werd voor de keerzijde van Big Data. De supermarkt stuurde haar advertenties met babyproducten op basis van data-analyse, maar haar vader wist nog van niets. Het is een enorm contrast. Enerzijds liken we ons gek op Facebook en Googlen we wat af. We zijn gek op hun gratis diensten en op het gemak van op maat gemaakte resultaten. Tegelijkertijd willen we niet dat overheden en organisaties alles van ons weten. Dus is de opdracht: maak gebruik van de kansen die big data biedt, maar richt je proces zo in dat de burger vertrouwen in je houdt.’ (Klous, 2014)
5
In het onderzoeksrapport ‘Big Data Big Consecuenses’? geschreven door Lodder et al. (Lodder et al., 2014), is ingegaan op de privacy aspecten van big data binnen het domein veiligheid en justitie. Na een uiteenzetting van de privacy normen en toepassingsmogelijkheden,
zijn de volgende zes uitgangspunten voor Big Data toepassingen voorgesteld:
1. Bepaal te analyseren probleem en definieer doel voor verwerking;
2. Selecteer data en beperk verzamelen;
3. Bewaar niet langer dan noodzakelijk;
4. Wees transparant;
5. Beveilig informatie;
6. Evalueer de uitkomsten kritisch.
Dit ‘proces” hangt enigszins samen met wat Klous beweert: ‘Je kunt geweldige ontwikkelingen realiseren met data-analyse en nieuwe technologische mogelijkheden. De truc is alleen om het procesmatig zo in te richten, dat het geen negatieve implicaties heeft”. Volgens hun theoriee??n kan Big Data dus weinig kwaad, mits het op de juiste manier procesmatig wordt ingericht.
‘Big Data is het begin van een grote omslag. Van de natuurwetenschappen tot de gezondheidszorg, van de bankwereld tot het internet, de branches lopen sterk uiteen, maar samen vertellen ze een vergelijkbaar verhaal: de hoeveelheid gegevens in de wereld groeit snel, in een tempo dat niet alleen onze machines maar ook ons eigen voorstellingsvermogen te boven dreigt te gaan.” (Mayer-Scho??nberger & Cukier, 2013)
Vanuit de bovengenoemde literatuur en theoriee??n kan geconcludeerd worden dat Big Data vooral in de gezondheidszorg en in het zakenleven een belangrijke en een blijvende omslag is. Er zijn ook nog steeds organisaties die niet werken met Big Data, maar binnen onze huidige maatschappij is Big Data eigenlijk niet meer weg te denken. Zolang bedrijven en de overheden Big Data goed inricht en de burger/klant het vertrouwen heeft, kan er op een goede manier gebruik gemaakt worden van de vele mogelijkheden die Big Data biedt en hoeven we ons er niet
6
tegen te verzetten. Het kan ons tenslotte helpen met het voorkomen van levensbedreigende epidemiee??n/pandemiee??n.
7
Bronvermelding:
” Klous, S. & Wielaard, N. (2014). Wij zijn Big Data. Amsterdam, Nederland: Business Contact.
‘ Cukier, K. & Mayer-Schonberger, V. (2013). De big data revolutie. Amsterdam, Nederland: Maven Publishing.
‘ Lodder, R., Meulen, S. van der, Wisman, H. A., Meij, L. & Zwinkels, M. M. (2014). BIG DATA, BIG CONSEQUENCES?. Geraadpleegd op http://dare.ubvu.vu.nl/bitstream/handle/1871/51919/2014RapportwodcBigdat a%20april%20boekformaat.pdf?sequence=1
‘ Mayer-Scho??nberger, V., & Cukier, K. (2013). De Big Data Revolutie. Geraadpleegd op http://books.google.nl/books?hl=nl&lr=lang_nl&id=wRBGBAAAQBAJ&oi=fnd&p g=PT8&dq=big+data+toekomst&ots=p5Y_5PvVAx&sig=B8s2H4FdhOQsE4MBig j6EaS-Hbg#v=onepage&q&f=true
‘ Klous, S. (2014). Het dilemma van big data. Geraadpleegd op http://jaarcongresprocesmanagement.overmanagement.nl/download.php?id=2 b39c818b338d5eec90f0ad54cb3dcfc&type=pdf&name=SanderKlousInterview.p df
‘ Bronner, A. E., Dekker, P., Leeuw, E. de, Paas, L. J., Ruyter, K. de, Smidts, A., & Wieringa, J. E. (2015). Ontwikkelingen in het marktonderzoek. Geraadpleegd op http://www.moaweb.nl/kenniscentrum/jaarboeken/2015/Marktonderzoek%20 2015%20Compleet.pdf#page=9
‘ Laney, D. (2001). 3D Data Management: Controlling data Volume, Velocity and Variety. Geraadpleegd op http://blogs.gartner.com/doug-laney/files/2012/01/ad949-3D-Data- Management-Controlling-Data-Volume-Velocity-and-Variety.pdf
””””””’8

Leave a Comment

Time limit is exhausted. Please reload the CAPTCHA.