In de afgelopen maanden waren en diverse gelegenheden waar “data” groots werd gevierd. De VSNU was uitgenodigd voor de opening van de nieuwe Jheronimus Academy of Data Science in Den Bosch. Naast het doorstaan van de macrodoelmatigheidstoets slaagde men er ook in om Koningin Maxima naar het openingsbal te krijgen.

Data is het nieuwe goud – zo werd ook duidelijk tijdens een themamiddag over “Big data en disruptie” voor ondernemers van de Cobbenhagen Summit van Tilburg University. Daar waren diverse ondernemers aan het woord die de mogelijkheden van big data uitlichtten, voorzien van gelikte presentaties en animaties. Dat de wetenschap er bovenop zit, is te zien aan het “themadossier” op de website van dezelfde universiteit.

Intussen was ik met mijn dochter naar een open dag van de TU/e, waar deze nieuwe opleiding Data Science ook werd gepromoot. De meeloopdag die daarop volgde startte in Tilburg – halverwege de dag gingen 60 studenten met de bus en lunchpakketje naar Eindhoven. Volgens de prognoses zijn er 8.000 data scientists nodig en met al deze belangstelling is dat makkelijk te geloven.

Maar ik was ook bij twee bijeenkomsten waarin de keerzijde van Big data werd belicht. Het tijdschrift Th&ma hield een Ronde Tafel ter voorbereiding op een themanummer over Data. Daar was een mooi gezelschap bij elkaar van zowel Nederlandse als Vlaamse experts op het terrein van hoger onderwijs en data. Hoofdredacteur Sijbolt Noorda suggereerde als motto: “Data als goudmijn of mijnenveld?”.

Met de nieuwe Europese Verordening Gegevensbescherming in aantocht, ziet de toekomst er niet louter rooskleurig uit. Bestuurders van instellingen die niet aan de regels voldoen, kunnen hoge boetes krijgen. De informatiestromen die nodig zijn voor het functioneren van ons onderwijsbestel, bevatten privacygevoelige informatie, waar goede waarborgen voor nodig zijn. Maar veel is nog onduidelijk en soms slaan beheersingsmaatregelen door. Een Vlaamse hoogleraar noemde als voorbeeld dat docenten niet langer de cijfers mogen zien die studenten voor andere vakken hebben gehaald. En het “recht om vergeten te worden” is binnen een onderwijsinstelling – waar je diplomaresultaten toch liefst generaties bewaart – ook geen vanzelfsprekendheid.

Dat het nog complexer kan, leerde ik bij een bijeenkomst van VNO-NCW. Daar was een gezamenlijke bijeenkomst georganiseerd rondom de Europese Communicatie ‘Building a European Data Economy’. Daarin komen onder meer onderwerpen als data lokalisatie, eigendom van data, nieuwe manieren van verkrijgen en gebruiken van data ter sprake.

Ook adresseert de Commissie aansprakelijkheid, standaarden en interoperabiliteit. Interessant is de vergelijking met internationale studentenmobiliteit en alle vraagstukken die daar spelen. Vervang het woord “student” door “datapakketje” en de overeenkomsten zijn legio. We hebben één taal nodig om studenten/data te kunnen uitwisselen, en we willen studenten/data niet vasthouden in eigen land (data lokalisatie”). Maar studenten/data naar verre landen sturen brengt ook risico’s en met zich mee.

Maar het verhaal dat echt bijbleef was dat wij zeker niet de enige sector zijn die uitdagingen kent op het gebied van data. In de landbouwsector gebruikt men zeer geavanceerde methoden om de beste stieren te selecteren. Een topstier produceert 1.000 rietjes sperma per week, à 15 euro per stuk. De 3 beste stieren in Nederland zijn elk 3 miljoen euro waard. Dan loont het om uit te zoeken hoe men de beste stieren fokt. Daarvoor doet men genetische analyses, worden sensoren ingezet en zelfs stappentellers. De gegevens die dat allemaal oplevert zijn goud waard.

Maar wezenlijke vragen over eigenaarschap van data zijn nog niet beantwoord.

Als een melkmachine per ongeluk een koe melkt die antibiotica gebruikt, wie is dan aansprakelijk? Als een veevoedermachine data opslaat, is die data dan van de producent van de machine, of van de boer die de machine in zijn stal heeft staan? En als deze data worden doorgeleverd aan de coöperatie, mag de coöperatie deze gegevens dan vermarkten?

Het zijn dezelfde vragen die wij stellen als het gaat om gegevens die we op sectorniveau verzamelen over bijvoorbeeld studenten, onderzoeksoutput en personeel. Die gegevens worden vervolgens bewerkt en doorgeleverd aan bijvoorbeeld VSNU, CBS, Studiekeuze123, beleidsmakers of wetenschappers. Hoe kunnen we de data benutten voor het goede doel? Van wie zijn die data dan eigenlijk? Wat mag wel of niet? En wie is aansprakelijk als data op straat liggen?

Eén van de conclusies van de bijeenkomst was dat de datagedreven economie nog zoveel uitdagingen kent, dat er dringend behoefte is aan onderzoek en opleiding van dataspecialisten. Het vak is nog volop in ontwikkeling en we komen er niet met het opleiden van jongeren alleen. Een schone taak voor onze vereniging om daar ook een bijdrage aan te leveren!

 

Reinout van Brakel

28 maart 2017