De kop liet aan duidelijkheid weinig te wensen over. ‘AP: Scraping bijna altijd illegaal‘, meldde de Autoriteit Persoonsgegevens gisteren ineens. Oftewel: automatisch gegevens van internet halen, bijvoorbeeld door sociale media te scannen, en die gegevens opslaan (en bewerken), dat is volgens de AP in bijna alle gevallen verboden. Je haalt er namelijk waarschijnlijk privacygevoelige gegevens mee binnen, en daarvoor heb je meestal geen toestemming gevraagd aan de betrokkene. Dus zal scraping bijna altijd een overtreding van de AVG (Algemene verordening gegevensbescherming) zijn, aldus de AP.
‘Bijna alle A.I. wordt getraind met gescrapete data. We willen daarvoor de regels nog eens duidelijk maken.’
‘We zien dat scraping de afgelopen tijd snel toeneemt’, verklaart een persvoorlichter van de AP de komst van de nieuwe handreiking. ‘Bijna alle A.I. wordt bijvoorbeeld getraind met gescrapete data. We willen met de handreiking organisaties nog eens duidelijk maken wat de regels zijn. Dit komt echt uit onszelf, niet op verzoek. We zullen organisaties van wie we weten dat ze scrapen ook een brief sturen dat we extra erop gaan letten.’ Betekent dat ook: handhaving? ‘Natuurlijk is handhaving altijd een optie. Al zullen we daarvoor wel altijd eerst grondig onderzoek doen.’
Betekenis voor recruitment
Wat het voor de recruitmentwereld betekent? Dat is eerlijk gezegd nog niet helemaal duidelijk. De voorbeelden die in de handreiking genoemd worden, hebben niet 1-op-1 betrekking op werving en selectie, behalve waar het gaat over de beslissing of je nieuwe werknemers al dan niet aanneemt op basis van hun uitingen op sociale media. En de stelligheid van de kop van het persbericht dan? Die is toch klip-en-klaar? Ja, maar die wordt in de handreiking zelf niet waargemaakt, stelt bijvoorbeeld de bekende ICT-jurist Arnoud Engelfriet. Vooral waar het gaat om het ‘zuiver commercieel belang’ is er volgens hem nog volop onduidelijkheid.
‘De stelligheid van de kop wordt in de handreiking niet waargemaakt.’
Engelfriet verwijst bijvoorbeeld naar de 525.000 euro boete die de tennisbond KNLTB in 2020 kreeg toen het gegevens van leden doorverkocht aan sponsors. De AP concludeerde destijds dat direct marketing nooit een gerechtvaardigd belang kan zijn voor dataverwerking. Veel juristen waren toen verbaasd over de strenge interpretatie van de AP. En ook de Europese Commissie tikte de AP daarvoor al op de vingers. Dus was het ook niet verwonderlijk dat de KNLTB in beroep ging tegen die uitspraak van de AP, wat nu nog loopt bij het Hof van Justitie van de Europese Unie.
Wat is een commercieel belang?
Engelfriet zegt het wel te snappen dat de AP duidelijkheid wil verschaffen. ‘Als je geen beleid vastgesteld hebt, kun je ook niet goed handhaven. Ik vraag me wel af: is dit nou het grote punt waar je als AP je schaarse capaciteit op moet inzetten? Hoeveel schade levert het mensen nou werkelijk op? Daar kan best een gerechtvaardigd belang van een bedrijf tegenover staan. En vergeet niet: een bedrijf mogen voeren is ook een grondrecht in de EU. Het “zuiver commercieel belang” hebben ze bij de AP zelf bedacht. Maar er is geen definitie van. Dan wordt het volgens mij heel lastig om dit bij de rechter hard te kunnen maken.’
‘Wat Google doet is in wezen ook scrapen. Maar ik denk niet dat de AP dat illegaal heeft willen verklaren.’
Het is volgens Engelfriet wel terecht dat de AP bijvoorbeeld opmerkt dat bij scrapen transparantie nodig is, en dat mensen hun rechten kunnen halen, zoals het recht op vergetelheid. ‘Probleem met scraping is dat je de koppeling met de bron kwijt bent. Als je dan bijvoorbeeld zelf je gegevens op LinkedIn aanpast, werkt dat niet door in de gescrapete informatie. Maar datzelfde geldt voor Google: daar duurt het ook even voordat spiders weer op je pagina langskomen om nieuwe informatie te indexeren. In die zin is wat Google doet ook scrapen. Maar ik denk niet dat de AP dat illegaal heeft willen verklaren.’
‘Nuttige extra fundering’
Bij 8vance, een bekende A.I.-partij in de Nederlandse recruitmentwereld die gebruik maakt van gescrapete data, zijn ze dan ook blij met de nieuwe handreiking. ‘Het is niet alleen heel fijn dat er meer aandacht voor dit onderwerp is, het geeft ons ook nuttige tips en aanwijzingen voor een gestructureerde belangenafweging’, aldus evangelist Laurens Waling. ‘Er staat misschien weinig nieuws in voor ons, maar het heeft ons wel meer vertrouwen gegeven, en extra fundering voor de wijze waarop wij het aanpakken.’
‘De handreiking geeft nuttige tips en aanwijzingen voor een gestructureerde belangenafweging.’
8vance scrapet openbare profielen bijvoorbeeld om zijn algoritmes te trainen op correlaties tussen opleiding, werkervaring en skills. Waling: ‘Die gegevens worden altijd eerst volledig geanonimiseerd. Dat zijn dan dus eigenlijk geen profielen meer, en daar heeft dus ook helemaal niemand last van. We denken dat we hier gewoon een gerechtvaardigd belang hebben, en in die zin biedt de handreiking ook niets om van te schrikken.’
Gerichte zoekmachine
Zijn bedrijf gebruikt de voornamelijk van LinkedIn gescrapete data ook voor een zoekmachine, om bedrijven op basis van skills gematchte profielen te kunnen aanbieden. Alhoewel het op het eerste gezicht misschien lijkt alsof de AP daar wel problemen mee zou hebben, is dat volgens Waling geen issue. ‘Ook hier is sprake van een gerechtvaardigd belang: onze zoekmachine zorgt voor een betere (skills-based) werking van de arbeidsmarkt, ten gunste van het individu. Er heeft zich nog geen kandidaat bij ons gemeld die heeft gezegd: ik ben gericht benaderd voor deze functie, en dat wil ik niet, dus ik wil dat je mijn gegevens verwijdert. Mensen zijn er juist blij mee, ze krijgen zicht op nieuwe mogelijkheden voor hun carrière.‘
‘Een individu wil gevonden worden.’
LinkedIn probeert zelf ondertussen al jaren het scrapers moeilijker te maken. Met name in de Verenigde Staten leidde dit al sinds 2017 tot meerdere rechtszaken. Zo scrapete hiQ Labs, een start-up in ‘the valley’, data van LinkedIn en kreeg daarin van de rechter (aanvankelijk) gelijk omdat LinkedIn geen eigenaarschap kan claimen over het profiel van iemand, en dat dit dus ‘openbare informatie’ is. In de default instellingen van LinkedIn kiezen gebruikers ook ervoor dat hun gegevens openbaar zijn, en dus ook te vinden voor andere partijen via zoekmachines. Zoals die van 8Vance, legt Waling uit. ‘Een individu wil gevonden worden. Of dat nu via LinkedIn gebeurt, of via ons, aan de hand van zijn skills, dat maakt niemand veel uit. Hoe beter de match gemaakt kan worden, hoe minder spam je ontvangt.’