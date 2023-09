Kunstmatige intelligentie is niets zonder jouw data, maar is dat erg? En kun je er eigenlijk iets tegen doen?

AI en jouw data

Kunstmatige intelligentie gebaseerd op een taalmodel zoals ChatGPT, is niets zonder data. En wat is nou betere data dan al die teksten, foto’s en video’s die jij online plaatst?

Dit gebeurt er nu

Het populaire internetforum Reddit is al maanden in opspraak. Dat heeft deels te maken met het nieuws dat de baas van Reddit hoge bedragen vraagt van derde partijen om de content van Reddit te kunnen lezen. Daardoor zijn populaire apps niet meer bruikbaar. Maar er speelt nog iets anders: Reddit wil betaald worden als de berichten op het platform worden gebruikt om kunstmatige intelligentie te trainen.

Reddit is een haast onuitputbare bron vol informatie over allerlei actuele onderwerpen, dat onder andere door ChatGPT-maker OpenAI wordt gebruikt om zijn chatbots te trainen. De baas van Reddit vindt dat hij daar geld aan mag verdienen.

Veel gebruikers zijn hier niet blij mee, omdat ze er niets over te zeggen hebben. Ook voelen ze zich oncomfortabel met het feit dat hun teksten en foto’s worden gebruikt om kunstmatige intelligentie te trainen en ze niet weten welke vormen die AI in de toekomst zal aannemen.

Elk online platform is nu bezig met dit vraagstuk. Zoom is in opspraak omdat het de data van zijn gebruikers wil gebruiken om AI te trainen. Als je iets op X (voorheen Twitter), Facebook of Instagram plaatst, wordt het ook gebruikt om de kunstmatige intelligenties van die platformen te verbeteren. Als je bij ChatGPT niet specifiek aangeeft dat je het niet wil, wordt alles wat je in de chatbot plaatst opgeslagen en gebruikt om de chatbot te trainen.

Wat betekent dit?

Dit betekent dat alles wat je online plaatst – of dat nou tekst, foto’s of video’s zijn – gebruikt kan worden voor het trainen van kunstmatige intelligentie. Op dit moment gaat dat voornamelijk nog om generatieve AI. Daarmee worden teksten, afbeeldingen of video’s gegenereerd vanuit de data die er is gevoerd. Deze gegevens kunnen in de toekomst echter ook voor andere vormen van kunstmatige intelligentie worden gebruikt.

Tevens betekent dit dat techbedrijven nu op een nieuwe manier geld kunnen verdienen met jouw data. Dat kan ook oude data zijn, zoals oude foto’s op een sociaal netwerk, oude blogs op een website enzovoort.

Wat heeft dat met mij te maken?

Er is veel kritiek vanuit schrijvers, fotografen, grafisch ontwerpers enzovoort dat generatieve kunstmatige intelligentie hun werk gebruikt zonder dat ze daar wat van terug zien. Voor jou is dit wellicht minder relevant, omdat je geen materiaal online zet dat met copyright wordt beschermd.

Maar huidige vormen van kunstmatige intelligentie zijn onvoorspelbaar en toekomstige vormen zijn dat waarschijnlijk ook. Stukjes data kunnen op nieuwe plekken opduiken en dat kan onvoorziene gevolgen hebben.

Wat kan ik er tegen doen?

Maak jij je zorgen? Dan zijn er enkele concrete dingen die je kunt doen:

Meer dan ooit is het belangrijk om na te denken wat je online plaatst. Bij alles moet je nagaan of je het erg zou vinden als het ergens anders opduikt. Zeker als de content verbonden is aan je eigen naam.

Veel apps bieden in de instellingen de mogelijkheid om uit te schakelen dat jouw data wordt gebruikt om AI te trainen. Soms moet je daar wel wat fucntionaliteit voor inleveren. Bij ChatGPT kun je dan bijvoorbeeld geen chatgeschiedenis meer zien.

Het is niet alleen verstandig om bewust om te gaan met nieuwe dingen die je online plaatst, maar ook om na te gaan wat er al van jou online staat. Denk er eens aan om oude data te verwijderen – zoals je oude posts op sociale media of foto’s die op een website als Flickr staan opgeslagen.

