Er is een kans dat ChatGPT persoonlijke details kent – en als dat niet het geval is, kan het zomaar iets verzinnen. Naarmate de populariteit van de tekstchatbot is toegenomen, zijn de risico’s van het systeem dat is getraind op gegevens die van het web zijn binnengehaald, alleen maar groter geworden.
ChatGPT en GPT-4 genereren hun antwoorden statistisch: door te voorspellen welke woorden waarschijnlijk volgen op andere woorden nadat ze miljoenen voorbeelden hebben gezien van zinnen geschreven door menselijke auteurs. OpenAI doet nogal geheimzinnig m.b.t. de gegevens waarop het zijn grote taalmodellen heeft getraind, dus niemand buiten het bedrijf weet precies hoeveel data van het web (inclusief persoonlijke informatie van mensen) wordt verzameld.
OpenAI zegt dat zijn grote taalmodellen worden getraind op drie bronnen van informatie:
- data die van het web zijn gehaald
- data die het bedrijf van anderen heeft gelicenceerd, en
- de informatie die mensen aan het systeem geven via chats
En die kunnen persoonlijke informatie bevatten. “Een groot deel van de gegevens op internet heeft betrekking op mensen, dus onze trainingsinformatie bevat toevallig persoonlijke informatie”, legt OpenAI uit.
Online verzoek tot verwijdering
Er is echter een online formulier voor verzoeken tot verwijdering van persoonsgegevens beschikbaar, waarmee mensen – voornamelijk in Europa, maar ook in Japan – kunnen verzoeken om informatie over hen uit de systemen van OpenAI wordt verwijderd. Zie de link hieronder.
Het formulier lijkt voornamelijk bedoeld te zijn voor verzoeken om informatie te verwijderen uit antwoorden die ChatGPT aan gebruikers geeft en niet uit zijn trainingsgegevens. Het vraagt om uw naam, e-mail, het land waarin u zich bevindt, of u de aanvraag voor uzelf of namens iemand anders doet (bijvoorbeeld een advocaat die namens een cliënt een verzoek doet), en of u een publieke persoon bent, zoals een beroemdheid. Vervolgens vraagt OpenAI om bewijs dat zijn systemen u hebben genoemd.