ANALYSE AI

Welke AI is het beste voor de KU Leuven? 'Een eigen model biedt garanties die geen enkele partner biedt'

Het domein van taalmodellen is als het Wilde Westen: verschillende internationale bedrijven vechten het tegen elkaar uit om als winnaar uit de bus te komen. Bezorgdheden om bias en databescherming dwingen de KU Leuven om naar een betrouw­bare partner te zoeken, of om het zelf te doen.

Gepubliceerd
Leestijd: 4 min

Dossier: artificiële intelligentie

Artificiële intelligentie raast als een storm door universiteiten. Met mogelijke enorme efficiëntiewinsten tot gevolg, maar ook niet te onderschatten risico’s. Wat weegt door? Veto trok op onderzoek. Lees hier alle artikelen.

Terwijl AI-tools als ChatGPT razendsnel hun weg vinden naar studenten en onderzoekers, groeit de bezorgdheid over wat er met de gebruikersdata gebeurt. Daarmee heeft de KU Leuven goede redenen om zich te buigen over een Europese partner, of om een eigen AI-tool te bouwen.

Taalmodellen?

Om te begrijpen waarom data in AI-modellen maar beter beschermd zijn, is het belangrijk om te weten hoe zulke systemen werken. 'Een LLM (Large Language Model) voorspelt op basis van een reeks tokens, lettergrepen zeg maar, de meest waarschijnlijke volgende token', zegt Tias Guns, professor artificiële intelligentie (KU Leuven).

Als dat gebeurd is, herhaalt het systeem die procedure voor alle volgende tokens. 'Het baseert zich dus telkens op de initiële invoer plus de tokens die het al gegenereerd heeft.' Zo eindigt een LLM uiteindelijk met een volledig brokje tekst.

Waarom die brokjes tekst inhoudelijk zinvol zijn? 'Om de juiste lettergrepen te kiezen, doet het model beroep op een gigantisch neuraal netwerk dat de statistische patronen leert tussen de tokens', aldus Guns. 'Dat werkt zo goed omdat dat netwerk op zijn beurt getraind wordt op enorme hoeveelheden tekstuele data, zo goed als het hele internet.' 

Microsoft Copilot Chat

Voorlopig werkt de KU Leuven nog met een internationale tool. 'Dankzij een contract met Microsoft kunnen studenten en medewerkers gebruikmaken van Copilot Chat, waarbij – als ze ingelogd zijn met hun KU Leuven-account – hun gegevens beschermd blijven', zegt Tinne De Laet, professor artificiële intelligentie (KU Leuven). 

Alles wat je tegen Copilot Chat zegt en wat Copilot antwoordt, zal niet worden opgeslagen, is niet toegankelijk voor Microsoft en wordt dus niet gebruikt om het taalmodel verder te trainen. 'Dat is een geruststellende gedachte', aldus De Laet.

'Een niet-gebiased AI-model bestaat niet'

Tias Guns, professor artificiële intelligentie (KU Leuven)

Binnen een universitaire context is die databescherming van groot belang. 'Dat geldt des te meer als het om onderzoek gaat', merkt Guns op. 'Als je bijvoorbeeld een thesis schrijft, moet je soms een geheimhoudingsovereenkomst ondertekenen. In dat geval mag je je werk niet laten nalezen door een AI-tool die geen garanties biedt rond gegevens­bescherming.' In zulke situaties komt Copilot Chat de onderzoeker dus ten goede.

Een AI-model dat die databescherming niet garandeert, geeft immers aanleiding tot risico's. 'Als je met je eigen account een gesprek voert met ChatGPT, wordt die data opgeslagen', zegt Guns. 'Er is dan een tussenpersoon die toegang heeft tot jouw gesprekken en ze zou kunnen gebruiken om het model verder te trainen.' Je data blijft daarmee niet privé, maar komt in handen van het bedrijf achter de technologie. 

Bias

Naast privacyzorgen ligt ook meer bias op de loer bij zulke AI-platformen. 'Het model zou zijn antwoorden kunnen afstemmen op het soort reacties en argumenten waar jij gevoelig voor bent', legt Guns uit. Omgekeerd beïnvloedt je chatgeschiedenis hoe jij zelf denkt: 'Wie vaak met zo'n AI-systeem praat, heeft de neiging om de manier van redeneren en formuleren van het systeem over te nemen.'

'Toch mogen we niet vergeten dat AI-tools – ook mét databescherming – altijd gebiased zijn', benadrukt Guns. 'De antwoorden van een chatbot worden mee bepaald door de invoer­data waarop het systeem getraind is, en die data is nooit neutraal', licht hij toe. 'Een niet-gebiased AI-model bestaat dus niet'.

Dat verklaart waarom taalmodellen zoals ChatGPT zo bevestigend en enthousiast reageren. 'Het lijkt wel alsof het iedereen naar de mond wil praten', zegt Guns. 'Zo krijg je standaard reacties als: "Wat een slimme vraag!" Die antwoorden zijn geen toeval: de ontwikkelaars hebben de chatbot expliciet getraind op data die dat soort gedrag aanmoedigen.'

Waakzaamheid

Zelfs wanneer je gegevens contractueel beschermd zijn, blijft waakzaamheid geboden. Techgiganten zoals Google, Amazon en Microsoft zijn immers niet onvoorwaardelijk te vertrouwen. 'De grootste techbedrijven blijken al snel te buigen voor de grillen van Trump', zegt Philip Du Bois, algemeen directeur van DNS Belgium, een bedrijf dat instaat voor Belgische webdomeinen.

'Dat de Amerikaanse justitie gegevens van gebruikers kan opvragen bij Amerikaanse bedrijven, ook als die data in Europa wordt bewaard, maakt dat je als Europese klant weinig zekerheden hebt', zegt Du Bois. 'Wat blijft er dan nog over van de waarde van een contract?'

'De KU Leuven betaalt voor Microsoft Copilot; de bedrijven moeten zich dus aan hun contract houden', zegt Guns. Toch kan het dat contracten worden verbroken. 'Als de Amerikaanse overheid zo'n cloudspeler dwingt om afspraken met hun Europese klant te schenden, dan is zo'n contract niet veel meer waard', waarschuwt Du Bois.

Leuven.AI

De kennis rond AI is aan de KU Leuven niet enkel theoretisch. Via Leuven.AI, een instituut met interdisciplinaire experts, doet de universiteit actief aan onderzoek over de ontwikkeling van taalmodellen. Guns maakt er zelf deel van uit. 

Als die kennis wordt gebundeld, zou de KU Leuven een eigen AI-model kunnen lanceren. Zo'n model geeft de universiteit volledige controle over het trainingsproces, dat bij voorkeur open source is en in lijn met ethische en wetenschappelijke normen. Zulke garanties kan geen enkele commerciële partner bieden.

'Elon Musk wil zich onderscheiden door een AI met controversiële meningen'

Tias Guns, professor artificiële intelligentie (KU Leuven)

'Zo'n AI-tool zouden we niet op de markt zetten, maar aanbieden aan onze studenten. Zo kunnen zij de tool gebruiken om bijvoorbeeld vragen over de cursusstof te verduidelijken', zegt Guns. Toch is het nog allesbehalve zeker dat het model er daadwerkelijk komt. 

'Er is altijd een afweging tussen de kosten om zo'n AI-model te bouwen en de snelheid waarmee internationale tools beter worden. In het ergste geval loopt ons eigen model achter en is het een verloren investering', zegt Guns.

Europese partner

Du Bois is positiever over Europese bedrijven. 'Wetgeving zoals de GDPR (General Data Protection Regulation) toont aan dat rechtszekerheid hier serieus genomen wordt. Daarom heb ik meer vertrouwen in hun omgang met gevoelige data.' Dat suggereert dat de KU Leuven kan overwegen om met een Europese partner te werken in plaats van met Microsoft.

Bovendien kan een Europees platform de Europese waarden verwerken in de invoerdata waarmee AI-tools worden getraind. Wereldwijd zijn AI-bedrijven al bezig met die ideo­logische oefening. 'Het Chinese bedrijf DeepSeek censureert bijvoorbeeld gevoelige historische gebeurtenissen, terwijl Elon Musks xAI zich wil onderscheiden door een AI met controversiële meningen', weet Guns.

'In de technologische machtsoorlog tussen China en Amerika zit Europa tussen hamer en aambeeld'

Philip Du Bois, algemeen directeur DNS Belgium

Als Europa zijn eigen koers wil varen in AI, lijkt het er goed aan te doen om zijn eigen waarden – denk aan vrijheid, gelijkheid en democratie – een centrale plek te geven in zijn AI-systemen. 'Mistral AI uit Frankrijk doet dat al door bewust Europese waarden te ver­werken in de invoerdata', vertelt Guns. Die invoerdata zijn bovendien volledig openbaar en controleerbaar door de gebruikers.

Toch hinkt Europa achterop in de AI-race. 'In de technologische machtsoorlog tussen China en Amerika zit Europa tussen hamer en aambeeld', aldus Du Bois. 'We lopen achter, en AI vraagt om investeringen op het niveau van miljarden. Zolang we die financiële middelen niet hebben, blijft Europa toeschouwer', klinkt het.

Powered by Labrador CMS