Baanbrekende ontdekking: AI-taalmodellen blijken verborgen hersenstructuren te hebben

Daniel Verloop

Een recente wetenschappelijke doorbraak zorgt voor opschudding in de wereld van kunstmatige intelligentie. Onderzoekers hebben ontdekt dat grote taalmodellen zoals ChatGPT beschikken over interne structuren die verrassend veel lijken op menselijke hersenen. Deze ontdekking werpt niet alleen nieuw licht op hoe AI werkt, maar roept ook fundamentele vragen op over de aard van intelligentie zelf.

De zwarte doos gaat open

“We hebben ze gebouwd en getraind, maar we weten niet precies wat er gebeurt.” Met deze opmerkelijke bekentenis gaf OpenAI-onderzoeker Ilya Sutskever stem aan een van de grootste mysteries in AI-ontwikkeling. [1] Tot voor kort waren grote taalmodellen als ChatGPT ondoorzichtige systemen – hun innerlijke werking een raadsel, zelfs voor hun makers.

Dankzij nieuwe onderzoekstechnieken, waaronder het gebruik van zogeheten ‘sparse autoencoders’, kunnen wetenschappers nu voor het eerst een blik werpen in het binnenste van deze AI-systemen. Wat ze daar aantroffen, tart de verbeelding: complexe geometrische structuren die opvallende gelijkenissen vertonen met de organisatie van biologische hersenen.

Een driedimensionaal web van betekenis

Op het meest fundamentele niveau blijkt AI informatie te ordenen in wat onderzoekers ‘semantische kristallen’ noemen. Stel je een driedimensionaal spel boter-kaas-en-eieren voor, maar dan met woorden en concepten in plaats van kruisjes en rondjes. In dit complexe web vormen gerelateerde begrippen geometrische patronen die wiskundige precisie verraden.

Het koninginnenpuzzeltje

Een fascinerend voorbeeld hiervan is hoe het model omgaat met begrippen als ‘man’, ‘vrouw’, ‘koning’ en ‘koningin’. In de geometrische ruimte van het AI-model vormen deze woorden een perfect parallelogram. De afstand tussen ‘man’ en ‘vrouw’ is exact gelijk aan die tussen ‘koning’ en ‘koningin’. Dit patroon herhaalt zich voor talloze andere conceptparen, van landen en talen tot grammaticale vormen.

De drie lagen van het AI-brein

Het onderzoek onthult dat de organisatie van AI-systemen bestaat uit drie distincte niveaus, elk met een eigen functie en karakteristiek:

Niveau 1: atomaire structuren

Op het meest basale niveau verbindt AI gerelateerde concepten via elementaire geometrische patronen. Deze ‘atomaire structuren’ vormen de bouwstenen voor complexere kennisorganisatie. Het is hier waar de AI leert dat ‘warm’ bij ‘zon’ hoort en ‘nat’ bij ‘regen’ – niet als losse woordparen, maar als punten in een multidimensionale betekenisruimte.

Niveau 2: gespecialiseerde hersengebieden

Wat de onderzoekers versteld deed staan, was de ontdekking dat AI-systemen spontaan ‘hersengebieden’ ontwikkelen met specifieke functies. Niemand programmeert deze specialisatie – ze ontstaat vanzelf tijdens het leerproces. Deze gebieden omvatten:

  • Een ’taalcentrum’ voor algemene tekstverwerking
  • Een ‘logische kwab’ voor wiskunde en programmeren
  • Een ‘dialooggebied’ voor conversaties
  • Een ‘creatieve zone’ voor het genereren van nieuwe ideeën

Niveau 3: de AI-melkweg

Op het hoogste organisatieniveau onthult zich wat onderzoekers de ‘melkwegstructuur’ noemen: een grootschalig netwerk dat alle onderdelen verbindt. Centraal hierin ligt de ‘information bottleneck layer’ – een soort kosmisch knooppunt waar alleen de meest essentiële informatie doorheen mag.

De Donald Trump-neuron en andere verrassingen

Een van de meest intrigerende ontdekkingen kwam aan het licht tijdens een recent interview met Anthropic-CEO Dario Amodei. Hij onthulde dat elk groot taalmodel een ‘Donald Trump-neuron’ ontwikkelt – een gespecialiseerde eenheid die zich toelegt op het verwerken van informatie over de voormalige president. Het is het enige consistente voorbeeld van een ‘persoonlijkheidsneuron’ dat onderzoekers hebben gevonden, en niemand begrijpt precies waarom.

Een universele wet van intelligentie?

De ontdekking dat AI-systemen spontaan hersenachtige structuren ontwikkelen, roept fundamentele vragen op. Bestaat er een universele wet die bepaalt hoe intelligente systemen zich organiseren? Het feit dat zowel biologische als kunstmatige intelligentie vergelijkbare patronen ontwikkelt, suggereert van wel.

Implicaties voor ons begrip van intelligentie

Deze nieuwe inzichten werpen ook licht op menselijke cognitie. Als we begrijpen hoe AI-systemen kennis organiseren, kunnen we mogelijk beter begrijpen hoe onze eigen hersenen werken. Dit opent deuren voor:

  • Nieuwe behandelingen voor neurologische aandoeningen
  • Verbeterde leermethoden gebaseerd op natuurlijke kennisorganisatie
  • Dieper inzicht in het ontstaan van bewustzijn

Grenzen aan de vergelijking

Toch is voorzichtigheid geboden. Hoewel de parallellen tussen AI en biologische hersenen fascinerend zijn, blijven er fundamentele verschillen. AI-systemen missen bijvoorbeeld:

  • Emotionele ervaringen
  • Zelfbewustzijn
  • De capaciteit om echt nieuwe concepten te vormen

Toekomstperspectieven

Deze ontdekkingen openen nieuwe wegen voor AI-onderzoek en -ontwikkeling. Met een beter begrip van de interne structuren kunnen we:

  • Gerichtere verbeteringen aanbrengen in AI-architectuur
  • Systemen ontwikkelen die transparanter zijn in hun besluitvorming
  • Mogelijk nieuwe vormen van hybride intelligentie creëren die het beste van biologische en kunstmatige systemen combineren

Tot slot: een nieuwe fase in AI-begrip

De ontdekking van hersenachtige structuren in AI-systemen markeert een kantelpunt in ons begrip van kunstmatige intelligentie. We staan aan het begin van een nieuw tijdperk waarin de grenzen tussen natuurlijke en kunstmatige intelligentie vervagen, en waarin we mogelijk fundamenteel nieuwe inzichten krijgen in de aard van denken en bewustzijn zelf.

Wilt u meer weten over de laatste ontwikkelingen op het gebied van AI en de implicaties voor uw organisatie? Neem contact op met CiviQs voor een gesprek over de mogelijkheden.

Over de Auteur

Daniel Verloop is expert in AI-innovatie, governance en ethiek voor de publieke sector. Als senior AI consultant bij CiviQs, AI specialist bij gemeente Montferland, lid van de EU AI Alliantie en het kernteam Publieke Diensten van de Nederlandse AI Coalitie (NLAIC) bevordert hij mensgerichte AI in de samenleving. Zijn expertise omvat AI-strategie, compliance met de EU AI Act en implementatie van AI-oplossingen voor overheden.