Ontmoet de AI-onderzoeksassistent van je dromen
PLUS: MIT’s verrassende AI-doorbraak, Google DeepMind deelt AlphaFold met de wereld en spionagevliegtuigen vliegen boven Elon Musks supercomputer
De AI-wereld ontwikkelt zich razendsnel, en wij, de makers van de podcast Poki, houden je op de hoogte. Twee keer per week de nieuwste AI-ontwikkelingen, tools, use cases en onderzoek.
🗞️ Het belangrijkste nieuws
MIT’s verrassende doorbraak: AI evenaart de mens op beruchte intelligentietest
Stel je voor: Je zit in de trein op weg naar een belangrijke presentatie en je bladert nog snel even door je aantekeningen. Die laatste opfrisbeurt zorgt ervoor dat je scherper bent tijdens de presentatie en iedereen omverblaast. Precies dat principe hebben onderzoekers van MIT nu toegepast op kunstmatige intelligentie – en het werkt verrassend goed.
De doorbraak in het kort
De onderzoekers ontdekten dat als je een AI-model vlak voor een moeilijke taak even laat oefenen met vergelijkbare problemen, de prestaties spectaculair verbeteren. Het team noemt deze techniek ‘test-time training’. In sommige gevallen werden de resultaten zelfs zes keer beter.
Het geheim? Tijd om op te warmen
De timing is interessant. Waar OpenAI’s recent uitgebrachte o1-model liet zien dat meer rekenkracht tijdens het denken tot betere prestaties leidt, ontdekten de MIT-onderzoekers dat een korte ‘opwarmronde’ voor een taak al dramatisch betere resultaten geeft. Het is een beetje alsof je de AI eerst even laat warmlopen voordat je hem aan het werk zet, net als een sporter niet meteen zijn beste prestatie levert zonder warming-up.
De ARC: waarom dit zo bijzonder is
De doorbraak is extra opmerkelijk omdat het gaat om de beruchte ARC (Abstraction and Reasoning Challenge). François Chollet, voormalig hoofdonderzoeker bij Google, ontwierp deze test specifiek om aan te tonen dat taalmodellen fundamenteel tekortschieten in echt redeneren. Hij loofde zelfs een miljoen dollar uit voor het eerste systeem dat een 12-jarige kon evenaren.
‘De huidige generatie AI-systemen zijn eigenlijk grote geheugenmachines,’ verklaarde Chollet eerder. ‘Ze presteren goed op taken die lijken op wat ze eerder hebben gezien. Maar échte intelligentie draait om het oplossen van nieuwe problemen.’
Tot nu toe leek hij gelijk te krijgen. Waar zelfs een kind van 5 jaar meer dan 50 procent van de puzzels oplost, kwam AI niet verder dan 35 procent. Sterker nog, Chollet was zo overtuigd van de beperkingen van taalmodellen dat hij stelde dat de focus daarop de vooruitgang in AI met vijf tot tien jaar heeft vertraagd.
Maar toen kwam MIT om de hoek kijken. De onderzoekers testten hun methode op deze test, bestaande uit een verzameling visuele puzzels vergelijkbaar met de puzzeltjes die je voorgeschoteld krijgt bij een IQ-test.
De truc werkt als volgt:
Het model krijgt een moeilijke puzzel voorgeschoteld.
Voor het de puzzel oplost, mag het eerst oefenen met vergelijkbare opgaven.
Door deze korte ‘opwarmronde’ is het model beter voorbereid op de echte uitdaging.
Verrassende resultaten
Het team testte de methode met verschillende AI-modellen. Bij een kleiner model van 1 miljard parameters zagen ze een verbetering van 6 naar 36 procent correct opgeloste puzzels. Het grootste model (8 miljard parameters) haalde na de training zelfs scores die vergelijkbaar zijn met het menselijk gemiddelde (62 procent).
Een patroon wordt zichtbaar
De combinatie van OpenAI’s o1 en de MIT-doorbraak wijst op een belangrijke trend. Toen OpenAI o1 lanceerde, schreven we al dat het oude paradigma van ‘grotere modellen = betere prestaties’ was doorbroken. O1 bewees dat ‘denktijd’ zijn eigen schaalwet heeft: hoe meer tijd een model krijgt om na te denken, hoe beter het presteert.
Het MIT-team bewijst nu dat dit principe breder toepasbaar is dan gedacht. Met hun ‘test-time training’-methode bereiken ze scores die vergelijkbaar zijn met die van mensen - een prestatie die velen voor onmogelijk hielden.
De kracht van denktijd
Het fascinerende aan deze ontwikkelingen wordt goed geïllustreerd door een eerder experiment met het kaartspel Hanabi. Noam Brown, een van de hoofdontwikkelaars van o1, vertelt hoe een simpele aanpassing - het toevoegen van extra ‘denktijd’ - tot ongelooflijke resultaten leidde.
‘We namen een basis-AI die maar 28 procent scoorde en gaven hem de simpelste zoekmethode die je kunt bedenken,’ legt hij uit. ‘Het systeem mocht verschillende acties uitproberen en de beste kiezen. Met alleen die aanpassing schoot de score omhoog naar 60 procent - beter dan alle voorgaande systemen. Dit kostte slechts één seconde extra rekentijd op een gewone processor.’
Het werd nog indrukwekkender. Door dezelfde techniek toe te passen op geavanceerdere systemen, steeg de score naar 72 procent. ‘Toen we deze resultaten zagen, dacht mijn collega dat het een bug moest zijn,’ vertelt hij. ‘Het leek onvoorstelbaar dat zo’n simpele aanpassing zulke drastische verbeteringen kon opleveren.’
Dit experiment voorspelde al wat we nu zien gebeuren: extra denktijd en zoekstrategieën blijken de sleutel tot geavanceerd redeneren.
Zijn we de spreekwoordelijke kikker?
Deze snelle opeenvolging van doorbraken doet ons steeds meer denken aan de metafoor van de kikker in langzaam opwarmend water. Stap voor stap lijken we algemene kunstmatige intelligentie (AGI) te naderen, maar omdat het geleidelijk gaat, hebben we niet door hoe significant de vooruitgang is.
Shane Legg, medeoprichter van de Nobelprijs-winnende Google DeepMind, ziet een duidelijk patroon: ‘Voor echte creativiteit heb je een systeem nodig dat kan zoeken door mogelijkheden. Dat is precies wat we nu zien gebeuren.’
Twee routes naar superintelligentie
We zien nu twee parallelle paden naar krachtigere AI ontstaan. Enerzijds is er de traditionele route van grotere modellen met meer rekenkracht. Anderzijds ontstaat er een nieuwe weg: de slimmere inzet van denktijd en zoekstrategieën.
‘Het bestaan van deze twee schaalwetten - een voor training en een voor denken - suggereert dat AI-capaciteiten op het punt staan dramatisch te verbeteren,’ stelde professor Ethan Mollick al bij de lancering van o1. De MIT-doorbraak onderstreept dit: zelfs zonder massieve rekenkracht kunnen we AI-systemen veel effectiever maken.
De volgende grens
Het fascinerendste aspect van deze ontdekking is misschien wel hoe menselijk het principe is. Net zoals wij beter presteren na een korte voorbereiding, blijkt dit ook steeds meer voor AI te gelden. Het onderstreept dat effectief leren - of het nu door mensen of machines gebeurt - vaak dezelfde patronen volgt.
De implicaties van deze doorbraak zijn verstrekkend. We ontdekken steeds vaker dat bestaande AI-systemen mogelijk veel krachtiger zijn dan gedacht - ze hebben alleen de juiste voorbereiding nodig. De grens tussen menselijke en kunstmatige intelligentie vervaagt sneller dan verwacht, waarbij efficiënt zoeken en denken belangrijker blijken dan pure rekenkracht. Het suggereert dat de weg naar AGI mogelijk niet enkel ligt in het bouwen van steeds grotere modellen, maar ook in het ontwikkelen van slimmere manieren van denken.
De code voor de MIT-doorbraak is openbaar gemaakt, zodat anderen kunnen voortbouwen op het werk. Slimme zet, nu het ons steeds meer begint te dagen dat de combinatie van slimmere modellen én slimmere denktijd deuren opent die we nog maar net beginnen te ontdekken.
⚡ AI Pulse
OpenAI’s Greg Brockman keert vervroegd terug van ‘langste vakantie ooit’. De medeoprichter en voorzitter van OpenAI heeft zijn sabbatical van drie maanden vroegtijdig afgebroken, net nu het bedrijf kampt met een exodus van toptalent. Terwijl verschillende executives, waaronder CTO Mira Murati en onderzoekshoofd Bob McGrew, het bedrijf verlaten, keert Brockman terug om samen met CEO Sam Altman zijn nieuwe rol vorm te geven. Het lijkt erop dat er bij OpenAI momenteel meer mensen de deur uit gaan (laatste in het rijtje: veiligheidsonderzoekers Lilian Weng en Richard Ngo) dan in gaan - behalve dan die ene belangrijke deur.
Amazon probeert AI-onderzoek te sturen met 110 miljoen dollar aan ‘cadeaubonnen’. De techreus lanceert een fondsprogramma waarbij onderzoekers toegang krijgen tot hun Trainium AI-chips, maar er zit een addertje onder het gras. Amazons eigen AI-team bepaalt welke projecten ‘het meest impactvol’ zijn en dus financiering krijgen. Het doet denken aan die ene rijke oom die je een cadeaubon geeft, maar wel wil bepalen wat je ervoor koopt.
Concurrenten bespioneren Musks ‘Colossus’ met spionagevliegtuigen. Elon Musks xAI heeft in Memphis een supercomputer gebouwd met 100.000 NVIDIA H100 GPU’s, en de concurrentie is zo nieuwsgierig dat ze er letterlijk overheen vliegt om een kijkje te nemen. Met een geschatte waarde van 3 miljard dollar en plannen om te verdubbelen naar 200.000 GPU’s, lijkt Musk vastbesloten om de grootste AI-speeltuin ter wereld te bouwen, en daar is natuurlijk niet iedereen blij mee. O, als je ook nieuwsgierig bent geworden: hier deelden we een filmpje van een tour door Colossus. Is toch wat makkelijker dan eroverheen vliegen.
DeepMind deelt AlphaFold 3 met de wereld - nou ja, bijna dan. Googles AI-lab heeft zijn baanbrekende eiwit-voorspellingsmodel open source gemaakt voor academische onderzoekers. Het Nobelprijs-winnende systeem kan interacties voorspellen tussen eiwitten en andere moleculen zoals DNA en RNA. Maar voordat commerciële partijen al te enthousiast worden: voor hen blijft de deur nog even dicht.
Apple werkt aan slimme wandtablet die je huis bestuurt. Volgens hardnekkige geruchten ontwikkelt de iPhone-maker een 6 inch ‘AI-wandtablet’ die je smarthome moet gaan besturen vanaf maart 2025. Het apparaat, dat eruit zou zien als een vierkante iPad, kan zelfs op een robotarm worden gemonteerd en kost ‘veel minder’ dan de geplande 1000-dollarversie met bewegende arm. Blijkbaar vindt Apple dat we nog niet genoeg schermen in huis hebben om tegenaan te staren.
🧠 Co-intelligentie
Poki en AI Report geven samen met uitgeverij POM.Press Co-intelligentie van Ethan Mollick uit. Dit boek legt uit hoe je samen kunt denken en werken met slimme machines. Met de juiste skills kan ook jij ChatGPT inzetten om je werk makkelijker, beter en sneller te maken. Hierbij een voorproefje van onze bestseller:
AI is geen traditionele software
We zouden AI meer moeten behandelen als een mens en minder als software. Om efficiënt met elkaar samen te werken moet je eerst de sterke en zwakke punten leren kennen. Eigenlijk net zoals bij een collega.
Traditionele software is voorspelbaar: als de regels goed zijn gevolgd, krijg je altijd dezelfde uitkomst. AI is anders. AI kan je verrassen met briljante oplossingen, maar ook met onverwachte of misleidende antwoorden. Bij traditionele software weten we precies wat er gebeurt en waarom.
Bij AI tasten we vaak in het duister. Zelfs als we AI vragen naar de reden achter een beslissing, verzint het liever een antwoord dan dat het echt reflecteert, omdat AI niet in staat is tot zelfbespiegeling zoals mensen dat doen.
Er is geen handleiding voor AI die precies uitlegt hoe je het moet gebruiken; we experimenteren en delen prompts alsof ze magische spreuken zijn.
AI gedraagt zich dus menselijk en niet als software. Daarmee wil Ethan Mollick niet zeggen dat AI bewustzijn heeft of dat ooit zal hebben. Hij pleit voor een pragmatische aanpak: behandel AI alsof het menselijk is, omdat het zich in veel opzichten zo gedraagt.
‘AI kan schrijven, analyseren en communiceren, en je productiviteit verhogen door routinetaken over te nemen. Maar het heeft moeite met taken die consistentie en complexe berekeningen vereisen, en het kan fouten maken en verkeerde informatie geven. AI-systemen maken ook fouten, vertellen leugens en hallucineren antwoorden, net als mensen.’
Ethan Mollick benadrukt het vaak in Co-intelligentie: door AI als een cocreatieve partner te behandelen, krijg je een beter inzicht in hoe je deze technologie effectief kunt inzetten.
Het boek kost € 26,50 en dat is inclusief het e-book bij het papieren boek. Als je het boek bestelt, ontvang je drie maanden gratis AI Report.
Wil je ervoor zorgen dat je collega’s of medewerkers meer gedaan krijgen met AI? Bestel dan Co-intelligentie voor hen. Bij grote afnames bieden we je staffelkortingen aan.
Neem contact op met Greta Le Blansch voor meer informatie en een aanbod op maat. Mail ons op: greta@mavenpublishing.nl.
🔮 Prompt whisperer
Google NotebookLM: de onderzoeksassistent van je dromen
Je kent het wel: Ergens in die berg notities, documenten en losse aantekeningen zit dat ene briljante inzicht. Maar waar? En nog belangrijker: Wat als al die ideeën en inzichten eens met elkaar in gesprek konden gaan? Als ze zelf verbanden konden leggen die jij nog niet had gezien?
Tot voor kort was dit ondenkbaar. Maar er is iets veranderd. Google NotebookLM maakt het mogelijk.
We schreven er in juni voor het eerst over, en vorige maand lieten we je zien hoe je NotebookLM kunt inzetten als je persoonlijke lifecoach. Maar vandaag vertellen we meer over waar deze tool écht voor is gemaakt: je onmisbare onderzoeksassistent zijn.
Want hoewel NotebookLM veel kan, is het in de kern ontwikkeld met één doel: onderzoekers, schrijvers en andere kenniswerkers helpen om grip te krijgen op grote hoeveelheden informatie. Niet zomaar een AI die van alles belooft, maar een doelgerichte assistent die precies weet wat je nodig hebt.
Keep reading with a 7-day free trial
Subscribe to AI Report to keep reading this post and get 7 days of free access to the full post archives.