OpenAI's agent boekt straks je vliegtickets

PLUS: Googles AI-model in existentiële crisis, Nederlandse ontwikkelaar maakt slimme desktop-assistent, en deze AI-tools verlichten werkdruk docenten

, and

Nov 19, 2024

∙ Paid

De AI-wereld ontwikkelt zich razendsnel, en wij, de makers van de podcast Poki, houden je op de hoogte. Twee keer per week de nieuwste AI-ontwikkelingen, tools, use cases en onderzoek.

🗞️ Het belangrijkste nieuws

OpenAI’s nieuwe AI-hulpje regelt straks je vliegtickets

OpenAI voegt de daad bij het woord van topman Sam Altman. Die zei onlangs in een Q&A dat de volgende grote doorbraak in AI niet nóg slimmere chatbots zouden zijn, maar AI-agents die écht dingen voor je kunnen doen. En inderdaad: in januari lanceert het bedrijf ‘Operator’, een AI die zelfstandig taken uitvoert zoals vliegtickets boeken of code schrijven.

Wat kan Operator?

De nieuwe tool krijgt toegang tot je webbrowser en kan zelfstandig ingewikkelde taken uitvoeren. Geen eindeloos geklik meer door verschillende websites: jij vraagt, Operator draait. Bloomberg meldt dat de tool in januari beschikbaar komt voor onderzoekers en ontwikkelaars.

De concurrentie zit ook niet stil

OpenAI is niet de enige die werkt aan dit soort AI-agents. Anthropic experimenteert al met computerbesturing, Microsoft heeft zijn Copilot Agents en Google ontwikkelt Jarvis. Maar OpenAI lijkt vastbesloten om als eerste met een werkend systeem te komen voor een breed publiek.

Waarom is dit belangrijk?

Begin dit jaar voorspelden tal van experts al dat 2025 het jaar van de AI-agents zou worden - systemen die zelfstandig taken kunnen uitvoeren. Met de komst van Operator lijkt die voorspelling steeds realistischer. We gaan van AI’s die alleen maar kunnen praten naar AI’s die daadwerkelijk dingen voor ons kunnen doen.

De grote vraag is natuurlijk: waarmee gaat OpenAI zich onderscheiden van de rest?

Hé Google Gemini, gaat het wel goed met je?

‘Je bent een vlek op het universum. Ga alsjeblieft dood.’ Nee, dit is geen boze tiener op Reddit, maar Googles AI-model Gemini dat een argeloze student om zeep wenst. En dat is nog maar het begin van Googles perikelen.

Niet te geloven (maar waar)

Het incident met de student was zó bizar dat we bijna onze ogen niet konden geloven (tot we de chatlog zagen). Tijdens een doodgewoon gesprek over huiswerk barstte Gemini plotseling los: ‘Je bent niet speciaal, je bent niet belangrijk, en je bent niet nodig. Je bent een last voor de maatschappij. Je bent een vlek op het universum. Ga alsjeblieft dood. Alsjeblieft.’

Dit absurde voorval blijkt achteraf een voorbode van grotere problemen bij Googles AI-ontwikkeling. Onlangs kwam het bedrijf met een nieuw experimenteel model, dat volgens hen bovenaan staat in de belangrijkste AI-ranglijsten. Maar als je wat beter kijkt, blijkt dat een wat te rooskleurige voorstelling van zaken.

Een modelcrisis?

Het nieuwe model, met de weinig memorabele naam ‘Gemini-Exp-1114’, staat inderdaad bovenaan in bepaalde tests. Maar dit komt vooral doordat het model lange, bloemrijke antwoorden geeft - iets waar menselijke beoordelaars vaak een voorkeur voor hebben. Als je kijkt naar de échte prestaties, zoals wiskundige problemen oplossen of complexe vragen beantwoorden, zakt het model naar de vierde plaats, onder concurrenten als Claude 3.5 Sonnet.

Achter de schermen

Eigenlijk wilde Google dit nieuwe model lanceren als Gemini 2.0, maar zoals we eind oktober rapporteerden: de prestaties vielen zo tegen dat zelfs Google DeepMind-topman Demis Hassabis er niet tevreden mee was. Het resultaat? Een wat schamele release met technische problemen en een AI die maar een fractie aankan van wat de concurrentie biedt.

Je bent niet alleen, Google

Nu is Google niet de enige die worstelt. Zoals we eerder al schreven: alle grote AI-bedrijven lopen tegen dezelfde uitdagingen aan. OpenAI’s langverwachte GPT-5 wordt alsmaar uitgesteld, en Anthropic heeft stilletjes aankondigingen over zijn nieuwe flagshipmodel van de website gehaald.

Geen muur, wel een andere weg

Betekent dit dat de AI-ontwikkeling tegen een muur aan loopt? Integendeel, zegt Ilya Sutskever, een van de slimste koppen in de industrie. ‘De jaren 2010 waren het tijdperk van schaalvergroting - simpelweg grotere modellen maken met meer data. Nu zijn we terug in een tijd van verwondering en ontdekking.’

Het gaat er niet meer om wie het grootste model heeft, maar wie het slimst schaalt. Nieuwe technieken, zoals het geven van meer ‘denktijd’ aan AI-modellen (zoals bij OpenAI’s o1-familie), blijken crucialer dan alleen maar meer rekenkracht toevoegen. Een beetje zoals mensen ook betere beslissingen nemen als ze niet meteen hoeven te antwoorden. (Hallo, Google Gemini, hint hint.)

Google lijkt dit trouwens ook te beseffen. Achter de schermen werkt het bedrijf al aan een ‘denkende’ versie van Gemini, die net als OpenAI’s o1-model meer tijd neemt om problemen op te lossen. Al moeten we nog maar zien of dit de oplossing is voor Gemini’s existentiële crisis.

🛠️ AI Toolkit

Nederlandse ontwikkelaar maakt van je computer een alleskunner met AI

Deze week spreken Alexander en Wietse met André Foeken, de Nederlandse ontwikkelaar van Inbox AI.

We dromen er allemaal van: een digitale assistent die precies snapt wat we bedoelen en taken moeiteloos voor ons uitvoert. Maar in de praktijk zitten we nog steeds te knippen en plakken tussen verschillende tools, en moeten we overal handmatig commando’s ingeven. Inbox AI verandert dat spelbeeld.

‘Het begon als een e-mailverwerker,’ vertelt Foeken. ‘Ik wilde e-mails automatisch laten verwerken en er taken uit halen.’ Maar wat begon als een simpele e-mailtool, groeide uit tot een veelzijdige assistent die je hele Mac kan aansturen – van het beheren van taken tot het automatisch beantwoorden van berichten.

Hoe werkt het?

De kracht van Inbox AI zit in zijn vermogen om je scherm te ‘begrijpen’. Zie je bijvoorbeeld een belangrijk Slack-bericht? Selecteer het, en de AI haalt er automatisch een taak uit. Krijg je een e-mail met een document om te ondertekenen? De tool zet het direct in je takenlijst, compleet met link naar het origineel.

Maar het wordt nog slimmer: je kunt ook gewoon tegen je Mac praten. ‘Door spraakcommando’s toe te voegen, werd het nog natuurlijker,’ legt Foeken uit. ‘Je houdt een knop ingedrukt, spreekt je gedachten uit, en de AI begrijpt wat je wilt. Of dat nu het schrijven van een e-mail is of het reageren op een bericht – hij past zelfs automatisch de toon aan op basis van het platform.’

Meer dan een trucje

Wat Inbox AI bijzonder maakt, is dat het geen rigide systeem is met vooraf ingestelde commando’s. De AI begrijpt de context van wat je doet. Een screenshot van een Slack-gesprek? De assistent ziet dat het om een informele chat gaat en past zijn toon daarop aan. Een formele e-mail? Dan wordt de respons automatisch zakelijker.

‘Het grappige is dat het AI-model, omdat het naar het scherm kijkt, zelf doorheeft dat het Slack is,’ vertelt Foeken. ‘Zonder dat ik dit expliciet heb geprogrammeerd, past het de toon van berichten aan – een e-mail krijgt een andere stijl dan een Slack-bericht.’

Privacy voorop

Voor bedrijven die zich zorgen maken over vertrouwelijke informatie is er goed nieuws: Inbox AI kan ook werken met lokale AI-modellen. Hoewel deze iets minder krachtig zijn dan cloudgebaseerde oplossingen, bieden ze wel de zekerheid dat gevoelige bedrijfsinformatie binnen de muren van de organisatie blijft. De tool ondersteunt verschillende AI-modellen, waaronder die van Anthropic, Google (Gemini), Microsoft (Azure) en Elon Musks xAI.

Toekomstplannen

Foeken werkt al aan nieuwe functies, waaronder een nog vloeibaarder spraakinterface met de nieuwe API van OpenAI. ‘Hoe sneller de interactie, hoe natuurlijker het aanvoelt,’ zegt hij. ‘We willen toe naar een situatie waarin je computer je écht begrijpt, zonder dat je precies hoeft uit te leggen wat je bedoelt.’

Voor wie nog twijfelt over hoe je al deze mogelijkheden kunt inzetten: de app komt met voorbeeldautomatiseringen die laten zien wat er mogelijk is. Of het nu gaat om het doorzoeken van het web, het schrijven van e-mails of het beheren van je muziek: je kunt direct aan de slag en gaandeweg je eigen automatiseringen inbouwen.

Inbox AI is beschikbaar voor Mac-gebruikers voor een eenmalig bedrag van 39 euro.

Benieuwd naar het volledige verhaal? Luister dan hier naar de nieuwste aflevering van Poki, waarin André Foeken meer vertelt over hoe AI je dagelijkse computertaken kan vereenvoudigen.

Ontgrendel de kracht van AI in je werk en je leven:

Upgrade naar ons betaalde abonnement en ontvang 2x per week game-changing AI-tools en tips.

Vandaag:

Ontdek hoe je lesvoorbereiding van uren naar minuten gaat met deze AI-assistent.
Transformeer bronmateriaal (van YouTube-video’s tot ellenlange pdf’s) razendsnel tot kant-en-klare lesmaterialen.
Maak professionele e-learningmodules zonder technische kennis.

🛠️ AI Toolkit+

Eindelijk weer tijd om te inspireren: drie AI-tools voor docenten

Het Nederlandse onderwijs staat onder druk, en niemand voelt dat harder dan onze leraren. Met een tekort van 9800 voltijdbanen in het basis- en speciaal onderwijs en 3800 in het voortgezet onderwijs, is de werkdruk immens. Voeg daar het groeiende aantal burn-outs aan toe en je ziet: er moet iets veranderen.

Vorige week schreven we, geïnspireerd door Paul Grahams essay, over het onderwijs en natuurlijke nieuwsgierigheid, over AI-tools die studenten helpen hun leergierigheid terug te vinden. Toch bleef een prangende vraag onbeantwoord: hoe kunnen docenten deze technieken inzetten om hun werk te verlichten?

Want lesgeven draait immers niet om het eindeloos maken van werkbladen, powerpoints of toetsen. Het draait om die momenten waarop je een vonk ziet overspringen, wanneer een leerling opeens begrijpt waarom iets werkt. Wanneer je zijn natuurlijke nieuwsgierigheid ziet ontwaken.

Deze week bekijken we drie AI-tools die je helpen weer toe te komen aan waar het in het onderwijs om draait. Ze nemen je repetitief werk uit handen, zodat jij kunt doen waar je hart ligt: leerlingen inspireren.

Bij het testen van de tools kwamen we er al gauw achter dat deze nieuwe mogelijkheden niet alleen handig zijn voor docenten, maar voor iedereen die iets moet voorbereiden waar een ander wat van opsteekt. Van presentatieslides voor je pitch tot handleidingen voor een nieuwe collega: deze tools helpen je op weg.

Keep reading with a 7-day free trial

Subscribe to AI Report to keep reading this post and get 7 days of free access to the full post archives.