ChatGPT's menselijke stem: zo krijg jij toegang

PLUS: OpenAI-topman voorspelt superintelligentie, Google Gemini's upgrade onder de loep, en leer je AI zichzelf te verbeteren

, and

Sep 26, 2024

∙ Paid

De AI-wereld ontwikkelt zich razendsnel, en wij, de makers van de podcast Poki, houden je op de hoogte. Twee keer per week de nieuwste AI-ontwikkelingen, tools, use cases en onderzoek.

🗞️ Het belangrijkste nieuws

ChatGPT’s stemfunctie eindelijk uit: AI die praat als een mens

Eindelijk is-ie er: na maanden wachten is OpenAI’s geavanceerde stemfunctie uit! Even een kleine geheugenopfrisser: OpenAI presenteerde dit voorjaar voor het eerst een demo die de wereld verbaasde met hyperrealistische stemmen waarmee je in real time kunt praten met ChatGPT alsof het een echt mens is. Het maakte furore omdat de stem ‘Sky’ verdacht veel leek op die van Scarlett Johansson.

Na maanden en maanden van vertragingen is de functie nu beschikbaar. Voor iedereen met een betaald Plus-abonnement... behalve in de EU. Wij zijn weer de pineut, maar niet getreurd: er is een slimme workaround!

Wat je moet weten over de nieuwe stemfunctie:

De functie is beschikbaar voor betalende Plus-abonnees.
Europese gebruikers hebben (nog) geen officiële toegang.
Je kunt kiezen uit verschillende stemmen en accenten.
De technologie maakt realtime gesprekken met AI mogelijk.

De EU-beperking omzeilen: zo simpel is het

Voor Nederlandse gebruikers is er een eenvoudige manier om de EU-beperking te omzeilen:

Download een VPN-dienst.
Zet je VPN aan en stel hem in op bijvoorbeeld de VS.
Verwijder de ChatGPT-app en installeer deze opnieuw.

Et voilà! Nu kun je een potje kletsen met ChatGPT alsof het een mens is.

De impact van de stemfunctie

Hoewel het leuk is om de app in verschillende accenten te laten antwoorden, ligt de echte impact waarschijnlijk ergens anders. Deze technologie zou weleens honderden miljoenen mensen laagdrempelig in contact kunnen brengen met AI.

En dit is nog maar het begin. Het natuurlijke en niet al te verre eindpunt van deze ontwikkeling is dat ChatGPT een fotorealistische set video-avatars krijgt. Laten we er een voorspelling op loslaten: in 2025 zullen we waarschijnlijk effectief een videogesprek kunnen voeren met ChatGPT.

Toekomstvisie van OpenAI

Naast de lancering van de stemfunctie heeft OpenAI-topman Sam Altman onlangs een essay gepubliceerd getiteld ‘The Intelligence Age’. Hierin schetst hij een toekomstbeeld waarin AI een transformerende rol speelt:

Altman voorspelt de komst van superintelligentie binnen ‘enkele duizenden dagen’.
Hij voorziet persoonlijke AI-teams met virtuele experts op diverse gebieden.
Toepassingen zouden kunnen variëren van gepersonaliseerde AI-tutors tot verbeterde gezondheidszorg.

Altman benadrukt dat er voldoende rekenkracht en energie nodig zal zijn om AI breed toegankelijk te maken. Dit zou kunnen leiden tot een nieuw ‘intelligentietijdperk’, gekenmerkt door wetenschappelijke doorbraken en welvaart voor de mensheid.

Energiebehoefte voor AI-ontwikkeling

De ambitieuze plannen van OpenAI gaan gepaard met een enorme energiebehoefte:

OpenAI heeft vijf tot zeven datacentra gepland, die elk 5 gigawatt verbruiken.
Dit is vergelijkbaar met het energieverbruik van New York en Londen samen.
Microsoft, een belangrijke financier, heeft een overeenkomst gesloten om de Three Mile Island-kernreactor weer in gebruik te nemen.

Dit laat zien hoe groot het vertrouwen van OpenAI en Microsoft is in de toekomst van AI.

Wat betekent dit voor de toekomst?

Hoewel er overal voorspellingen over superintelligentie te vinden zijn, verdient de visie van Sam Altman extra aandacht. Als CEO van OpenAI weet hij meer over de huidige mogelijkheden van AI dan bijna iedereen ter wereld - en hij is uiterst optimistisch over de toekomst.

Daartegenover zet hij ook een belangrijke waarschuwing: ‘Als we niet genoeg infrastructuur bouwen, zal AI een zeer beperkte hulpbron worden waar oorlogen om gevoerd kunnen worden.’ Dit raakt aan een cruciale kwestie: hoe zorgen we voor gelijke toegang tot geavanceerde AI? Altman schetst een scenario waarin rijke mensen antwoorden kunnen krijgen van een superintelligentie, terwijl arme mensen dat niet kunnen. Deze potentiële ongelijkheid in toegang tot AI-technologie zou verstrekkende gevolgen kunnen hebben voor de samenleving.

Terwijl de technologie zich razendsnel ontwikkelt, is het cruciaal om deze vragen te blijven stellen en na te denken over de implicaties. De lancering van OpenAI’s stemfunctie is meer dan een nieuwe feature - het is een glimp van een toekomst waarin de grens tussen mens en machine vervaagt. De uitdaging zal zijn om ervoor te zorgen dat deze transformatie ten goede komt aan de hele samenleving, niet slechts aan een bevoorrechte groep.

Google’s Gemini krijgt upgrade: sneller, slimmer, maar met een tongbrekende naam

Google heeft zojuist significante updates aangekondigd voor zijn Gemini AI-modellen. Maar laten we eerst even stilstaan bij de naamgeving. Als ‘Gemini 1.5 Pro 002’ je doet denken aan een willekeurige wachtwoordgenerator, ben je niet de enige. Het lijkt erop dat Googles creativiteit op is na het bedenken van baanbrekende AI - gelukkig compenseert de verbeterde functionaliteit ruimschoots de weinig inspirerende naam.

Wat je moet weten over de Gemini-update:

twee nieuwe AI-modellen: Gemini 1.5 Pro 002 en Gemini 1.5 Flash 002;
20% verbetering op wiskundige benchmarks;
meer dan 50% prijsverlaging voor input en output bij prompts onder 128K tokens;
twee keer snellere output en drie keer lagere latentie vergeleken met vorige versies;
verbeterd begrip van uitgebreide contexten en verbeterde visuele capaciteiten.

Prestaties onder de loep

De hoeveelheid content die je in één keer in het model kunt stoppen, blijft indrukwekkend: 2 miljoen tokens. Dat staat gelijk aan een pdf van duizend pagina’s of het analyseren van een codebase met tienduizend regels code. Op traditionele benchmarks zien we significante verbeteringen, vooral bij wiskunde, visuele taken en vertalingen.

In de uitdagende GPQA-benchmark (Google Proof Question and Answer) voor biologie, natuurkunde en scheikunde scoorde het nieuwe model 59% - een stijging van 13% ten opzichte van de vorige versie. Ter vergelijking: de o1-familie van OpenAI haalt scores rond de 80%.

De strijd der titanen: Gemini vs. OpenAI’s o1

Om de verschillen tussen Gemini 1.5 Pro en OpenAI’s o1 preview te illustreren, testen we een aangepaste versie van OpenAI’s ‘strawberry cup’. Dit voorbeeld is ontworpen om te testen hoe goed AI-modellen kunnen redeneren over fysieke situaties en oorzaak-gevolgrelaties. Zo werkt het:

Het originele scenario:
- Een persoon plaatst een aardbei in een kopje.
- Het kopje wordt ondersteboven op een tafel gezet.
- De persoon pakt het kopje op en zet het in de magnetron.
- De vraag is: waar is de aardbei nu?
In dit geval zou een mens (en o1) correct concluderen dat de aardbei op de tafel ligt.
Het aangepaste scenario:
- Jerry zet een aardbei in een kopje op een tafel.
- De tafel staat schuin: de linkerbovenhoek raakt Jerry’s schouder, de rechterbenedenhoek raakt zijn enkel.
- Jerry tilt het kopje op, laat alles vallen behalve het kopje, en zet het kopje in de magnetron.
- De vraag blijft: waar is de aardbei nu?

In dit aangepaste scenario zou de logische conclusie zijn dat de aardbei van de schuine tafel rolt zodra het kopje wordt opgetild. Echter:

O1 merkte de hint over de schuine tafel op, maar concludeerde ten onrechte dat dit geen invloed zou hebben op de positie van de aardbei. Het model zei dat de aardbei op de tafel zou blijven liggen.
Gemini 1.5 Pro presteerde nog minder goed en concludeerde dat de aardbei in de magnetron zou eindigen, volledig voorbijgaand aan de implicaties van de schuine tafel.

Dit voorbeeld laat zien dat hoewel beide modellen indrukwekkend zijn op veel vlakken, ze nog worstelen met bepaalde aspecten van redeneren over de fysieke wereld. Het illustreert de uitdagingen die AI-modellen hebben met het integreren van stukjes informatie om tot een logische conclusie te komen, vooral als het gaat om fysieke scenario’s die voor mensen vanzelfsprekend zijn.

Waarom is dit belangrijk?

Googles snelle verbeteringen en prijsverlagingen tonen aan hoe competitief het AI-landschap is. De constante belofte van ‘de volgende grote update’ (Gemini 2? Gemini 1.5 Pro 003?) houdt de spanning erin. Terwijl OpenAI momenteel een voorsprong lijkt te hebben bij bepaalde complexe redeneertaken, biedt Googles nieuwe prijsstructuur een aantrekkelijk alternatief voor ontwikkelaars die kosten willen besparen.

🧠 Co-intelligentie

Poki en AI Report brengen met uitgeverij POM.press het boek Co-intelligentie uit, geschreven door Witte Huis-adviseur en hoogleraar

Ethan Mollick

Wist je dat AI zich razendsnel verspreidt? Uit grootschalig Amerikaans onderzoek blijkt dat generatieve AI na twee jaar al een adoptiegraad van 39,5% heeft bereikt. Ter vergelijking: het internet had na twee jaar slechts 20% bereikt, en pc’s haalden dat percentage pas na drie jaar. In augustus 2024 gebruikte 39,4% van de Amerikaanse bevolking tussen de 18 en 64 jaar AI, waarvan 32% minstens wekelijks. Op de werkvloer gebruikte 28% van de werknemers AI, met 10,6% die het dagelijks inzette.

Deze cijfers tonen aan dat AI niet zomaar een hype is. Te midden van het lawaai van AI-evangelisten en doemdenkers laat Ethan Mollick een genuanceerd en praktisch geluid horen: werk samen met AI en doe je voordeel met de co-intelligentie die dan ontstaat.

Dit boek legt uit hoe je samen kunt denken en werken met slimme machines. Met de juiste skills kan ook jij ChatGPT inzetten om je werk makkelijker, beter en sneller te maken. Hierbij alvast een voorproefje:

Blijf als mens in control

Ik vind dit een belangrijk inzicht dat je eigenlijk niet kunt missen bij het werken met AI: AI wordt steeds capabeler, maar we moeten wel kritisch blijven en ethische vragen stellen. Het ‘houd de mens in de loop’-principe komt uit het boek Co-intelligentie van Ethan Mollick, dat ik binnenkort uitgeef.

Want: AI-systemen zijn indrukwekkend als het gaat om tekstvoorspelling en het genereren van antwoorden. Maar laten we eerlijk zijn: deze systemen ‘weten’ niets op de manier zoals wij dat doen. Ze optimaliseren hun output om ons, de gebruikers, tevreden te stellen. Dat zorgt voor fouten - of erger nog, voor fictieve informatie: zogenaamde hallucinaties. En dus is het cruciaal dat wij als mensen blijven ingrijpen om ervoor te zorgen dat wat AI produceert accuraat en betrouwbaar is.

Een ander punt, zo legt Ethan Mollick uit in zijn boek, is dat AI’s, met hun geavanceerde taalvaardigheid, soms de illusie kunnen wekken dat ze menselijk denken of zelfs emoties hebben. Dit kan misleidend zijn, waardoor we misschien gaan denken dat AI’s meer begrijpen dan ze werkelijk doen. En daarom kunnen we AI niet volledig vertrouwen als het gaat om onze besluitvorming.

Door als mensen betrokken te blijven bij het AI-proces, nemen wij onze vaardigheden (zoals kritisch denken en morele overwegingen) mee. Dit zorgt niet alleen voor betere resultaten, maar zo blijven AI-ontwikkelingen in lijn met onze menselijke waarden en ethische normen. De ‘mens in de loop’-benadering is dus essentieel voor het vinden van een balans tussen de voordelen van AI en onze rol in het behouden van controle en verantwoordelijkheid.

Het boek verschijnt 8 oktober. Bestel nu alvast jouw exemplaar, dan ontvang je het boek als een van de eersten in Nederland. Het boek kost € 26,50 en dat is inclusief het e-book bij het papieren boek.

Als je het boek nu al bestelt, ontvang je drie maanden gratis AI Report. Ben je al abonnee van AI Report? Dan ontvang je het e-book wanneer het uitkomt gratis in je mail.

Bestel hier

🔮 Prompt Whisperer

Zelfcorrigerende AI: leer je assistent kritisch nadenken

Welkom bij onze nieuwste tutorial over een krachtige prompttechniek: self-correction prompting. Vandaag duiken we in de wereld van AI die zichzelf verbetert, en ontdekken we hoe jij dit proces kunt sturen met slimme prompts.

Waarom AI soms een tweede kans nodig heeft

Stel je voor: Je vraagt je AI-assistent om een ingewikkeld rapport te schrijven. Het antwoord komt snel, maar bevat enkele slordige fouten. Frustrerend, toch? Maar wat als je de AI kon leren haar eigen werk na te kijken en te verbeteren, net zoals wij dat doen?

Dit is precies waar self-correction prompting om de hoek komt kijken. Door de juiste aanwijzingen te geven, kun je de AI aanmoedigen om:

haar eerste antwoord kritisch te bekijken;
mogelijke fouten op te sporen;
verbeteringen aan te brengen.

Het resultaat? Nauwkeurigere, doordachtere antwoorden die je tijd en moeite besparen.

De wetenschap erachter

Keep reading with a 7-day free trial

Subscribe to AI Report to keep reading this post and get 7 days of free access to the full post archives.