Verbeter je prompts met opmaak

Plus: De uitdaging van AI en humor; OpenAI's nieuwste en goedkoopste

, and

Jul 23, 2024

∙ Paid

Welkom bij AI Report. De AI-wereld ontwikkelt zich razendsnel, en wij, de makers van de podcast Poki, houden je op de hoogte. Twee keer per week sturen we je een overzicht van de nieuwste AI-ontwikkelingen, tools, use cases en onderzoek. Alles wat je moet weten in slechts 5 minuten leestijd.

🗞️ Het belangrijkste nieuws

GPT-4o mini: OpenAI’s nieuwste en goedkoopste model

Vaak gaat het nieuws over de grote, slimme modellen die steeds intelligenter worden, maar dat is niet het enige wat er in de wereld van taalmodellen gebeurt. Ondertussen worden er ook stappen gezet om AI-modellen kleiner en efficiënter te maken. Nadat Anthropic aankwam met Claude 3 Haiku en Google het kleine model Gemini 1.5 Flash uitbracht, volgt nu ook OpenAI met een kleiner, efficiënter en goedkoper model: GPT-4o mini.

Dit model vervangt GPT-3.5 Turbo, het standaardmodel in de gratis versie van ChatGPT. Daarnaast is het direct beschikbaar voor ontwikkelaars en bedrijven. Allemaal interessant, maar wat voor impact gaat dit hebben en wat voor prestaties kunnen we verwachten van dit model?

Hoe goed is GPT-4o mini?

GPT-4o mini is een model dat zich richt op een betere prijs-kwaliteitverhouding. Verwacht geen prestaties zoals we van Claude 3.5 Sonnet of GPT-4o gewend zijn, maar wel een aanzienlijke verbeterstap ten opzichte van GPT-3.5 Turbo.

Een aantal belangrijke punten op een rij:

Dit model is aanzienlijk slimmer dan GPT-3.5 Turbo, maar nog niet zo slim als GPT-4o.
Voor ontwikkelaars is het 60% goedkoper dan GPT-3.5 Turbo.
Het werkt ook met afbeeldingen (video en audio volgen nog).
Het kan net zoveel input aan als GPT-4o (een boek van een paar honderd pagina’s).

Ter illustratie: het eerste Harry Potter-boek bestaat uit ongeveer 77.000 worden, wat overeenkomt met ongeveer 100.000 tokens. Wanneer je het gehele boek in een chatvenster plakt en een vraag stelt, dan kost dat (buiten de vaste kosten voor ChatGPT om):

met GPT-4o 50 cent per vraag;
met GPT-4o mini slechts 1,5 cent per vraag.

Wat voor impact gaat dit model hebben?

De gemiddelde betalende gebruiker van ChatGPT gaat niet direct veel verschil merken. Er zijn in ChatGPT geen directe redenen om over te schakelen op GPT-4o mini als GPT-4o beschikbaar is. De niet-betalende gebruiker, die snel de gebruikslimieten van het grote model zal bereiken, zal echter een flinke verbetering gaan merken ten opzichte van het vorige gratis model, GPT-3.5 Turbo.

Buiten ChatGPT om gaat dit model aanzienlijk meer impact hebben. Het gigantische prijsverschil maakt het voor veel toepassingen interessant om dit model in te zetten. Denk hierbij aan een AI-assistent die vragen kan beantwoorden over een 50+ pagina tellend document, een e-mailhulp die op de hoogte is van alle e-mailuitwisselingen, inclusief bijlages: toepassingen waarbij bij iedere vraag snel de kosten oplopen en het nu mogelijk wel loont om een AI-model in te zetten.

Situaties waarin AI-modellen wat minder impact hebben, maar die nog wel nuttig zijn, zijn nu ook interessanter. AI die een complete zin voorstelt in plaats van een enkel woord om je zin af te ronden, gegevens voor jou categoriseert of proactiever handelt, met suggesties om zaken in je agenda of op je to-dolijst te zetten.

Veel toepassingen die AI-slimmigheden inzetten, gebruiken op de achtergrond al de modellen van OpenAI. Mocht je de komende tijd opeens meer slimmigheden met AI zien opduiken, dan is de kans groot dat dit door deze ontwikkeling mogelijk (of rendabel) is geworden.

Een nieuw AI-programma genaamd ‘C the Signs’ zorgt voor een aanzienlijke verbetering in kankerdetectie bij Engelse huisartsenpraktijken. In de gezondheidszorg zorgt AI voor mooie resultaten. C the Signs, dat patiëntendossiers analyseert op verborgen patronen en risicofactoren, heeft het percentage gedetecteerde kankergevallen verhoogd van 58,7% naar 66,0%.

Een recente studie, gepubliceerd in het Journal of Clinical Oncology, toont de effectiviteit van het systeem aan. Deze AI-tool ondersteunt huisartsen vooral bij vroege kankerdetectie van moeilijk te herkennen symptomen of niet-screenbare kankersoorten.

Google worstelt door AI met het behalen van zijn klimaatdoelstellingen. Googles Environmental Report 2024 onthult een zorgwekkende trend: de broeikasgasemissies van het bedrijf zijn in vijf jaar tijd met 48% gestegen, voornamelijk door het toenemende energieverbruik van door AI aangedreven datacenters.

Deze stijging bedreigt Googles ambitieuze doel om tegen 2030 volledig op koolstofvrije energie te draaien. Het bedrijf erkent de uitdaging om de AI-vooruitgang te verenigen met klimaatdoelstellingen en zoekt naar oplossingen via:

de ontwikkeling van energie-efficiëntere AI-modellen;
verhoogde investeringen in hernieuwbare energie.

Deze trend is niet uniek voor Google; de hele techsector worstelt met het vinden van een balans tussen AI-innovatie en duurzaamheid.

Het Europese Mistral AI presenteert drie nieuwe, kleinere en gespecialiseerde modellen. Binnen een week deelde dit bedrijf de volgende modellen, waarbij de focus ligt op kleiner en gespecialiseerder, en het bouwen van modellen gebaseerd op het allernieuwste onderzoek.

Mistral NeMo (12B): verbeterde en iets grotere versie van het populaire model Mistral 7B, ontwikkeld in samenwerking met NVIDIA.
Mistral Codestral (7B): gericht op programmeren, gebruikt nieuwe Mamba-architectuur voor efficiëntere verwerking van lange tekstinvoer.
Mathstral (7B): gespecialiseerd in wiskunde en wetenschappelijk redeneren.

AI en humor: een complexe uitdaging

In de snelle ontwikkeling van AI blijft humor een fascinerend complex gebied. Hoewel AI steeds beter wordt in vele taken, worstelt het nog met de subtiele kunst van het grappen maken. Interessant genoeg kan AI wel uitleggen waaróm iets grappig is, maar het creëren van originele, hilarische grappen blijft een uitdaging.

Huidige AI-modellen zoals Claude 3.5 Sonnet zijn in staat bestaande grappenstructuren of comedians na te bootsen, maar missen vaak de finesse en timing die nodig zijn voor echt originele humor.

Kernuitdagingen

Contextbegrip: AI mist vaak het diepe culturele en sociale begrip dat nodig is voor humor.
Timing en onvoorspelbaarheid: AI-modellen zijn geoptimaliseerd voor waarschijnlijke uitkomsten, terwijl humor vaak draait om het onverwachte.
Vooruitziende planning: AI mist het vermogen om de punchline vooraf te plannen. Omdat het woord voor woord gegenereerd wordt, rolt er een verhaal uit waarbij tijdens het ‘schrijven’ geen rekening wordt gehouden met de punchline.
Emotionele intelligentie: humor is nauw verbonden met emoties en empathie, gebieden waarop AI nog in ontwikkeling is.
Originaliteit: het creëren van echt originele grappen blijft een grote uitdaging voor AI.

Toekomstperspectieven

Bedrijven als Disney en Nintendo onderzoeken AI voor humoristische karakters in games en animaties.
Er wordt geëxperimenteerd met AI-systemen die getraind zijn op de stijl van bekende comedians.
Onderzoekers verkennen manieren om AI beter te laten begrijpen waarom mensen dingen grappig vinden.

Onze visie

Humor blijft voorlopig een uniek menselijk domein. Het laat zien hoe ingewikkeld en bijzonder menselijke communicatie eigenlijk is, en dat de huidige AI dit nog niet goed kan bevatten. De (voorlopige) toekomst van AI in humor ligt waarschijnlijk meer in het ondersteunen van menselijke creativiteit dan in het vervangen van comedians.

Uiteindelijk herinnert dit ‘gebrek’ van AI ons eraan dat sommige aspecten van de menselijke ervaring voorlopig uniek menselijk blijven - en dat is misschien juist iets om te vieren.

Wil je meer weten over hoe je AI kunt inzetten in je werk en je leven?

Abonneer je op ons betaalde abonnement en krijg 2x per week exclusieve tips en tricks.

Duik deze week in de elementen die je niet kunt missen in je prompt en in opmaak die je prompts effectiever kan maken.

Keep reading with a 7-day free trial

Subscribe to AI Report to keep reading this post and get 7 days of free access to the full post archives.