/
13 jan 2026
AI-waarde begrijpen begint met GDPval
GDPval is OpenAI's economische kader voor het meten van AI-waarde: vermindert AI de kosten van het produceren van professioneel werk dat door experts wordt geaccepteerd? Ontdek waarom de meeste AI-initiatieven economisch falen, waarom de voordelen niet lineair zijn en hoe je het kostenvoordeel op taakniveau kunt meten dat echte ROI mogelijk maakt.
Tristen van Vliet

GDPval is een economisch evaluatiekader ontwikkeld door OpenAI om te beoordelen of AI-systemen meetbare zakelijke waarde creëren. In plaats van te vragen hoe intelligent een model lijkt, stelt GDPval een praktischere vraag: vermindert AI de kosten voor het produceren van werk dat professionals zouden accepteren? Door te focussen op echte werkprocessen, deskundig oordeel en economische resultaten, biedt GDPval organisaties een concrete manier om na te denken over AI-waarde.
In 2026 zullen we eindelijk weten of AI werkt.
Volgens het State of AI in Business 2025 rapport van MIT levert 95% van de AI-initiatieven in bedrijven geen meetbare opbrengst op. Ondanks tientallen miljarden aan investeringen lopen de meeste projecten vast in proeffasen, schalen ze niet op of tonen ze nooit impact op de winst-en-verliesrekening (Challapally et al., 2025).
Dit is geen modelkwaliteitsprobleem.
Het is een meetprobleem.
De meeste organisaties evalueren AI nog steeds op de verkeerde manier. Adoptie metrieken, abstracte benchmarks, en geïsoleerde productiviteitsverhalen domineren beslissingen. Wat ontbreekt is een duidelijk antwoord op een simpele economische vraag: vermindert dit systeem de kosten voor het produceren van acceptabel werk?
GDPval is een van de eerste serieuze pogingen om die vraag te beantwoorden.
Waarom de meeste AI-projecten economisch mislukken
Uit MIT’s onderzoek blijkt een consistent patroon. AI-tools worden veel verkend, vaak getest, en zelden op grote schaal ingezet. Meer dan 80% van de organisaties experimenteert met generatief AI, maar slechts zo'n 5% haalt er betekenisvolle waarde uit. De mislukking wordt niet veroorzaakt door regelgeving of gebrek aan interesse, maar door breekbare werkprocessen en het onvermogen om AI-prestaties te koppelen aan zakelijke uitkomsten (Challapally et al., 2025).
Kortom, organisaties weten niet hoe ze moeten meten of AI werkt, en kunnen daarom de schaalvergroting niet rechtvaardigen.
Hier is waar GDPval het probleem herkadert.
Van intelligentie naar economisch waardevolle output
GDPval vraagt niet of AI intelligent is. Het vraagt of AI echte professionele producten kan leveren die experts daadwerkelijk zouden accepteren (Patwardhan et al., 2025).
Taken zijn afgeleid van echt werk dat wordt uitgevoerd door brancheprofessionals met gemiddeld veertien jaar ervaring, verspreid over vierenveertig beroepen en negen sectoren die meer dan drie triljoen dollar aan jaarlijkse lonen vertegenwoordigen. Uitvoeringen worden geëvalueerd door middel van paargewijze deskundige oordelen. Zou een professional de door AI gegenereerde uitvoering verkiezen boven de menselijk gemaakte?
Deze benadering stemt evaluatie af op hoe organisaties daadwerkelijk opereren. Zakelijke waarde wordt gecreëerd door documenten, analyses en beslissingen, niet door testvragen.
Het paradoxale economische resultaat
Het opvallende resultaat is opmerkelijk. Frontier AI-modellen produceren nu in ongeveer 50% van de gevallen uitvoer die door experts acceptabel wordt bevonden, terwijl ze eerste versies 50 tot 300 keer sneller genereren dan menselijke experts.
Op zichzelf kan een acceptatiepercentage van vijftig procent onvoldoende klinken. Economisch gezien is het transformerend.
GDPval modelleert expliciet de workflow die de meeste bedrijven al gebruiken:
AI produceert een eerste uitvoer
Een expert beoordeelt het
Alleen als de uitvoer niet slaagt, doet de expert de taak vanaf nul opnieuw
De verwachte kosten kunnen als volgt worden geschreven:
Verwachte kosten (VK) = Modelkosten (MoK) + Beoordelingskosten (BK) + (1 − w) × Menselijke kosten (MK)
Hier is w niet de nauwkeurigheid. Het is de win-kans dat de AI-uitvoer wordt geaccepteerd.
Dit kader legt uit waarom zoveel AI-proeven mislukken. Ze worden zelden geëvalueerd op hun vermogen om de verwachte kosten van het produceren van acceptabel werk te verminderen.
Waarom verbetering niet lineair is
Cruciaal is dat de economie niet lineair is.
Acceptatie bepaalt hoe vaak een organisatie terug moet vallen op het duurste pad: volledige menselijke uitvoering. Elke vermindering van die waarschijnlijkheid werkt door een verhoudingsmatig effect op economisch rendement, niet door een simpele additieve winst.
AI-snelheid blijft constant. Beoordelingskosten blijven relatief vast. Wat verandert is hoe vaak de organisatie de volledige menselijke kosten betaalt. Naarmate de acceptatie stijgt van vijftig naar zestig of zeventig procent, neemt het economisch voordeel sneller toe dan de verbetering zelf.
Dit is waarom AI-waarde verschijnt vóór perfectie, en waarom veel organisaties de impact verkeerd inschatten.
De kloof overbruggen die MIT identificeert
Het rapport van MIT beschrijft een GenAI-kloof. Een kleine minderheid van organisaties haalt echte waarde, terwijl de meerderheid vast blijft zitten in proeven zonder meetbare impact. De kloof wordt gedreven door aanpak, niet door ambitie.
Wat de twee kanten scheidt is niet het geloof in AI, maar economische helderheid.
Op taakniveau is het belangrijkste signaal simpel: hoeveel goedkoper wordt het produceren van acceptabel werk wanneer AI wordt geïntroduceerd? GDPval maakt dit expliciet door de verwachte AI-ondersteunde kosten van een taak te vergelijken met de kosten van volledige menselijke uitvoering. De resulterende kostenverhouding, MK / VK, toont of AI economisch dominant is voor een bepaalde werkunit.
Deze verhouding vertegenwoordigt geen volledige ROI. Het toont iets fundamentelers: of AI structureel kostenvoordeel creëert op taakniveau. Dus GDPval vervangt geen financiële ROI-analyse; het maakt het mogelijk. Alleen wanneer die efficiëntie per taak bestaat, is het zinvol om gebruik op te schalen, volume te accumuleren en geaggregeerde besparingen te vergelijken met vaste programmakosten.
Dit onderscheid verklaart de bevindingen van MIT. Veel organisaties investeren in AI zonder eerst economisch voordeel op taakniveau vast te stellen. Hierdoor vertalen proeven zich nooit in duurzame winst. GDPval biedt een manier om te identificeren waar dat voordeel al bestaat en waar langdurige ROI realistisch kan ontstaan naarmate het gebruik toeneemt.
Meten wat markten daadwerkelijk belonen
In 2026 verschuift het AI-gesprek. De vraag is niet langer of modellen kunnen redeneren, schrijven of samenvatten. Het is of organisaties systematisch probabilistische AI-uitvoer kunnen omzetten in betrouwbare economische waarde.
MIT toont hoe wijdverbreide mislukking eruitziet.
GDPval toont hoe dat gemeten kan worden, en daarmee hoe je het kunt vermijden.
In sectoren die triljoenen in lonen vertegenwoordigen, zijn de hulpmiddelen om die kloof te overbruggen zichtbaar. De resterende uitdaging is niet intelligentie, maar economie.
Bij Subduxion vertalen we deze dynamiek naar heldere, praktische inzichten voor organisaties die navigeren door AI-adoptie. Als u de economische impact wilt begrijpen die AI in uw specifieke context kan hebben, verkennen we dat graag samen.

Een eenvoudig voorbeeld om dit concreet te maken
Beschouw een enkele, herhaalbare professionele taak.
Een menselijke expert die de taak vanaf nul uitvoert, kost $1.000.
Een AI-systeem kan een eerste ontwerp genereren voor $10, dat een expert kan beoordelen voor $40. Samen heeft het AI-geassisteerde pad een vaste aanvangsprijs van $50 per taak.
Als de AI-uitvoer niet acceptabel is, moet de expert nog steeds de volledige taak voltooien.
De verwachte kosten voor het produceren van een acceptabele uitkomst kunnen daarom als volgt worden geschreven:
Verwachte kosten (VK) = $50 + (1 − w) × $1.000
waar w de kans is dat de AI-uitvoer wordt geaccepteerd.
Als de AI-uitvoer 50% van de tijd wordt geaccepteerd, zijn de verwachte kosten:
$50 + 0,50 × $1.000 = $550
Bij 60% acceptatie worden de verwachte kosten:
$50 + 0,40 × $1.000 = $450
Bij 70% acceptatie dalen ze verder naar:
$50 + 0,30 × $1.000 = $350
Op taakniveau is het relevante signaal de kostenverhouding tussen alleen menselijke uitvoering en AI-geassisteerde uitvoering:
Kostenverhouding op taakniveau = MK / VK
Dit geeft:
50% acceptatie → $1.000 / $550 ≈ 1,8× goedkoper
60% acceptatie → $1.000 / $450 ≈ 2,2× goedkoper
70% acceptatie → $1.000 / $350 ≈ 2,9× goedkoper
Elke toename in acceptatie verbetert de kwaliteit met hetzelfde bedrag, maar het economisch voordeel versnelt. De reden is eenvoudig: het duurste pad, volledige menselijke uitvoering, wordt vaker vermeden, terwijl AI-snelheid en beoordelingskosten constant blijven.
Dit is waarom AI-economieën niet-lineair zijn. Acceptatie bepaalt hoe vaak het duurste pad wordt bewandeld, en elke vermindering in die waarschijnlijkheid verhoogt de kosten-efficiëntieverhouding sneller dan het acceptatieniveau zelf. Echte ROI komt later, wanneer deze efficiëntie per taak op schaal wordt toegepast en wordt vergeleken met vaste programmakosten.
Referenties
Challapally, A., Pease, C., Raskar, R., & Chari, P. (2025). The GenAI divide: State of AI in business 2025. MIT NANDA.
Patwardhan, T., Dias, R., Proehl, E., Kim, G., Wang, M., Watkins, O., Posada Fishman, S., Aljubeh, M., Thacker, P., Fauconnet, L., Kim, N. S., Chao, P., Miserendino, S., Chabot, G., Li, D., Sharman, M., Barr, A., Glaese, A., & Tworek, J. (2025). GDPval: Evaluating AI model performance on real world economically valuable tasks. arXiv. https://arxiv.org/abs/2510.04374


