Anthropic introduceert "dreaming": AI-agenten leren van hun eigen fouten

In een wereld die steeds meer gedreven wordt door kunstmatige intelligentie, is het vermogen van AI-systemen om zelfstandig te leren en te verbeteren van cruciaal belang. Deze week, op de tweede jaarlijkse Code with Claude ontwikkelaarsconferentie in San Francisco, onthulde Anthropic een reeks baanbrekende updates voor haar Claude Managed Agents platform. De meest opvallende innovatie is de introductie van een nieuwe functionaliteit genaamd 'dreaming'. Met Anthropic introduceert "dreaming," een systeem dat AI-agenten leert van hun eigen fouten, zet het bedrijf een belangrijke stap richting zelfcorrigerende, zelfverbeterende AI-systemen. Dit is precies wat bedrijven nodig hebben voordat ze AI-agenten toevertrouwen met bedrijfskritische taken en productie-workloads. Deze ontwikkeling markeert een significante vooruitgang in de manier waarop AI-agenten in de praktijk functioneren.

Naast 'dreaming' heeft Anthropic ook twee voorheen experimentele functies – 'outcomes' en 'multi-agent orchestration' – vanuit een onderzoeksstatus naar een openbare bèta gebracht. Dit betekent dat ze nu breed beschikbaar zijn voor ontwikkelaars die bouwen op het Claude-platform. Gezamenlijk pakken deze drie functies de grootste uitdagingen aan bij het opschalen van AI-agenten: het waarborgen van nauwkeurigheid, het bevorderen van continu leren en het voorkomen dat ze knelpunten worden bij complexe, meerstaps werkzaamheden. Vroege gebruikers zien al indrukwekkende resultaten. Zo wist het juridische AI-bedrijf Harvey zijn voltooiingspercentages van taken met ongeveer 6x te verhogen na de implementatie van ‘dreaming’. Wisedocs, gespecialiseerd in medische documentbeoordeling, halveerde zijn beoordelingstijd met behulp van 'outcomes'. En Netflix verwerkt nu logs van honderden builds tegelijkertijd dankzij 'multi-agent orchestration'. Dit alles onderstreept de enorme momentum voor Anthropic, waarbij CEO Dario Amodei een 80x geannualiseerde groei in omzet en gebruik rapporteerde in het eerste kwartaal van 2026, ver boven de eigen projecties.

Anthropic introduceert "dreaming": AI-agenten leren van hun eigen fouten

De 'dreaming'-functie is de meest vernieuwende van de drie introducties en degene die Anthropic het meest wil onderscheiden van conventionele geheugensystemen. Terwijl het bedrijf eerder dit jaar al agentgeheugen lanceerde – waardoor Claude voorkeuren en context binnen en tussen individuele sessies kon vasthouden – werkt Anthropic introduceert "dreaming," een systeem dat AI-agenten leert van hun eigen fouten op een hoger abstractieniveau. Het betreft een gepland proces dat de eerdere sessies en geheugenarchieven van een agent doorneemt, patronen daaruit extraheert en die herinneringen beheert, zodat agenten in de loop van de tijd verbeteren. Dit proces brengt inzichten naar boven die geen enkele agentsessie op zichzelf zou kunnen zien, zoals terugkerende fouten, workflows waarop meerdere agenten onafhankelijk van elkaar convergeren, en voorkeuren die worden gedeeld binnen een team van agenten. Dit vermogen tot zelfreflectie en continue verbetering is wat 'dreaming' zo krachtig maakt.

Alex Albert, hoofd van research productmanagement bij Anthropic, legde het concept uit als analoog aan hoe mensen binnen organisaties vaardigheden ontwikkelen na het doorlopen van een taak. Hij beschreef het als volgt: "Ze doen misschien een workflow met Claude, en aan het einde van die workflow, nadat ze een beetje hebben gezigzagd en geïtereerd, willen ze dat pad van A naar B vastleggen." Albert vervolgt: "Een zeer vergelijkbaar iets gebeurt met 'dreaming' – in plaats van dat je handmatig de vaardigheid creëert uit je ervaring met Claude, doet het model het zelf, zodat het dezelfde context heeft voor een toekomstige sessie." Cruciaal is dat 'dreaming' de onderliggende modelgewichten niet wijzigt. Zoals Albert benadrukte: "We veranderen het model zelf niet via 'dreaming' – het doet geen updates aan de gewichten of iets dergelijks." In plaats daarvan schrijft de agent de geleerde lessen op als platte tekstnotities en gestructureerde "playbooks" waarnaar toekomstige sessies kunnen verwijzen, waardoor het hele proces observeerbaar en controleerbaar is voor mensen. Deze transparantie is essentieel voor het opbouwen van vertrouwen in autonoom opererende AI-systemen, vooral nu Anthropic introduceert "dreaming," een systeem dat AI-agenten leert van hun eigen fouten.

Praktische Demonstratie van Zelfverbeterende AI-Agenten

Tijdens de keynote demonstreerde het Anthropic-team alle drie de functies live op het podium met behulp van een fictieve ruimtevaartstartup genaamd "Lumara", die drones autonoom op de maan moest laten landen voor grondstofwinning. Het team configureerde een multi-agent systeem met drie specialisten: een commandant-agent verantwoordelijk voor het algehele missiesucces, een detector-agent die hoogwaardige landingsplaatsen identificeerde en een navigator-agent die zorgde voor een veilige dronevlucht en landing. Er werd een succesrubriek gedefinieerd die zachte landingen, een duidelijke ondergrond en voldoende brandstofreserves voor een terugreis naar de aarde vereiste. Een eerste simulatie over zes hypothetische landingsplaatsen leverde sterke, maar niet perfecte, resultaten op. Om te verbeteren, activeerden de presentatoren een 'dreaming'-sessie rechtstreeks vanuit de Claude Developer Console. Gedurende de nacht beoordeelde de 'dreaming'-agent alle eerdere simulatiesessies en schreef een gedetailleerd afdalingsplaybook – een uitgebreide set heuristieken afgeleid van patronen over meerdere missieruns. Toen het team de volgende ochtend een nieuwe simulatie uitvoerde met het door 'dreaming' afgeleide playbook in het geheugen, verbeterden de resultaten aanzienlijk op de sites die eerder ondermaats hadden gepresteerd. Dit toonde direct aan hoe Anthropic introduceert "dreaming," een systeem dat AI-agenten leert van hun eigen fouten in de praktijk werkt.

Angela Jiang, Head of Product voor het Claude Platform, merkte op: "Het enige wat we hoefden te doen, was Caitlin op een knop laten drukken. Allemaal ‘dreaming’." De demo illustreerde hoe de drie functies in de praktijk samenwerken. Multi-agent orchestration verdeelde de complexe taak over specialisten met onafhankelijke contextvensters. Outcomes leverde de rubriek waartegen een afzonderlijke grader-agent elke run evalueerde. En Anthropic introduceert "dreaming," een systeem dat AI-agenten leert van hun eigen fouten door lessen uit die runs te trekken om toekomstige prestaties te verbeteren – waarmee een continue verbeteringscyclus wordt gevormd die geen menselijke tussenkomst vereist tussen iteraties. Dit is een gamechanger voor organisaties die streven naar autonome en geoptimaliseerde workflows, omdat het de weg vrijmaakt voor AI-systemen die zichzelf proactief verbeteren.

Outcomes en Multi-Agent Orchestration: Cruciale Aanvullingen

De 'outcomes'-functie, nu in openbare bèta, biedt ontwikkelaars een manier om succes te definiëren met behulp van een rubriek – dit kan een structureel kader zijn, een presentatiestandaard, een merkspecifieke tone-of-voice, of elke andere set criteria. Vervolgens laat het de agent autonoom naar die standaard toe werken. Wat 'outcomes' architectonisch onderscheidend maakt, is de scheiding van verantwoordelijkheden. Wanneer een agent zijn werk voltooit, evalueert een afzonderlijke 'grader-agent' de output aan de hand van de door de ontwikkelaar gedefinieerde rubriek in zijn eigen, onafhankelijke contextvenster. Omdat de grader in een frisse context opereert, wordt deze niet beïnvloed door de redeneringen of opgebouwde vooroordelen van de werkende agent uit de sessie. Dit garandeert een objectieve evaluatie.

Wanneer de grader lacunes identificeert tussen de output en de rubriek, wijst hij specifiek aan wat er moet veranderen, en de werkende agent maakt een nieuwe poging. Deze lus gaat door totdat aan de rubriekcriteria is voldaan, zonder dat een mens elke poging hoeft te beoordelen. Albert beschreef Anthropic's bredere verificatiestrategie als het inzetten van "meer testtijd-compute, meer modellen die langer nadenken over een probleem, om het werk van een ander te controleren." Hij erkende dat een model dat zijn eigen werk controleert redelijke vragen oproept, maar stelde dat een frisse contextvenster dat voltooid werk beoordeelt consequent beter presteert dan dezelfde langlopende thread vragen om zijn eigen bugs te identificeren. Dit benadrukt de kracht van gescheiden agenten voor kwaliteitscontrole, een benadering die ook bij GitHub wordt toegepast. De capaciteit om dergelijke complexe taken te delegeren wordt verder versterkt nu Anthropic introduceert "dreaming," een systeem dat AI-agenten leert van hun eigen fouten, waardoor de algehele intelligentie van het systeem toeneemt.

Multi-agent orchestration, de derde functie die naar openbare bèta gaat, stelt een leidende agent in staat om een grote taak te decomponeren in sub taken en elk daarvan te delegeren aan een gespecialiseerde agent – elk met zijn eigen model, systeemprompt, tools en onafhankelijke contextvenster. Elke stap in het proces is traceerbaar in de Claude Console, waar wordt getoond welke agent wat deed, in welke volgorde en waarom. Dit ontwerp geeft elke sub-agent een geïsoleerde context, wat volgens Anthropic betere resultaten oplevert dan wanneer een enkele agent alle complexiteit in één thread probeert te bevatten. De keynote-presentatoren legden uit: "Elke sub-agent heeft zijn eigen onafhankelijke thread en contextvenster. Dit is zeer opzettelijk – we hebben ontdekt dat door het werk te splitsen en vervolgens de resultaten samen te voegen, we betere resultaten krijgen." Albert bood zijn eigen heuristiek voor wanneer multi-agent architecturen zinvol zijn versus vasthouden aan een enkele thread: "Parallelle agenten zijn beter voor onderzoek," zei hij – situaties waarin veel context aanwezig is die uiteindelijk zal worden weggegooid. Deze functionaliteit is een perfecte aanvulling op de leercurve die mogelijk wordt gemaakt nu Anthropic introduceert "dreaming," een systeem dat AI-agenten leert van hun eigen fouten.

Anthropic's Grote Inzet: De Kloof Dichten tussen AI-Capaciteiten en Adoptie

De drie functies komen als onderdeel van een bredere platform-push die Anthropic gedurende de conferentie heeft gekaderd als het dichten van "de kloof tussen wat AI kan doen en wat het daadwerkelijk doet voor mensen." Ami Vora, Chief Product Officer van Anthropic, zette het thema uiteen in haar openingstoespraak, waarbij ze opmerkte dat hoewel modelcapaciteiten exponentieel toenemen, de meeste organisaties AI nog steeds lineair adopteren. Dianne Penn, die product leidt voor Anthropic's onderzoeksteam, beschreef de maatstaf van de vooruitgang van het bedrijf als "taakhorizon" – hoe lang een AI-agent autonoom kan werken terwijl de kwaliteit van zijn deliverables verbetert. "Deze tijd vorig jaar konden modellen minutenlang werken," zei ze. "Nu hebben de meesten van ons agenten die urenlang draaien. Morgen zullen we agenten hebben die proactief, altijd aan zijn en weten waaraan ze moeten werken zonder het kader te verliezen." Dit ambitieuze doel wordt concreter nu Anthropic introduceert "dreaming," een systeem dat AI-agenten leert van hun eigen fouten.

Het evenement omvatte ook verschillende infrastructuur aankondigingen die zijn ontworpen om ontwikkelaars te helpen gelijke tred te houden. Anthropic verdubbelt zijn vijf-uurs snelheidslimieten voor Pro, Max, Team en Enterprise-abonnementen en verhoogt de API-snelheidslimieten aanzienlijk. Het bedrijf kondigde ook een partnerschap met SpaceX aan om de volledige capaciteit van hun Colossus-datacenter te gebruiken om de beschikbaarheid van computing uit te breiden – een directe reactie op de vraagcrisis die Amodei beschreef. Alle drie de functies zijn ingebouwd in Claude Managed Agents, dat op 8 april in openbare bèta werd gelanceerd als een gestructureerd raamwerk dat best practices bundelt, waaronder geheugen, toolintegratie en actiebehandeling. Anthropic zegt dat teams die Managed Agents gebruiken 10x sneller zijn dan teams die hun eigen agentinfrastructuur vanaf nul opbouwen. Albert beschreef het platform met een analogie van een besturingssysteem: "Met beheerde agenten hoef je niet na te denken over alle technische details van hoe je het omringende systeem opzet," zei hij. "Je bouwt een applicatie voor Macs – je wilt niet elk detail van macOS opnieuw hoeven te implementeren." Dit alles wijst op een toekomst waarin AI-agenten steeds autonomer en effectiever worden, mede dankzij het feit dat Anthropic introduceert "dreaming," een systeem dat AI-agenten leert van hun eigen fouten.

De Toekomst van Enterprise AI: Concurrerende Implicaties

De concurrentie-implicaties zijn aanzienlijk. Terwijl AI-agentplatformen van OpenAI, Google en anderen strijden om adoptie door ontwikkelaars, zet Anthropic in op productierealisme – niet alleen ruwe modelintelligentie – als bepalende factor voor welk platform de bedrijfsbudgetten wint. De 'dreaming'-functie in het bijzonder slaat nieuw terrein in: terwijl andere platformen geheugen en toolgebruik bieden, gaat het idee van agenten die systematisch hun eigen geschiedenis beoordelen om herbruikbare kennis te extraheren verder naar het soort continu verbeterende systemen dat bedrijven nodig hebben voordat ze risicovolle taken delegeren. De conferentie toonde bedrijven die al op die schaal opereren. Mercado Libre, het grootste e-commerceplatform van Latijns-Amerika, heeft 23.000 ingenieurs die Claude Code gebruiken, heeft meer dan 500.000 pull-requests met menselijk toezicht beoordeeld en streeft naar 90% autonoom coderen tegen het derde kwartaal van dit jaar. Shopify heeft Claude Code ingezet, niet alleen binnen engineering, maar ook binnen ontwerp-, product- en data science-teams. Dit is een bewijs van de robuustheid en schaalbaarheid van de nieuwe agentcapaciteiten. De introductie van Anthropic introduceert "dreaming," een systeem dat AI-agenten leert van hun eigen fouten is een belangrijke onderscheidende factor in deze competitieve markt.

Maar het was Dario Amodei die de meest expansieve visie voor de toekomst verwoordde. Hij beschreef een progressie van single agents naar meerdere agents naar complete organisatorische intelligentie – van "een team van slimme mensen in een kamer" naar wat hij "een land van genieën in het datacenter" noemde. En hij herhaalde een voorspelling die hij ongeveer een jaar geleden deed: dat 2026 het jaar zou zijn waarin het eerste miljardenbedrijf door één persoon zou worden gerund. "Het is nog niet helemaal gebeurd," zei hij. "Maar we hebben nog zeven maanden." Of zeven maanden genoeg tijd is voor een solo-oprichter om een miljardenbedrijf op te bouwen, blijft een open vraag – maar na deze week hebben ze wel een paar extra tools om te proberen, vooral nu Anthropic introduceert "dreaming," een systeem dat AI-agenten leert van hun eigen fouten. De technologie beweegt snel en de mogelijkheden voor AI-gedreven innovatie zijn onbegrensd.

Veelgestelde Vragen over Anthropic's 'Dreaming' Functie

Met de introductie van Anthropic introduceert "dreaming," een systeem dat AI-agenten leert van hun eigen fouten, duiken er vanzelfsprekend vragen op over de werking en implicaties van deze revolutionaire technologie. Hieronder beantwoorden we enkele veelgestelde vragen.

1. Wat is precies het verschil tussen Anthropic's 'dreaming' en traditionele AI-geheugensystemen?

Waar traditionele AI-geheugensystemen voornamelijk context en voorkeuren binnen en tussen individuele sessies vasthouden, gaat 'dreaming' een stap verder. Het is een gepland proces dat de volledige geschiedenis van een agent, inclusief eerdere sessies en geheugenarchieven, analyseert. Hierbij worden patronen, terugkerende fouten en gemeenschappelijke workflows geëxtraheerd om herbruikbare kennis te creëren, zoals "playbooks". Dit stelt agenten in staat om **collectief en systematisch te leren van ervaringen** die geen enkele individuele sessie kan bevatten, wat resulteert in een continue, zelfverbeterende cyclus. Het gaat dus niet alleen om onthouden, maar om actief leren en synthetiseren van kennis. Dit is de kern van hoe **Anthropic introduceert "dreaming," een systeem dat AI-agenten leert van hun eigen fouten**.

2. Kan ik de geleerde lessen van een 'dreaming'-agent controleren en aanpassen?

Absoluut. Een cruciaal aspect van 'dreaming' is transparantie en controleerbaarheid. De geleerde lessen worden niet diep in de modelgewichten veranderd, maar opgeslagen als platte tekstnotities en gestructureerde "playbooks". Dit betekent dat menselijke operators de inzichten en conclusies die de agenten trekken kunnen inzien, controleren en, indien nodig, aanpassen. Deze **auditbaarheid** is essentieel voor bedrijven die AI-agenten inzetten voor kritieke taken, aangezien het een niveau van vertrouwen en governance biedt. **Anthropic introduceert "dreaming," een systeem dat AI-agenten leert van hun eigen fouten** met het oog op maximale transparantie.

3. Hoe draagt 'dreaming' bij aan de betrouwbaarheid van AI-agenten in bedrijfskritische omgevingen?

De 'dreaming'-functie verhoogt de betrouwbaarheid van AI-agenten aanzienlijk door ze in staat te stellen **systematisch van hun fouten te leren en hun prestaties voortdurend te optimaliseren**. Door patronen van succes en falen te herkennen over meerdere sessies heen, kunnen agenten hun strategieën aanpassen en verbeterde "playbooks" ontwikkelen. Dit vermindert de kans op herhalende fouten en verhoogt de consistentie en nauwkeurigheid van hun output. In combinatie met 'outcomes' voor het definiëren van succescriteria en 'multi-agent orchestration' voor complexe taken, creëert 'dreaming' een robuust en veerkrachtig AI-systeem dat betrouwbaar kan opereren in veeleisende bedrijfsscenario's. Het feit dat **Anthropic introduceert "dreaming," een systeem dat AI-agenten leert van hun eigen fouten** is een gamechanger voor de acceptatie van AI in de enterprise.

Ervaar de Toekomst van Entertainment Vandaag Nog!

Terwijl Anthropic de grenzen van AI verlegt, nodigen wij u uit om de grenzen van uw entertainment te verleggen. Bent u klaar om een ongeëvenaarde wereld van films, series, sport en live televisie te ontdekken? Met onze hoogwaardige IPTV-abonnementen krijgt u toegang tot duizenden kanalen van over de hele wereld, kristalheldere beeldkwaliteit en een gebruiksvriendelijke interface, allemaal vanuit het comfort van uw eigen huis. Wacht niet langer en transformeer uw kijkervaring. Net zoals AI leert en verbetert, evolueert ook uw entertainment. Kies voor het beste en neem de controle over wat u kijkt, wanneer u kijkt.

Koop nu uw IPTV-abonnement en duik in een wereld van eindeloos entertainment.

Nieuws Zone Néerlandais

Anthropic introduceert 'dromen': AI leert van fouten

Anthropic introduceert "dreaming": AI-agenten leren van hun eigen fouten

Anthropic introduceert "dreaming": AI-agenten leren van hun eigen fouten

Praktische Demonstratie van Zelfverbeterende AI-Agenten

Outcomes en Multi-Agent Orchestration: Cruciale Aanvullingen

Anthropic's Grote Inzet: De Kloof Dichten tussen AI-Capaciteiten en Adoptie

De Toekomst van Enterprise AI: Concurrerende Implicaties

Veelgestelde Vragen over Anthropic's 'Dreaming' Functie

1. Wat is precies het verschil tussen Anthropic's 'dreaming' en traditionele AI-geheugensystemen?

2. Kan ik de geleerde lessen van een 'dreaming'-agent controleren en aanpassen?

3. Hoe draagt 'dreaming' bij aan de betrouwbaarheid van AI-agenten in bedrijfskritische omgevingen?

Ervaar de Toekomst van Entertainment Vandaag Nog!

Popular Items

Contact form