De Workflow van Devin: Toolgebruik, Planning en Autonomie

26 april 2026

AI coding assistant autonomous developer Cognition AI Devin agent task planning AI developer tools AI memory safety guardrails

Introductie

Devin (van Cognition AI) is een nieuwe autonome AI-software-engineer die softwareontwikkelingstaken kan plannen en deze grotendeels zelfstandig kan uitvoeren. Het werkt end-to-end aan codeprojecten, waarbij het tools zoals een code-editor, een command-line shell en een webbrowser gebruikt om code te onderzoeken, te schrijven, te testen en te implementeren. In demo's en pers is Devin getoond terwijl het een codebase scant, een plan genereert, bestanden bewerkt, tests uitvoert en pull-aanvragen doet met verrassend weinig menselijke input (medium.com) (www.linkedin.com). Cognition beweert dat Devin “complexe engineeringstaken die duizenden beslissingen vereisen” aankan, waarbij het de context bij elke stap terughaalt en zelfs leert van fouten (medium.com) (www.linkedin.com). We onderzoeken daarom de openbare details van Devins ontwerp en workflow. Dit omvat hoe Devin taken opbreekt (het planningsproces), hoe het concreet werkt in een ontwikkelaarsomgeving (editor, terminal, browser), hoe het geheugen of context behoudt gedurende een coderingssessie, hoe het zichzelf corrigeert en itereert, en welke vangrails of veiligheidsmaatregelen het gebruikt. We merken ook op wat niet is onthuld – bijvoorbeeld de exacte interne werking van het model is niet bekendgemaakt, dus sommige gemeenschapsdiscussies zijn gebaseerd op onderbouwd giswerk.

Taakplanning en Decompositie

Wanneer een ontwikkelaar Devin een nieuwe opdracht geeft, is de eerste stap het plannen welke bestanden moeten worden gewijzigd en in welke volgorde. De notities van Cognition leggen uit dat Devin een sub-agent in “planningsmodus” gebruikt wiens taak het is om erachter te komen welke bestanden in de repository relevant zijn voor de taak (medium.com) (docs.devin.ai). In de praktijk “onderzoekt” Devin de repo en stelt een plan voor voordat het code schrijft (docs.devin.ai) (docs.devin.ai). Voor complexe taken zien ontwikkelaars dit plan en kunnen het goedkeuren of aanpassen; als de Agency-modus is ingeschakeld, zal Devin automatisch doorgaan met zijn plan zonder op goedkeuring te wachten (docs.devin.ai) (docs.devin.ai).

Achter de schermen trainde Cognition deze planningsagent met reinforcement learning (bekrachtigend leren). In een analyse beschrijft het team dat de planner alleen alleen-lezen tools (zoals ls, grep of read_file) kreeg en werd beloond wanneer deze de set bestanden die een mens zou bewerken, correct voorspelde (medium.com) (medium.com). Het resultaat: Devins planner leert parallelle bestandssysteemquery's uit te voeren (bijv. ls en grep tegelijkertijd in verschillende mappen uitvoeren) en vervolgens veelbelovende sporen te verfijnen (medium.com). De trainingsboete stimuleert efficiëntie, dus de agent vermijdt brute-force (bijv. eindeloos de hele repo doorzoeken met grep) en "commit" in plaats daarvan snel zodra het een doelwit heeft gevonden (medium.com). Dit betekent dat Devins planning datagedreven is: het heeft generieke codebase-navigatiestrategieën geleerd (zoals Cognition opmerkt, het model werd getraind op vele repo's en gebruikersquery's) (medium.com) (medium.com).

Op gebruikersniveau zie je het resultaat als een overzicht van stappen. Bij een nieuw featureverzoek zal Devin bijvoorbeeld iets voorstellen als “pas bestand A aan om X te implementeren, voeg tests toe in bestand B en werk vervolgens configuratie C bij.” In demo's, als een gebruiker vergat enkele details te specificeren, vangt Devins planstap dit vaak op en vraagt om verduidelijking. In één demo voegde de assistent automatisch de configuratie van een GitHub-account toe aan het plan, hoewel de gebruiker dit niet expliciet vermeldde (www.developersdigest.tech) (www.linkedin.com). Deze planningsstappen (vragen stellen, taken opsommen, bestanden in kaart brengen) worden allemaal binnen Devins dialooginterface uitgevoerd voordat er code wordt geschreven. Als de gebruiker akkoord gaat of automatische goedkeuring is ingeschakeld, gaat Devin over tot uitvoering.

Werken in een Ontwikkelaarsomgeving: Editor, Terminal en Browser

Devin opereert binnen een gesandboxte ontwikkelaarsomgeving. De materialen van Cognition beschrijven het als een bekend ontwikkelaars-toolkit: een shell-terminal, een code-editor en een webbrowser staan allemaal tot zijn beschikking (medium.com) (docs.devin.ai). In de praktijk, wanneer Devin draait, wordt alles wat het doet gelogd en is het zichtbaar in de web-UI. Een “Volg Devin”-weergave markeert elke actie (zoals een bestandsbewerking of shell-commando) en stelt een mens zelfs in staat om op een pictogram te klikken om direct naar de code-editor of de terminal te springen waar die actie plaatsvond (docs.devin.ai). Als Devin bijvoorbeeld een JavaScript-bestand bewerkt, kan een gebruiker klikken om de VSCode-editorweergave met de wijzigingen te zien, of als Devin een shell-commando uitvoert, klikken om de terminaluitvoer te zien.

Je kunt ook handmatig in Devins werkruimte duiken als je wilt. Een recente update voegde een “Gebruik Devins Machine”-knop toe die Devins omgeving opent in VSCode via het web (docs.devin.ai). Dit betekent dat een ontwikkelaar een kijkje kan nemen in Devins bestanden, commando's kan uitvoeren of zelfs handmatig code kan bewerken in zijn werkruimte. (Voor langlopende taken is dit handig als je iets 'tijdens de vlucht' wilt inspecteren.) In één voorbeeld activeerde een gebruiker dit om Devin UI-elementen te zien maken: de gebruiker opende letterlijk Devins VSCode, zag de nieuwe bestanden die Devin schreef, en kon de UI live verkennen.

De browser-tool stelt Devin in staat om dingen op internet te onderzoeken of te testen. In demo's is te zien dat Devin webzoekopdrachten gebruikt om documentatie of bibliotheken op te zoeken, en zelfs de lokale webserver draait om te controleren of de code niet kapot is (bijv. het zal een browser naar localhost laten wijzen om te verifiëren dat de UI werkt). Al met al is Devins interface multimodaal: het kan inputs zoals tekstprompts, bijgevoegde ontwerpscènes of documenten, en zelfs codefragmenten accepteren, en het communiceert via zowel chat als deze ontwikkelaarstools (www.developersdigest.tech) (medium.com). Het resultaat is een ervaring die veel dichter bij “een collega die code schrijft” ligt dan bij een statische chat met een AI.

Geheugen, Kennis en Sessiecontext

Devin houdt informatie bij gedurende een sessie met behulp van een ingebouwd “Kennis”-systeem. Zie Kennis als een werkruimte-notitieboek: Devin kan hier tips, projectspecifieke instructies of belangrijke context opslaan en later terughalen. De documentatie beschrijft bijvoorbeeld workflows om bepaalde kennis te pinnen zodat Devin deze nooit vergeet, zoals belangrijke architecturale beperkingen of codeerstijlgidsen (docs.devin.ai). Gebruikers kunnen deze kennisbank bewerken of eraan toevoegen. Devin zal ook automatisch nuttige notities genereren: het scant je repository om meer te weten te komen over de codestructuur, componenten en je documentatie, en bouwt automatisch een “Repo Kennis”-samenvatting op (docs.devin.ai) (docs.devin.ai). In de praktijk, nadat je een paar taken hebt uitgevoerd, kan Devin zeggen: "Ik merkte dat je vaak React en Redux gebruikt; ik stel voor om dat toe te voegen aan Kennis," en als je dit goedkeurt, wordt die informatie opgeslagen.

Tijdens een sessie bewaart Devin relevante kennis in het werkgeheugen. Cognition beweert dat het “relevante context bij elke stap terughaalt” (www.linkedin.com). Als het bijvoorbeeld eerder heeft geleerd dat je Python 3.11 verkiest of dat je web-app OAuth gebruikt, zal het die informatie indien nodig in prompts opnemen. De sessie is inherent lang en stateful: je kunt tientallen beurten (minuten of langer) met Devin praten terwijl het veel bestanden bewerkt, en het behoudt de chatgeschiedenis. Als Devin ooit crasht, kun je door de log scrollen of de “voortgangsmodus” inschakelen om elke actie te zien die het heeft ondernomen.

Als je sessie eindigt (bijvoorbeeld als je de taak stopt of afrondt), vergeet Devin de draaiende staat van die machine, en zijn virtuele machine wordt de volgende keer gereset naar een basissnapshot (docs.devin.ai). Standaard omvat deze basisstaat de repositories die je in je werkruimte hebt voorgeladen, zodat Devin niet elke keer vanaf nul hoeft te klonen (docs.devin.ai). (Zonder werkruimte-setup zou elke sessie beginnen met een lege machine, dus Cognition benadrukt het vooraf configureren van je repo voor snelheid (docs.devin.ai).) Maar naast code draagt Devin wel kennis over via zijn Kennisbank. Het zal je vragen om lessen of definities toe te voegen die nuttig lijken voor toekomstige taken (docs.devin.ai). Over meerdere sessies betekent dit dat Devin geleidelijk een geheugen opbouwt van de conventies en architectuur van je project.

Naast Kennis heeft Cognition DeepWiki uitgebracht, een gerelateerde tool die hele codebases indexeert en er een chat-interface bovenop biedt (medium.com). Hoewel DeepWiki een afzonderlijk product is, suggereert het de bredere architectuur: Devin kan zijn eigen wiki of een externe wiki van de code raadplegen om vragen te beantwoorden. In de praktijk, als je Devin iets vraagt over de code, kan het intern dezelfde retrieval-systemen gebruiken als DeepWiki om zijn antwoorden te onderbouwen.

Autonomie, Iteratie en Zelfcorrectie

Devin is ontworpen om autonoom te zijn, maar met feedbacklussen wanneer nodig. Na de planning voert het stappen één voor één uit, waarbij het constant controleert op fouten. In demo's volgt de agent vaak dit patroon: het gebruikt de browser of documentatie om een probleem te begrijpen, schrijft wat code, voert deze uit, ziet een fout en zoekt vervolgens op hoe deze te verhelpen – een menselijke debug-cyclus nabootsend (www.developersdigest.tech) (www.linkedin.com). Een presentator toont bijvoorbeeld hoe Devin een inlogformulier toevoegt, vervolgens de front-end test uitvoert, een bug vindt en teruggaat om te onderzoeken hoe die fout te verhelpen. Elke “beurt” van Devin is een lus van denk → handel → observeer → corrigeer.

Meerdere bronnen vermelden dat Devin “zelfcorrectie” ingebouwd heeft (medium.com) (www.linkedin.com). Sterker nog, de Cognition-blog met GPT-5 vermeldt dat GPT-5 “goed is in het begrijpen van fouten en zichzelf kan corrigeren”, wat ze benadrukken als geweldig voor lange taken (www.linkedin.com). Met andere woorden, als Devins code niet compileert of een test faalt, zal het model (vaak GPT-5 of vergelijkbaar) de foutmelding zien en ter plekke een oplossing bedenken. Het is zelfs in staat tot retry-loops: als een actie gedeeltelijk slaagt, kan Devin een tweede poging doen. Deze loops zijn zichtbaar in de UI als herhaalde bewerk-en-uitvoer-sequenties.

Om systematisch met storingen om te gaan, gebruikt Devin een combinatie van automatisering en menselijk toezicht. Als Devin bijvoorbeeld een pull-aanvraag opent en een CI-fout of een code-review-opmerking ontvangt, zal het systeem van Cognition Devin automatisch wakker maken en het probleem laten aanpakken (docs.devin.ai) (docs.devinenterprise.com). Standaard reageert Devin op lint-fouten of opmerkingen, hoewel gebruikers dit kunnen uitschakelen. De UI toont ook zijn status en acties in realtime, zodat een ontwikkelaar op elk moment kan ingrijpen. Ontwikkelaars worden aangemoedigd om de eerste paar runs in “live-modus” (waarin elke stap wordt getoond) te bekijken om vertrouwen op te bouwen, en vervolgens Devin volledig headless te laten draaien zodra ze zeker zijn (www.developersdigest.tech).

Veiligheid, Vangrails en Maatwerk

Operators kunnen Devin expliciete instructies geven over wat het niet moet doen. Een krachtige functie is “Verboden Acties”. Je kunt dingen opnoemen die Devin niet mag aanraken – bijvoorbeeld, “NIET direct naar main pushen” of “Bewerk bestand X niet.” Het systeem zorgt ervoor dat Devin deze commando's respecteert wanneer ze verschijnen in de prompt of in een Playbook (docs.devin.ai). Volgens de releasenotities verwerkt Devin nu lijsten met verboden acties betrouwbaar, wat betekent dat het zijn acties controleert aan de hand van die regels. Dit helpt veelvoorkomende fouten te voorkomen, zoals het wijzigen van de verkeerde branch of het verkeerde bestand.

Devin biedt ook verschillende controles. In Slack of de web-UI kun je Devin vertellen om te “slapen” (werk te pauzeren) of een sessie te “archiveren” (docs.devin.ai). Je kunt kiezen of Devin jouw goedkeuring vereist voordat het een plan uitvoert (via de Agency-instelling) of volledig autonoom draait (docs.devin.ai) (docs.devin.ai). Het rekengebruik wordt gemeten in Agent Compute Units (ACU's), en de UI toont waarschuwingen als Devin bijna zijn limieten bereikt, zodat je kunt ingrijpen of meer resources kunt toekennen (docs.devin.ai).

Als er achter de schermen iets misgaat, heeft Cognition monitoring geïmplementeerd. In eerdere releases meldden sommige gebruikers dat Devin-sessies “vastliepen” of crashten. Het team merkt op dat die problemen zijn opgelost en biedt ACU-teruggaven aan als Devin blijft hangen (docs.devin.ai). Met andere woorden, het bedrijf instrumenteert het systeem actief voor betrouwbaarheid. Externe analisten waarschuwen dat Devin, net als elke chat-gebaseerde AI, af en toe fouten kan maken of code kan “hallucineren”. De aanbevolen praktijk is om de output te controleren zoals je het werk van een junior ontwikkelaar zou controleren. Voor de veiligheid gebruiken veel teams code-reviews op Devins commits en beperken ze Devins rechten (bijv. standaard geen directe toegang tot geheimen). Tot nu toe zijn de publiekelijk beschreven vangrails voornamelijk door de gebruiker gedefinieerd (verboden acties, vereiste plan goedkeuring, enz.) en systeemgezondheidscontroles, in plaats van ingebouwde ethische filters.

Wat we (nog) niet weten

Cognition heeft opzettelijk enkele details intern gehouden, dus delen van Devin zijn ondoorzichtig. Het exacte grote taalmodel dat het gebruikt was bijvoorbeeld aanvankelijk niet openbaar. Geruchten en latere berichten suggereren dat Cognition nu GPT-5 integreert in Devin voor zijn plannings- en redeneerkern (www.linkedin.com), en ze hebben een preview-agent gebaseerd op Claude Sonnet 4.5 (docs.devinenterprise.com). Maar de volledige architectuur is onduidelijk: Devin orkestreert waarschijnlijk meerdere modellen en heeft aangepaste finetuning (zoals gesuggereerd door de RFT plannings sub-agent), maar die lagen zijn niet open-source.

We kennen ook de limieten van zijn geheugen niet volledig. Devin beweert "na verloop van tijd te leren", maar hoe het nieuwe kennis in zijn bestaande netwerk samenvoegt (in plaats van het alleen in de Kennisbank op te slaan) is niet gespecificeerd. De maximale lengte van de conversatiegeschiedenis die het effectief gebruikt, is niet gedocumenteerd. Wanneer een sessie erg lang is, is het mogelijk dat eerdere delen van de chat- of codecontext achter de schermen worden gesnoeid. Praktisch gezien houden de meeste gebruikers prompts en code beknopt om context-overload te voorkomen.

Wat betreft de veiligheid blijven er enkele onbekenden. Hoewel "verboden acties" door de gebruiker gespecificeerde regels dekken, is het bijvoorbeeld niet duidelijk of Devin impliciete veiligheidslagen heeft (zoals het detecteren van misbruik van gegevens, biascontroles of sandbox-escapes). Aangezien het in een VM draait, hoopt men dat het geen hostsysteemen kan beschadigen, maar details over die sandboxing zijn niet openbaar. De community leidt af dat Devins machine waarschijnlijk container-snapshots gebruikt (zoals vermeld voor de RL-training) om runs te isoleren (medium.com).

Ten slotte kijken velen in de community hoe Devin omgaat met ambigue of open-eind taken. De verkooppraatjes noemen het “volledig autonoom,” maar analisten merken op dat het nog steeds vaak precieze instructies nodig heeft. Als de prompt van de gebruiker bijvoorbeeld vaag is, kan Devin een plan genereren dat redelijk lijkt, maar belangrijke randgevallen mist. Het kan in vervolgvragen om opheldering vragen, maar ontwikkelaars vragen zich soms af hoe goed het de intentie begrijpt versus alleen patroonherkenning op code. Deze aspecten van Devins cognitie zijn afhankelijk van de mogelijkheden van het onderliggende LLM, die we alleen indirect waarnemen. Kortom, gebruikers moeten Devin meer beoordelen als een zeer bekwame junior ingenieur dan als een productmanager – het plant goed, maar begrijpt je intentie misschien niet altijd perfect.

Aan de Slag met Devin

Devin is voornamelijk gericht op engineeringteams die veel codeerwerk verrichten. Het excelleert in duidelijk gedefinieerde taken: het bouwen van features vanuit specificaties, refactoring, het schrijven van tests en het oplossen van bugs. Het is minder bewezen in hoogwaardig ontwerp of zeer slecht gedefinieerde problemen. Voor een softwareteam kan Devin helpen routineklussen te klaren, zodat mensen zich kunnen richten op de creatieve architectuur en het toezicht.

Voor niet-programmeurs of nieuwkomers kan Devin nog steeds nuttig zijn, maar vereist het enige setup. De eerste stap is om Devin toegang te geven tot je code-repository (via GitHub, GitLab, enz.) en het eventueel te verbinden in Slack of Teams. Probeer vervolgens een eenvoudige taak. Vraag bijvoorbeeld: “Devin, voeg een nieuwe pagina toe om alle producten uit onze database weer te geven in de web-UI, inclusief testdekking.” Observeer de dialoog in de planningsfase: Devin zal schetsen welke bestanden moeten worden gewijzigd (bijv. HTML-template, backend API-code, enz.) en eventuele benodigde vragen stellen. Keur het plan goed (of laat het automatisch uitvoeren) en observeer de uitvoering. Gebruik het “Volg”-paneel om elke stap te zien: je ziet bestandsbewerkingen, shell-commando's (zoals het uitvoeren van testsuites) en browser-snapshots van de UI. Als Devin een fout maakt of je een wijziging wilt, interacteer dan eenvoudigweg zoals je in een chat zou doen (“Gebruik eigenlijk dit CSS-thema” of “de producttitel moet hoofdletters zijn”), en Devin zal een nieuwe bewerkingsloop starten.

De belangrijkste uitvoerbare stap is itereren en controleren. Controleer altijd de code die Devin produceert en test deze lokaal. Na verloop van tijd kun je de Kennisbank verrijken: voeg notities toe zoals “Onze database gebruikt PostgreSQL 13” of “We volgen de PSR-12 stijl in PHP”. Devin zal deze in toekomstige sessies beginnen op te nemen. Verken ook de instellingen: schakel Agency uit als je voorstellen altijd wilt beoordelen, of in als je het meer vertrouwt. Koppel Devin aan je CI voor automatische pull-aanvraagbeoordeling, maar begin met meldingen zodat je kunt zien hoe het omgaat met feedback.

Uiteindelijk is Devins workflow complex en krachtig, maar het is nog steeds afhankelijk van jou voor begeleiding. Door te begrijpen hoe het plant, tools gebruikt en leert van feedback (zoals hierboven beschreven), haal je het meeste uit deze nieuwe klasse van agentische codeerassistenten. De beste volgende stap voor een team dat geïnteresseerd is in Devin, is zich aan te melden op devin.ai en een kleine pilot uit te voeren: voeg één web-repo toe, vraag Devin om een functie te implementeren, en laat het draaien in voortgangsmodus. Observeer de volledige “denktrace” – die hands-on ervaring zal precies verduidelijken hoe Devin planning, bewerking en zelfcorrectie samenbrengt. Van daaruit kun je opschalen naar meer taken en het gebruik ervan verfijnen (bijvoorbeeld, aangepaste playbooks voor jouw domein). Hoewel het nog in ontwikkeling is, vertegenwoordigt Devin een grote sprong voorwaarts in AI-tools. Door vandaag zijn workflow te leren, kunnen teams zich voorbereiden op een tijdperk waarin codeertaken echt kunnen worden gedeeld met een AI-teamgenoot.

Ontvang nieuwe AI-codering Onderzoek & Podcast Afleveringen

Meld u aan om nieuwe onderzoeksupdates en podcastafleveringen te ontvangen over AI-coderingstools, AI-appbouwers, no-code tools, vibe coding en het bouwen van online producten met AI.

← Terug naar AI Builds It: Easy Coding Tools