
Inblick i Devins arbetsflöde: VerktygsanvÀndning, planering och autonomi
Introduktion
Devin (frĂ„n Cognition AI) Ă€r en ny autonom AI-mjukvaruingenjör som kan planera mjukvaruutvecklingsuppgifter och utföra dem till stor del pĂ„ egen hand. Den arbetar frĂ„n början till slut med kodprojekt och anvĂ€nder verktyg som en kodredigerare, en kommandoradsterminal och en webblĂ€sare för att forska, skriva, testa och driftsĂ€tta kod. I demonstrationer och press har Devin visats skanna en kodbas, generera en plan, redigera filer, köra tester och skicka pull-förfrĂ„gningar med förvĂ„nansvĂ€rt lite mĂ€nsklig input (medium.com) (www.linkedin.com). Cognition hĂ€vdar att Devin kan hantera âkomplexa ingenjörsuppgifter som krĂ€ver tusentals beslut,â komma ihĂ„g sammanhang i varje steg och till och med lĂ€ra sig av misstag (medium.com) (www.linkedin.com). Vi utforskar dĂ€rför de offentliga detaljerna om Devins design och arbetsflöde. Detta inkluderar hur Devin bryter ner uppgifter (dess planeringsprocess), hur den bokstavligen arbetar i en utvecklingsmiljö (redigerare, terminal, webblĂ€sare), hur den behĂ„ller minne eller kontext över en kodningssession, hur den sjĂ€lvrĂ€ttar och itererar, samt vilka skyddsrĂ€cken eller sĂ€kerhetsĂ„tgĂ€rder den anvĂ€nder. Vi noterar ocksĂ„ vad som inte avslöjas â till exempel Ă€r de exakta modellinterna detaljerna hemliga, sĂ„ viss diskussion i gemenskapen bygger pĂ„ kvalificerade gissningar.
Uppgiftsplanering och uppdelning
NĂ€r en utvecklare ger Devin en ny uppgift, Ă€r första steget att planera vilka filer som ska Ă€ndras och i vilken ordning. Cognitions anteckningar förklarar att Devin anvĂ€nder en âplaneringslĂ€geâ-underagent vars jobb Ă€r att ta reda pĂ„ vilka filer i förrĂ„det som Ă€r relevanta för uppgiften (medium.com) (docs.devin.ai). I praktiken âundersökerâ Devin repot och föreslĂ„r en plan innan nĂ„gon kod skrivs (docs.devin.ai) (docs.devin.ai). För komplexa uppgifter ser utvecklare denna plan och kan godkĂ€nna eller justera den; om Agency-lĂ€get Ă€r aktiverat, kommer Devin automatiskt att fortsĂ€tta med sin plan utan att vĂ€nta pĂ„ godkĂ€nnande (docs.devin.ai) (docs.devin.ai).
Bakom kulisserna trĂ€nade Cognition denna planeringsagent med förstĂ€rkningsinlĂ€rning. I en analys beskriver teamet att de gav planeraren endast endast-lĂ€s-verktyg (som ls, grep eller read_file) och belönade den nĂ€r den korrekt förutsade uppsĂ€ttningen filer som en mĂ€nniska skulle redigera (medium.com) (medium.com). Resultatet: Devins planerare lĂ€r sig att utfĂ€rda parallella filsystemfrĂ„gor (t.ex. köra ls och grep i olika kataloger samtidigt) och sedan begrĂ€nsa lovande ledtrĂ„dar (medium.com). TrĂ€ningsstraffet uppmuntrar effektivitet, sĂ„ agenten undviker brute-force (t.ex. att greppa hela repot oĂ€ndligt) och âĂ„tar sigâ istĂ€llet snabbt nĂ€r den hittar ett mĂ„l (medium.com). Detta innebĂ€r att Devins planering Ă€r datadriven: den har lĂ€rt sig generiska strategier för kodbasnavigering (som Cognition noterar, modellen trĂ€nades pĂ„ mĂ„nga repos och anvĂ€ndarfrĂ„gor) (medium.com) (medium.com).
PĂ„ anvĂ€ndarnivĂ„ ser du resultatet som en översikt över stegen. Till exempel, med en ny funktionsförfrĂ„gan kommer Devin att föreslĂ„ nĂ„got i stil med âmodifiera fil A för att implementera X, lĂ€gg till tester i fil B, uppdatera sedan konfiguration C.â I demonstrationer, om en anvĂ€ndare glömde att specificera vissa detaljer, fĂ„ngar Devins plansteg ofta upp det och ber om förtydligande. I en demo lade assistenten automatiskt till konfiguration av ett GitHub-konto i planen trots att anvĂ€ndaren inte uttryckligen nĂ€mnde det (www.developersdigest.tech) (www.linkedin.com). Dessa planeringssteg (stĂ€lla frĂ„gor, lista uppgifter, mappa filer) görs alla inom Devins dialoggrĂ€nssnitt innan nĂ„gon kod skrivs. Om anvĂ€ndaren godkĂ€nner eller om automatisk godkĂ€nnande Ă€r pĂ„, gĂ„r Devin vidare till exekvering.
Arbeta i en utvecklingsmiljö: Redigerare, Terminal och WebblÀsare
Devin opererar inom en sandlĂ„dead utvecklingsmiljö. Cognitions material beskriver den som att den har ett vĂ€lbekant utvecklarverktygskit: en skalterminal, en kodredigerare och en webblĂ€sare till sitt förfogande (medium.com) (docs.devin.ai). I praktiken, nĂ€r Devin körs, loggas och syns allt den gör i webbgrĂ€nssnittet. En âFölj Devinâ-vy markerar varje Ă„tgĂ€rd (som en filredigering eller ett skal-kommando) och lĂ„ter till och med en mĂ€nniska klicka pĂ„ en ikon för att hoppa direkt in i antingen kodredigeraren eller terminalen dĂ€r den Ă„tgĂ€rden intrĂ€ffade (docs.devin.ai). Till exempel, om Devin redigerar en JavaScript-fil, kan en anvĂ€ndare klicka för att se VSCode-redigeringsvyn med Ă€ndringarna, eller om Devin kör ett skal-kommando, klicka för att se terminalutskriften.
Du kan ocksĂ„ manuellt hoppa in i Devins arbetsyta om du vill. En nylig uppdatering lade till en knapp âAnvĂ€nd Devins maskinâ som öppnar Devins miljö i VSCode via webben (docs.devin.ai). Detta innebĂ€r att en utvecklare kan titta pĂ„ Devins filer, köra kommandon eller till och med handredigera kod i dess arbetsyta. (För lĂ„ngvariga uppgifter Ă€r detta bekvĂ€mt om du vill inspektera nĂ„got mitt under körningen.) I ett exempel aktiverade en anvĂ€ndare detta för att se Devin skapa UI-element: anvĂ€ndaren öppnade bokstavligen Devins VSCode, sĂ„g de nya filerna Devin skrev och kunde utforska UI:et live.
WebblĂ€saren tillĂ„ter Devin att forska eller testa saker pĂ„ internet. I demonstrationer ses Devin anvĂ€nda webbsökning för att leta upp dokumentation eller bibliotek, och till och med köra den lokala webbservern för att kontrollera att dess kod inte Ă€r trasig (t.ex. kommer den att peka en webblĂ€sare mot localhost för att verifiera att anvĂ€ndargrĂ€nssnittet fungerar). Allt som allt Ă€r Devins grĂ€nssnitt multimodalt: det kan ta in input som textmeddelanden, bifogade designbilder eller dokument, och Ă€ven kodsnuttar, och det interagerar genom bĂ„de chatt och dessa utvecklarverktyg (www.developersdigest.tech) (medium.com). Resultatet Ă€r en upplevelse mycket nĂ€rmare âen kollega som skriver kodâ Ă€n en statisk chatt med en AI.
Minne, kunskap och sessionskontext
Devin hĂ„ller reda pĂ„ information under en session med hjĂ€lp av ett inbyggt system för âKunskapâ. TĂ€nk pĂ„ Kunskap som en arbetsytanteckningsbok: Devin kan lagra tips, projektspecifika instruktioner eller viktig kontext dĂ€r, och hĂ€mta den senare. Till exempel beskriver dokumentationen arbetsflöden för att fĂ€sta viss kunskap sĂ„ att Devin aldrig glömmer den, sĂ„som viktiga arkitektoniska begrĂ€nsningar eller kodstilguider (docs.devin.ai). AnvĂ€ndare kan redigera eller lĂ€gga till i denna kunskapsbank. Devin kommer ocksĂ„ att automatiskt generera anvĂ€ndbara anteckningar: den skannar ditt förrĂ„d för att lĂ€ra sig om kodstrukturen, komponenterna och din dokumentation, och bygger en sammanfattning av âRepo-kunskapâ automatiskt (docs.devin.ai) (docs.devin.ai). I praktiken, efter att du har kört nĂ„gra uppgifter, kanske Devin sĂ€ger âJag mĂ€rkte att du ofta anvĂ€nder React och Redux; jag föreslĂ„r att du lĂ€gger till det i Kunskap,â och om du godkĂ€nner, sparas den informationen.
Under en session kommer Devin att behĂ„lla relevant kunskap i arbetsminnet. Cognition hĂ€vdar att den âĂ„terkallar relevant kontext i varje stegâ (www.linkedin.com). Till exempel, om den tidigare har lĂ€rt sig att du föredrar Python 3.11 eller att din webbapp anvĂ€nder OAuth, kommer den att ta med den informationen i frĂ„gor vid behov. Sessionen Ă€r i sig lĂ„ng och tillstĂ„ndskĂ€nslig: du kan prata med Devin under dussintals vĂ€ndor (minuter eller mer) medan den redigerar mĂ„nga filer, och den behĂ„ller chatthistoriken. Om Devin nĂ„gonsin gĂ„r sönder kan du scrolla loggen eller slĂ„ pĂ„ âframstegslĂ€geâ för att se varje Ă„tgĂ€rd den utförde.
Om din session avslutas (till exempel om du stoppar uppgiften eller avslutar), glömmer Devin det körande tillstĂ„ndet för den maskinen, och dess virtuella maskin Ă„terstĂ€lls till en bas-snapshot nĂ€sta gĂ„ng (docs.devin.ai). Som standard inkluderar detta baslĂ€ge de förrĂ„d du har förladdat i din arbetsyta, sĂ„ Devin behöver inte klona frĂ„n grunden varje gĂ„ng (docs.devin.ai). (Utan arbetsyteinstĂ€llning skulle varje session börja med en tom maskin, sĂ„ Cognition betonar att förkonfigurera ditt förrĂ„d för snabbhet (docs.devin.ai).) Men utöver kod för Devin kunskap framĂ„t via sin kunskapsbank. Den kommer att uppmana dig att lĂ€gga till lĂ€rdomar eller definitioner som verkar anvĂ€ndbara för framtida uppgifter (docs.devin.ai). Ăver flera sessioner innebĂ€r detta att Devin gradvis bygger upp ett minne av ditt projekts konventioner och arkitektur.
Utöver Kunskap har Cognition slÀppt DeepWiki, ett relaterat verktyg som indexerar hela kodbaser och tillhandahÄller ett chattgrÀnssnitt ovanpÄ dem (medium.com). Medan DeepWiki Àr en separat produkt, antyder det den bredare arkitekturen: Devin kan frÄga sin egen eller en extern wiki om koden för att svara pÄ frÄgor. I praktiken, om du frÄgar Devin nÄgot om koden, kan den internt anvÀnda samma hÀmtningssystem som DeepWiki för att grunda sina svar.
Autonomi, iteration och sjÀlvrÀttelse
Devin Ă€r designad för att vara autonom, men med Ă„terkopplingsslingor vid behov. Efter planering utför den stegen ett efter ett, och kontrollerar stĂ€ndigt efter fel. I demonstrationer följer agenten ofta detta mönster: den anvĂ€nder webblĂ€saren eller dokumentationen för att förstĂ„ ett problem, skriver lite kod, kör den, ser ett fel och söker sedan efter hur man Ă„tgĂ€rdar det â imiterar en mĂ€nsklig felsökningscykel (www.developersdigest.tech) (www.linkedin.com). Till exempel visar en presentatör hur Devin lĂ€gger till ett inloggningsformulĂ€r, kör sedan front-end-testet, hittar en bugg och gĂ„r tillbaka för att forska om hur man Ă„tgĂ€rdar felet. Varje av Devins âvarvâ Ă€r en slinga av tĂ€nk â agera â observera â korrigera.
Flera kĂ€llor noterar att Devin har inbyggd âsjĂ€lvrĂ€ttelseâ (medium.com) (www.linkedin.com). Cognition-bloggen med GPT-5 nĂ€mner att GPT-5 âĂ€r bra pĂ„ att förstĂ„ fel och korrigera sig sjĂ€lvâ, vilket de belyser som utmĂ€rkt för lĂ„nga uppgifter (www.linkedin.com). Med andra ord, om Devins kod inte kompilerar eller misslyckas med ett test, kommer modellen (ofta GPT-5 eller liknande) att se felmeddelandet och ta reda pĂ„ en lösning i farten. Den Ă€r till och med kapabel till omförsökslingor: om en Ă„tgĂ€rd delvis lyckas, kan Devin göra ett andra försök. Dessa slingor Ă€r synliga i anvĂ€ndargrĂ€nssnittet som upprepade redigera-och-kör-sekvenser.
För att systematiskt hantera misslyckanden anvĂ€nder Devin en blandning av automatisering och mĂ€nsklig tillsyn. Till exempel, om Devin öppnar en pull-förfrĂ„gan och fĂ„r ett CI-fel eller en kodgranskningskommentar, kommer Cognitions system automatiskt att vĂ€cka Devin frĂ„n sömnen och lĂ„ta den Ă„tgĂ€rda problemet (docs.devin.ai) (docs.devinenterprise.com). Som standard svarar Devin pĂ„ lint-fel eller kommentarer, Ă€ven om anvĂ€ndare kan inaktivera detta. AnvĂ€ndargrĂ€nssnittet markerar ocksĂ„ dess status och Ă„tgĂ€rder i realtid, sĂ„ en utvecklare kan ingripa nĂ€r som helst. Utvecklare uppmuntras att titta pĂ„ de första körningarna i âlive-lĂ€geâ (dĂ€r varje steg visas) för att bygga förtroende, och sedan lĂ„ta Devin köra helt headless nĂ€r de Ă€r sĂ€kra (www.developersdigest.tech).
SÀkerhet, skyddsrÀcken och anpassning
Operatörer kan ge Devin explicita instruktioner om vad den inte fĂ„r göra. En kraftfull funktion Ă€r âFörbjudna Ă„tgĂ€rderâ. Du kan lista saker Devin inte fĂ„r röra â till exempel, âTRYCK INTE direkt till mainâ eller âRedigera inte fil X.â Systemet sĂ€kerstĂ€ller att Devin respekterar dessa kommandon nĂ€r de förekommer i prompten eller i en Playbook (docs.devin.ai). Enligt release notes hanterar Devin nu listor över förbjudna Ă„tgĂ€rder tillförlitligt, vilket innebĂ€r att den kontrollerar sina Ă„tgĂ€rder mot dessa regler. Detta hjĂ€lper till att förhindra vanliga misstag som att modifiera fel branch eller fil.
Devin tillhandahĂ„ller ocksĂ„ olika kontroller. I Slack eller webbgrĂ€nssnittet kan du be Devin att âsovaâ (pausa arbetet) eller âarkiveraâ en session (docs.devin.ai). Du kan vĂ€lja om Devin krĂ€ver ditt godkĂ€nnande innan den utför en plan (via Agency-instĂ€llningen) eller kör helt autonomt (docs.devin.ai) (docs.devin.ai). Dess berĂ€kningsanvĂ€ndning mĂ€ts i Agent Compute Units (ACU), och anvĂ€ndargrĂ€nssnittet visar varningar om Devin Ă€r pĂ„ vĂ€g att nĂ„ grĂ€nser, sĂ„ att du kan ingripa eller bevilja fler resurser (docs.devin.ai).
Om nĂ„got gĂ„r fel bakom kulisserna, har Cognition övervakning pĂ„ plats. I tidigare releaser rapporterade vissa anvĂ€ndare att Devin-sessioner âfastnadeâ eller kraschade. Teamet noterar att dessa problem har Ă„tgĂ€rdats och erbjuder ACU-Ă„terbetalningar om Devin hĂ€nger sig (docs.devin.ai). Med andra ord instrumenterar företaget aktivt systemet för tillförlitlighet. Externa analytiker varnar för att Devin, liksom alla chattbaserade AI:er, ibland kan producera misstag eller âhallucineraâ kod. Den rekommenderade metoden Ă€r att granska dess resultat som du skulle granska en junior utvecklares arbete. För sĂ€kerhets skull anvĂ€nder mĂ„nga team kodgranskningar pĂ„ Devins commits och begrĂ€nsar Devins behörigheter (t.ex. ingen direkt Ă„tkomst till hemligheter som standard). Hittills Ă€r de offentligt beskrivna skyddsrĂ€ckena mestadels anvĂ€ndardefinierade (förbjudna Ă„tgĂ€rder, krĂ€ver plan godkĂ€nnande, etc.) och systemhĂ€lsoanalyser, snarare Ă€n inbyggda etiska filter.
Vad vi inte (Ă€nnu) vet
Cognition har avsiktligt hÄllit vissa detaljer interna, sÄ delar av Devin Àr oklara. Till exempel var den exakta stora sprÄkmodellen den anvÀnder inte initialt offentlig. Rykten och senare inlÀgg tyder pÄ att Cognition nu integrerar GPT-5 i Devin för dess planerings- och resonemangskÀrna (www.linkedin.com), och de har en förhandsagent baserad pÄ Claude Sonnet 4.5 (docs.devinenterprise.com). Men den fullstÀndiga arkitekturen Àr oklar: Devin orkestrerar sannolikt flera modeller och har anpassad finjustering (som antyds av RFT-planeringens underagent), men dessa lager Àr inte öppen kÀllkod.
Vi kĂ€nner inte heller helt till grĂ€nserna för dess minne. Devin hĂ€vdar att den âlĂ€r sig över tidâ, men hur den sammanfogar ny kunskap i sitt befintliga nĂ€tverk (jĂ€mfört med att bara lagra det i kunskapsbanken) Ă€r ospecificerat. Den maximala lĂ€ngden pĂ„ konversationshistoriken den effektivt anvĂ€nder Ă€r inte dokumenterad. NĂ€r en session Ă€r mycket lĂ„ng Ă€r det möjligt att tidigare delar av chatt- eller kodkontexten beskĂ€rs bakom kulisserna. Praktiskt sett hĂ„ller de flesta anvĂ€ndare prompts och kod kortfattade för att undvika kontextöverbelastning.
PĂ„ sĂ€kerhetssidan Ă„terstĂ„r vissa oklarheter. Till exempel, medan âförbjudna Ă„tgĂ€rderâ tĂ€cker anvĂ€ndarspecifika regler, Ă€r det inte klart om Devin har nĂ„gra implicita sĂ€kerhetslager (som att upptĂ€cka missbruk av data, partiskhetskontroller eller sandbox-utbrytningar). Eftersom den körs i en VM, hoppas man att den inte kan skada vĂ€rdsystem, men detaljer om den sandlĂ„dan Ă€r inte offentliga. Gemenskapen drar slutsatsen att Devins maskin sannolikt anvĂ€nder container-snapshots (som nĂ€mnts för RL-trĂ€ningen) för att isolera körningar (medium.com).
Slutligen tittar mĂ„nga i gemenskapen pĂ„ hur Devin hanterar tvetydiga eller öppna uppgifter. FörsĂ€ljningsargumentet kallar den âhelt autonomâ, men analytiker noterar att den fortfarande ofta behöver precisa instruktioner. Till exempel, om anvĂ€ndarens prompt Ă€r vag, kan Devin generera en plan som verkar rimlig men missar viktiga hörnfall. Den kan stĂ€lla förtydligande frĂ„gor i uppföljningen, men utvecklare undrar ibland hur vĂ€l den förstĂ„r intention jĂ€mfört med att bara mönstermatcha pĂ„ kod. Dessa aspekter av Devins kognition förlitar sig pĂ„ den underliggande LLM:s förmĂ„gor, vilka vi bara observerar indirekt. Kort sagt, anvĂ€ndare bör bedöma Devin mer som en mycket skicklig junior ingenjör Ă€n en produktchef â den planerar vĂ€l, men kanske inte alltid förstĂ„r din intention perfekt.
Kom igÄng med Devin
Devin riktar sig frÀmst till ingenjörsteam som utför mycket kodningsarbete. Den briljerar med tydligt definierade uppgifter: bygga funktioner frÄn specifikationer, refaktorisera, skriva tester och fixa buggar. Den Àr mindre beprövad nÀr det gÀller högnivÄdesign eller mycket illa definierade problem. För ett mjukvaruteam kan Devin hjÀlpa till att avverka rutinarbete sÄ att mÀnniskor kan fokusera pÄ den kreativa arkitekturen och övervakningen.
För icke-kodare eller nykomlingar kan Devin fortfarande vara anvĂ€ndbar men krĂ€ver viss installation. Det första steget Ă€r att ge Devin Ă„tkomst till ditt kodförrĂ„d (via GitHub, GitLab, etc.) och kanske koppla den till Slack eller Teams. Försök sedan med en enkel uppgift. FrĂ„ga till exempel: âDevin, lĂ€gg till en ny sida för att lista alla produkter frĂ„n vĂ„r databas i webbgrĂ€nssnittet, inklusive testtĂ€ckning.â Titta pĂ„ planeringsfasens dialog: Devin kommer att beskriva vilka filer som ska Ă€ndras (t.ex. HTML-mall, backend API-kod, etc.) och stĂ€lla eventuella nödvĂ€ndiga frĂ„gor. GodkĂ€nn planen (eller lĂ„t den köra automatiskt), och se den utföras. AnvĂ€nd âFöljâ-panelen för att se varje steg: du kommer att se filredigeringar, skal-kommandon (som att köra testsviter) och webblĂ€sar-snapshots av grĂ€nssnittet. Om Devin gör ett misstag eller om du vill ha en Ă€ndring, interagera helt enkelt som du skulle i chatten (âFaktiskt, anvĂ€nd detta CSS-temaâ eller âprodukttiteln ska vara i versalerâ), och Devin kommer att starta en ny redigeringsloop.
Det viktiga Ă„tgĂ€rdssteget Ă€r att iterera och granska. Kontrollera alltid koden Devin producerar och testa den lokalt. Med tiden kan du berika kunskapsbanken: lĂ€gg till anteckningar som âVĂ„r databas anvĂ€nder PostgreSQL 13â eller âVi följer PSR-12-stil i PHPâ. Devin kommer att börja införliva dessa i framtida sessioner. Utforska ocksĂ„ instĂ€llningarna: stĂ€ng av Agency om du alltid vill granska förslag, eller slĂ„ pĂ„ den om du litar mer pĂ„ den. LĂ€nka Devin till din CI för automatisk granskning av pull-förfrĂ„gningar, men börja med aviseringar sĂ„ att du kan se hur den hanterar feedback.
I slutĂ€ndan Ă€r Devins arbetsflöde tĂ€tt och kraftfullt, men det förlitar sig fortfarande pĂ„ dig för vĂ€gledning. Genom att förstĂ„ hur den planerar, anvĂ€nder verktyg och lĂ€r sig av feedback (som beskrivits ovan) kan du fĂ„ ut det mesta av denna nya klass av agentisk kodningsassistent. NĂ€sta bĂ€sta steg för ett team som Ă€r intresserat av Devin Ă€r att registrera sig pĂ„ devin.ai och köra en liten pilot: lĂ€gg till ett webb-repo, be Devin att implementera en funktion och lĂ„t den köra i progress-lĂ€ge. Observera hela âtĂ€nkandeâ-spĂ„ret â den praktiska erfarenheten kommer att klargöra exakt hur Devin vĂ€ver samman planering, redigering och sjĂ€lvrĂ€ttelse. DĂ€rifrĂ„n kan du skala upp till fler uppgifter och finjustera dess anvĂ€ndning (till exempel anpassade playbooks för din domĂ€n). Ăven om den fortfarande utvecklas, representerar Devin ett stort sprĂ„ng inom AI-verktyg. Genom att lĂ€ra sig dess arbetsflöde idag kan team förbereda sig för en era dĂ€r kodningsuppgifter verkligen kan delas med en AI-lagkamrat.
FĂ„ nya AI-kodningsforskning och podcast-avsnitt
Prenumerera för att fÄ nya forskningsuppdateringar och podcast-avsnitt om AI-kodningsverktyg, AI-appbyggare, no-code-verktyg, vibe coding och byggande av onlineprodukter med AI.