Devin munkafolyamata belülről: Eszközhasználat, tervezés és autonómia

2026. április 26.

AI kódolási asszisztens autonóm fejlesztő Cognition AI Devin ügynök feladattervező AI fejlesztői eszközök AI memória biztonsági korlátok

Bevezetés

Devin (a Cognition AI-tól) egy új autonóm AI szoftvermérnök, amely képes szoftverfejlesztési feladatokat megtervezni és nagyrészt önállóan végrehajtani. Végponttól végpontig dolgozik kódprojekteken, olyan eszközöket használva, mint egy kódszerkesztő, egy parancssori felület és egy webböngésző a kutatáshoz, íráshoz, teszteléshez és a kód telepítéséhez. Demókon és sajtómegjelenésekben Devinről bemutatták, hogy átvizsgálja a kódbázist, tervet készít, fájlokat szerkeszt, teszteket futtat és pull requesteket hoz létre meglepően kevés emberi beavatkozással (medium.com) (www.linkedin.com). A Cognition azt állítja, hogy Devin képes kezelni „összetett mérnöki feladatokat, amelyek több ezer döntést igényelnek,” minden lépésben felidézve a kontextust, sőt még a hibákból is tanulva (medium.com) (www.linkedin.com). Ezért megvizsgáljuk Devin tervezésének és munkafolyamatának nyilvánosan elérhető részleteit. Ez magában foglalja, hogy Devin hogyan bontja le a feladatokat (tervezési folyamata), hogyan dolgozik valójában egy fejlesztői környezetben (szerkesztő, terminál, böngésző), hogyan tartja meg a memóriát vagy a kontextust egy kódolási munkamenet során, hogyan korrigálja magát és iterál, valamint milyen védőkorlátokat vagy biztonsági intézkedéseket alkalmaz. Megjegyezzük azt is, ami nem derül ki – például az exact modell belső működése titkosított, így a közösségi megbeszélések egy része tájékozott találgatásokra épül.

Feladattervezés és -bontás

Amikor egy fejlesztő új feladatot ad Devinnek, az első lépés a tervezés, azaz hogy mely fájlokat és milyen sorrendben kell módosítani. A Cognition jegyzetei magyarázzák, hogy Devin egy „tervezési mód” alügynököt használ, amelynek feladata, hogy kiderítse, mely fájlok relevánsak a feladathoz a tárolóban (medium.com) (docs.devin.ai). Gyakorlatilag Devin „felderíti” a tárolót, és tervet javasol, mielőtt bármilyen kódot írna (docs.devin.ai) (docs.devin.ai). Összetett feladatok esetén a fejlesztők látják ezt a tervet, és jóváhagyhatják vagy módosíthatják; ha az Ügynöki mód engedélyezve van, Devin automatikusan folytatja a tervét, anélkül, hogy jóváhagyásra várna (docs.devin.ai) (docs.devin.ai).

A háttérben a Cognition megerősítéses tanulással képezte ezt a tervezőügynököt. Egy elemzésben a csapat leírja, hogy csak csak olvasható eszközöket adtak a tervezőnek (mint például ls, grep vagy read_file), és jutalmazták, amikor pontosan megjósolta azoknak a fájloknak a halmazát, amelyeket egy ember szerkesztene (medium.com) (medium.com). Az eredmény: Devin tervezője megtanul párhuzamos fájlrendszer-lekérdezéseket kiadni (pl. ls és grep futtatása különböző könyvtárakon egyszerre), majd leszűkíteni az ígéretes találatokat (medium.com). A képzési büntetés ösztönzi a hatékonyságot, így az ügynök elkerüli a nyers erő alkalmazását (pl. a teljes tároló végtelen grep-elését), és ehelyett azonnal „elkötelezi” magát, amint megtalálja a célt (medium.com). Ez azt jelenti, hogy Devin tervezése adatvezérelt: általános kódbázis navigációs stratégiákat tanult meg (ahogy a Cognition megjegyzi, a modellt számos tárolón és felhasználói lekérdezésen képezték) (medium.com) (medium.com).

Felhasználói szinten a lépések vázlataként látja az eredményt. Például egy új funkció kérésénél Devin olyasmit javasol majd, mint „módosítsa az A fájlt az X megvalósításához, adjon hozzá teszteket a B fájlba, majd frissítse a C konfigurációt.” Demókon, ha egy felhasználó elfelejtett bizonyos részleteket megadni, Devin tervének lépése gyakran észleli ezt, és tisztázást kér. Egy demóban az asszisztens automatikusan hozzáadta egy GitHub fiók konfigurálását a tervhez, annak ellenére, hogy a felhasználó ezt nem említette explicit módon (www.developersdigest.tech) (www.linkedin.com). Ezek a tervezési lépések (kérdések feltevése, feladatok listázása, fájlok hozzárendelése) mind Devin párbeszéd-felületén belül történnek, mielőtt bármilyen kódot írnának. Ha a felhasználó egyetért, vagy az automatikus jóváhagyás be van kapcsolva, Devin továbblép a végrehajtásra.

Munka fejlesztői környezetben: Szerkesztő, terminál és böngésző

Devin egy homokozós fejlesztői környezetben működik. A Cognition anyagai szerint ismerős fejlesztői eszköztárral rendelkezik: egy shell terminál, egy kódszerkesztő és egy webböngésző áll rendelkezésére (medium.com) (docs.devin.ai). Gyakorlatilag, amikor Devin fut, mindent, amit csinál, naplózza és látható a webes felhasználói felületen. A „Devin követése” nézet kiemeli az egyes műveleteket (például fájl szerkesztését vagy shell parancsot), sőt lehetővé teszi, hogy egy ember rákattintson egy ikonra, és közvetlenül beugorjon a kódszerkesztőbe vagy a terminálba, ahol a művelet történt (docs.devin.ai). Például, ha Devin JavaScript fájlt szerkeszt, a felhasználó rákattinthat, hogy megtekintse a VSCode szerkesztő nézetét a változtatásokkal, vagy ha Devin shell parancsot futtat, rákattinthat, hogy lássa a terminál kimenetét.

Manuálisan is beléphet Devin munkaterületére, ha szeretne. Egy közelmúltbeli frissítés hozzáadott egy „Devin gépének használata” gombot, amely megnyitja Devin környezetét a VSCode-ban a weben keresztül (docs.devin.ai). Ez azt jelenti, hogy a fejlesztő belenézhet Devin fájljaiba, parancsokat futtathat, vagy akár kézzel is szerkesztheti a kódot a munkaterületén. (Hosszú futású feladatok esetén ez kényelmes, ha menet közben szeretne valamit ellenőrizni.) Egy példában egy felhasználó aktiválta ezt, hogy figyelje, amint Devin UI elemeket hoz létre: a felhasználó szó szerint megnyitotta Devin VSCode-ját, látta az új fájlokat, amiket Devin írt, és élőben felfedezhette a felhasználói felületet.

A böngésző eszköz lehetővé teszi Devin számára, hogy kutasson vagy teszteljen dolgokat az interneten. Demókon Devin webes keresést használ dokumentációk vagy könyvtárak felkutatására, sőt a helyi webszervert is futtatja, hogy ellenőrizze, nem hibás-e a kódja (pl. localhost-ra irányítja a böngészőt, hogy ellenőrizze, működik-e a felhasználói felület). Összességében Devin felülete multimodális: képes bemenetként fogadni szöveges utasításokat, csatolt tervezési képeket vagy dokumentumokat, sőt kódrészleteket is, és csevegésen keresztül, valamint ezekkel a fejlesztői eszközökkel is interakcióba lép (www.developersdigest.tech) (medium.com). Az eredmény egy olyan élmény, amely sokkal közelebb áll egy „kódot író kollégához”, mint egy statikus AI csevegéshez.

Memória, Tudás és Munkamenet Kontextus

Devin egy beépített „Tudás” rendszer segítségével tartja nyilván az információkat egy munkamenet során. Gondoljon a Tudásra úgy, mint egy munkaterületi jegyzetfüzetre: Devin tippeket, projektspecifikus utasításokat vagy fontos kontextust tárolhat benne, és később felidézheti. Például a dokumentációk olyan munkafolyamatokat írnak le, amelyekkel bizonyos tudást rögzíteni lehet, hogy Devin soha ne felejtse el, például fontos architekturális korlátokat vagy kódolási stílus útmutatókat (docs.devin.ai). A felhasználók szerkeszthetik vagy bővíthetik ezt a tudásbázist. Devin automatikus hasznos jegyzeteket is generál: átvizsgálja a tárolót, hogy megismerje a kód szerkezetét, összetevőit és a dokumentációját, majd automatikusan létrehoz egy „Repo Tudás” összefoglalót (docs.devin.ai) (docs.devin.ai). Gyakorlatilag, miután futtatott néhány feladatot, Devin mondhatja: „Észrevettem, hogy gyakran használ React-et és Redux-ot; javaslom, hogy adja hozzá a Tudásba,” és ha jóváhagyja, az információ mentésre kerül.

Egy munkamenet során Devin a releváns tudást munkamemóriában tartja. A Cognition azt állítja, hogy „minden lépésben felidézi a releváns kontextust” (www.linkedin.com). Például, ha korábban megtanulta, hogy Ön Python 3.11-et preferál, vagy hogy webes alkalmazása OAuth-ot használ, szükség esetén beilleszti ezt az információt az utasításokba. A munkamenet eredendően hosszú és állapottartó: több tucat fordulón keresztül (percekig vagy tovább) beszélgethet Devinnal, miközben az számos fájlt szerkeszt, és megőrzi a csevegési előzményeket. Ha Devin meghibásodik, görgetheti a naplót, vagy bekapcsolhatja a „folyamat mód”-ot, hogy lássa az összes általa végrehajtott műveletet.

Ha a munkamenet véget ér (például leállítja a feladatot vagy befejezi), Devin elfelejti a gép futó állapotát, és a virtuális gépe legközelebb alapállapotú pillanatfelvételre áll vissza (docs.devin.ai). Alapértelmezés szerint ez az alapállapot tartalmazza a munkaterületén előre betöltött tárolókat, így Devinnek nem kell minden alkalommal nulláról klónoznia (docs.devin.ai). (Munkaterület beállítása nélkül minden munkamenet üres géppel kezdődne, ezért a Cognition hangsúlyozza a tároló előzetes konfigurálását a sebesség érdekében (docs.devin.ai).) A kódon túl azonban Devin a Tudásbankján keresztül viszi tovább a tudást. Felkéri Önt, hogy adjon hozzá olyan tanulságokat vagy definíciókat, amelyek hasznosnak tűnnek a jövőbeli feladatokhoz (docs.devin.ai). Több munkameneten keresztül ez azt jelenti, hogy Devin fokozatosan felépíti a projekt konvencióinak és architektúrájának memóriáját.

A Tudás mellett a Cognition kiadta a DeepWiki-t, egy kapcsolódó eszközt, amely indexeli a teljes kódbázisokat, és csevegőfelületet biztosít felettük (medium.com). Bár a DeepWiki külön termék, a szélesebb architektúrára utal: Devin lekérdezheti saját vagy egy külső kódwikit, hogy válaszoljon a kérdésekre. Gyakorlatilag, ha valamit kérdez Devintől a kóddal kapcsolatban, belsőleg ugyanazokat a lekérdező rendszereket használhatja, mint a DeepWiki, hogy megalapozza válaszait.

Autonómia, iteráció és önkorrekció

Devin autonóm működésre készült, de szükség esetén visszacsatolási hurkokkal. A tervezés után lépésről lépésre hajtja végre a feladatokat, folyamatosan ellenőrizve a hibákat. Demókon az ügynök gyakran ezt a mintát követi: a böngészőt vagy a dokumentációt használja egy probléma megértéséhez, kódot ír, futtatja, hibát lát, majd megkeresi a javítás módját – utánozva egy emberi hibakeresési ciklust (www.developersdigest.tech) (www.linkedin.com). Például az egyik előadó bemutatja, ahogy Devin bejelentkezési űrlapot ad hozzá, majd lefuttatja a front-end tesztet, hibát talál, és visszatér a kutatáshoz, hogyan javítsa ki azt a hibát. Devin minden „fordulója” egy gondolkodik → cselekszik → megfigyel → javít ciklus.

Több forrás is megjegyzi, hogy Devin beépített „önkorrekcióval” rendelkezik (medium.com) (www.linkedin.com). Valóban, a Cognition blogja a GPT-5-tel megjegyzi, hogy a GPT-5 „jól érti a hibákat és képes önmagát korrigálni”, amit hosszú feladatok esetén nagyszerűnek tartanak (www.linkedin.com). Más szóval, ha Devin kódja nem fordítható le, vagy egy teszt sikertelen, a modell (gyakran GPT-5 vagy hasonló) látja a hibaüzenetet, és menet közben kitalálja a javítást. Még újrapróbálkozási ciklusokra is képes: ha egy művelet részben sikeres, Devin megtehet egy második átfutást. Ezek a ciklusok a felhasználói felületen is láthatók ismétlődő szerkesztési és futtatási sorozatokként.

A hibák szisztematikus kezelésére Devin az automatizálás és az emberi felügyelet keverékét használja. Például, ha Devin pull requestet nyit, és CI hibát vagy kódellenőrzési megjegyzést kap, a Cognition rendszere automatikusan felébreszti Devint az alvásból, és rábírja a probléma megoldására (docs.devin.ai) (docs.devinenterprise.com). Alapértelmezés szerint Devin reagál a lint hibákra vagy megjegyzésekre, bár a felhasználók ezt letilthatják. A felhasználói felület valós időben kiemeli állapotát és műveleteit, így a fejlesztő bármikor beavatkozhat. A fejlesztőket arra ösztönzik, hogy figyeljék az első néhány futtatást „élő módban” (ahol minden lépés látható) a bizalom kiépítéséhez, majd ha meggyőződtek róla, hagyják Devint teljesen fej nélküli (headless) módban futni (www.developersdigest.tech).

Biztonság, védőkorlátok és testreszabás

Az operátorok explicit utasításokat adhatnak Devinnek arról, hogy mit ne tegyen. Egy erőteljes funkció a „Tiltott műveletek”. Felsorolhatja azokat a dolgokat, amelyeket Devin nem érinthet meg – például: „NE pusholjon közvetlenül a mainre” vagy „Ne szerkessze az X fájlt”. A rendszer biztosítja, hogy Devin betartja ezeket a parancsokat, amikor azok megjelennek az utasításban vagy egy Playbookban (docs.devin.ai). A kiadási jegyzetek szerint Devin most már megbízhatóan kezeli a tiltott műveletek listáit, ami azt jelenti, hogy ellenőrzi a műveleteit ezekkel a szabályokkal szemben. Ez segít megelőzni az olyan gyakori hibákat, mint a rossz ág vagy fájl módosítása.

Devin számos vezérlési lehetőséget is biztosít. Slackben vagy a webes felhasználói felületen mondhatja Devinnek, hogy „aludjon” (szüneteltesse a munkát) vagy „archiváljon” egy munkamenetet (docs.devin.ai). Kiválaszthatja, hogy Devin igényel-e jóváhagyást a terv végrehajtása előtt (az Ügynöki beállításon keresztül), vagy teljesen autonóm módon fut (docs.devin.ai) (docs.devin.ai). Számítási erőforrás-használatát Ügynök Számítási Egységekben (ACU) mérik, és a felhasználói felület figyelmeztetéseket mutat, ha Devin a korlátokat készül elérni, így Ön beavatkozhat vagy további erőforrásokat adhat (docs.devin.ai).

Ha valami gond adódik a háttérben, a Cognition figyelőrendszere működik. Korábbi kiadásokban egyes felhasználók „beragadt” vagy összeomlott Devin munkamenetekről számoltak be. A csapat megjegyzi, hogy ezeket a problémákat kijavították, és ACU visszatérítéseket kínálnak, ha Devin lefagy (docs.devin.ai). Más szóval, a vállalat aktívan méri a rendszer megbízhatóságát. Külső elemzők figyelmeztetnek, hogy, mint bármely csevegés alapú AI, Devin is okozhat hibákat vagy alkalmanként „hallucinálhat” kódot. Az ajánlott gyakorlat az, hogy ellenőrizze a kimenetét, ahogy egy junior fejlesztő munkáját is tenné. A biztonság érdekében sok csapat kódellenőrzést használ Devin commitjainál, és korlátozza Devin jogosultságait (pl. alapértelmezés szerint nincs közvetlen hozzáférés a titkokhoz). Eddig a nyilvánosan leírt védőkorlátok többnyire felhasználó által definiáltak (tiltott műveletek, tervjóváhagyás megkövetelése stb.) és rendszerállapot-ellenőrzések, nem pedig beépített etikai szűrők.

Amit (még) nem tudunk

A Cognition szándékosan belsőleg tartott bizonyos részleteket, így Devin egyes részei átláthatatlanok. Például a pontos nagyméretű nyelvi modell, amelyet használ, kezdetben nem volt nyilvános. Pletykák és későbbi bejegyzések szerint a Cognition mostantól a GPT-5-öt integrálja Devinbe a tervezési és érvelési magjához (www.linkedin.com), és van egy előnézeti ügynökük, amely a Claude Sonnet 4.5-ön alapul (docs.devinenterprise.com). A teljes architektúra azonban tisztázatlan: Devin valószínűleg több modellt is összehangol, és egyedi finomhangolással rendelkezik (ahogy az RFT tervezési alügynök is sugallja), de ezek a rétegek nem nyílt forráskódúak.

A memóriájának korlátait sem ismerjük teljesen. Devin azt állítja, hogy „idővel tanul”, de az, hogy hogyan illeszti be az új tudást a meglévő hálózatába (szemben azzal, hogy csak a Tudásbankban tárolja), nincs meghatározva. A ténylegesen használt beszélgetési előzmények maximális hossza nincs dokumentálva. Ha egy munkamenet nagyon hosszú, lehetséges, hogy a csevegés vagy a kódkontextus korábbi részeit levágják a háttérben. Gyakorlatilag a legtöbb felhasználó tömören tartja az utasításokat és a kódot, hogy elkerülje a kontextus túlterhelését.

A biztonsági oldalon is vannak még ismeretlenek. Például, bár a „tiltott műveletek” a felhasználó által megadott szabályokat fedik le, nem világos, hogy Devin rendelkezik-e implicit biztonsági rétegekkel (például adatvisszaélés észlelésére, torzításellenőrzésre vagy homokozó áttörésére). Mivel virtuális gépen fut, remélhetőleg nem károsíthatja a gazdarendszereket, de a homokozózás részletei nem nyilvánosak. A közösség arra következtet, hogy Devin gépe valószínűleg konténer-pillanatfelvételeket használ (ahogy az RL képzésnél említették) a futtatások elszigetelésére (medium.com).

Végül, sokan a közösségben figyelik, hogyan kezeli Devin a kétértelmű vagy nyitott végű feladatokat. Az értékesítési szöveg „teljesen autonómnak” nevezi, de az elemzők megjegyzik, hogy gyakran még mindig pontos utasításokra van szüksége. Például, ha a felhasználó utasítása homályos, Devin olyan tervet generálhat, amely ésszerűnek tűnik, de fontos szélsőséges eseteket kihagy. Kérhet tisztázó kérdéseket a folytatásban, de a fejlesztők néha azon tűnődnek, mennyire érti a szándékot a puszta kód-mintafelismerés helyett. Devin megismerésének ezen aspektusai az alapul szolgáló LLM képességeire támaszkodnak, amelyeket csak közvetett módon figyelünk meg. Röviden, a felhasználóknak inkább magasan képzett junior mérnökként kellene Devint megítélniük, mint termékmenedzserként – jól tervez, de nem mindig érti meg tökéletesen a szándékot.

Kezdés Devinnal

Devin elsősorban olyan mérnöki csapatokat céloz meg, amelyek sok kódolási munkát végeznek. Kiválóan teljesít világosan meghatározott feladatokban: specifikációkból funkciók építése, refaktorálás, tesztek írása és hibák javítása. Magas szintű tervezésben vagy nagyon rosszul definiált problémákban kevésbé bizonyított. Egy szoftvercsapat számára Devin segíthet a rutinmunka elvégzésében, így az emberek a kreatív architektúrára és a felügyeletre koncentrálhatnak.

Nem kódolók vagy újoncok számára Devin még mindig hasznos lehet, de bizonyos beállítást igényel. Az első lépés az, hogy hozzáférést biztosítson Devinnek a kód tárolójához (GitHub, GitLab stb. keresztül), és esetleg csatlakoztassa Slackbe vagy Teamsbe. Ezután próbáljon ki egy egyszerű feladatot. Például kérdezze meg: „Devin, adj hozzá egy új oldalt a webes felhasználói felületen, amely listázza az adatbázisunk összes termékét, beleértve a tesztlefedettséget is.” Figyelje a tervezési fázis párbeszédét: Devin felvázolja, mely fájlokat kell módosítani (pl. HTML sablon, backend API kód stb.), és felteszi a szükséges kérdéseket. Hagyja jóvá a tervet (vagy hagyja, hogy automatikusan fusson), és figyelje a végrehajtását. Használja a „Követés” panelt az egyes lépések megtekintéséhez: látni fogja a fájlszerkesztéseket, shell parancsokat (például tesztsorozatok futtatását) és a felhasználói felület böngésző-pillanatfelvételeit. Ha Devin hibát követ el, vagy változtatást szeretne, egyszerűen lépjen interakcióba, ahogy egy csevegésben tenné („Valójában ezt a CSS témát használd” vagy „a termék címe legyen nagybetűs”), és Devin egy újabb szerkesztési ciklust indít.

A kulcsfontosságú cselekvési lépés az iteráció és felülvizsgálat. Mindig ellenőrizze Devin által készített kódot, és tesztelje helyileg. Idővel bővítheti a Tudásbankot: adjon hozzá jegyzeteket, például „Adatbázisunk PostgreSQL 13-at használ” vagy „PHP-ban PSR-12 stílust követünk”. Devin a jövőbeni munkamenetekben elkezdi beépíteni ezeket. Fedezze fel a beállításokat is: kapcsolja ki az Ügynöki módot, ha mindig ellenőrizni szeretné a javaslatokat, vagy kapcsolja be, ha jobban megbízik benne. Kapcsolja össze Devint a CI-jével az automatikus pull request felülvizsgálathoz, de kezdje az értesítésekkel, hogy figyelhesse, hogyan kezeli a visszajelzéseket.

Végső soron Devin munkafolyamata sűrű és erőteljes, de továbbra is Önre támaszkodik útmutatásért. Azzal, hogy megérti, hogyan tervez, használja az eszközöket és tanul a visszajelzésekből (a fentebb részletezettek szerint), a legtöbbet hozhatja ki ebből az új típusú ágensi kódolási asszisztensből. A legjobb következő lépés egy Devin iránt érdeklődő csapat számára, ha feliratkozik a devin.ai oldalon, és futtat egy kisebb pilotot: adjon hozzá egy webes tárolót, kérje meg Devint, hogy valósítson meg egy funkciót, és hagyja futni folyamat módban. Figyelje meg a teljes „gondolkodási” nyomvonalat – ez a gyakorlati tapasztalat pontosan tisztázza, hogyan fűzi össze Devin a tervezést, a szerkesztést és az önkorrekciót. Innen aztán több feladatra is kiterjesztheti, és finomhangolhatja a használatát (például egyedi playbookokkal a saját domainjéhez). Bár még fejlődésben van, Devin jelentős előrelépést képvisel az AI eszközök terén. A munkafolyamatának megismerésével a csapatok felkészülhetnek egy olyan korszakra, ahol a kódolási feladatokat valóban meg lehet osztani egy AI csapattárssal.

Értesüljön új AI kódolási kutatásokról és podcast epizódokról

Iratkozzon fel, hogy megkapja a legújabb kutatási frissítéseket és podcast epizódokat az AI kódolási eszközökről, AI alkalmazáskészítőkről, no-code eszközökről, vibe codingról és online termékek építéséről AI segítségével.

← Vissza ide: AI Builds It: Easy Coding Tools