Uvnitř pracovního postupu Devina: Použití nástrojů, plánování a autonomie

Uvnitř pracovního postupu Devina: Použití nástrojů, plánování a autonomie

26. dubna 2026

Úvod

Devin (od Cognition AI) je nový autonomní softwarový inženýr s umělou inteligencí, který dokáže plánovat úlohy vývoje softwaru a provádět je z velké části sám. Funguje end-to-end na kódovacích projektech a využívá nástroje jako editor kódu, shell příkazového řádku a webový prohlížeč k výzkumu, psaní, testování a nasazení kódu. V ukázkách a tisku bylo ukázáno, jak Devin skenuje kódovou základnu, generuje plán, upravuje soubory, spouští testy a vytváří pull requesty s překvapivě malým lidským vstupem (medium.com) (www.linkedin.com). Cognition tvrdí, že Devin dokáže zvládnout „komplexní inženýrské úkoly vyžadující tisíce rozhodnutí“, přičemž si v každém kroku pamatuje kontext a dokonce se učí z chyb (medium.com) (www.linkedin.com). Proto se podíváme na veřejné detaily designu a pracovního postupu Devina. To zahrnuje, jak Devin rozkládá úkoly (jeho proces plánování), jak doslova funguje ve vývojovém prostředí (editor, terminál, prohlížeč), jak udržuje paměť nebo kontext napříč kódovací relací, jak se sám opravuje a iteruje a jaká ochranná opatření nebo bezpečnostní prvky používá. Rovněž si všímáme toho, co není odhaleno – například přesné vnitřní mechanismy modelu jsou nezveřejněny, takže některé komunitní diskuse se opírají o kvalifikované dohady.

Plánování a dekompozice úkolů

Když vývojář zadá Devinovi nový úkol, prvním krokem je plánování, které soubory změnit a v jakém pořadí. Poznámky Cognition vysvětlují, že Devin používá podagenta v „režimu plánování“, jehož úkolem je zjistit, které soubory v repozitáři jsou relevantní pro daný úkol (medium.com) (docs.devin.ai). V praxi Devin „prozkoumá“ repozitář a navrhne plán, než napíše jakýkoli kód (docs.devin.ai) (docs.devin.ai). U komplexních úkolů vývojáři vidí tento plán a mohou jej schválit nebo upravit; pokud je povolen režim Agency, Devin automaticky pokračuje s plánem, aniž by čekal na schválení (docs.devin.ai) (docs.devin.ai).

V zákulisí Cognition trénoval tohoto plánovacího agenta pomocí posilovaného učení. V jedné analýze tým popisuje, že plánovači dává pouze nástroje jen pro čtení (jako ls, grep nebo read_file) a odměňuje ho, když správně předpoví sadu souborů, které by člověk upravil (medium.com) (medium.com). Výsledek: Plánovač Devina se učí vydávat paralelní dotazy na souborový systém (např. spouštět ls a grep na různých adresářích najednou) a poté zužovat slibné stopy (medium.com). Tréninková penalizace podporuje efektivitu, takže agent se vyhýbá hrubé síle (např. nekonečnému procházení celého repozitáře) a místo toho se rychle „zaváže“, jakmile najde cíl (medium.com). To znamená, že plánování Devina je řízeno daty: naučil se obecné strategie navigace v kódové základně (jak Cognition poznamenává, model byl trénován na mnoha repozitářích a uživatelských dotazech) (medium.com) (medium.com).

Na uživatelské úrovni vidíte výsledek jako přehled kroků. Například při požadavku na novou funkci Devin navrhne něco jako „upravit soubor A pro implementaci X, přidat testy do souboru B, poté aktualizovat konfiguraci C.“ V ukázkách, pokud uživatel zapomněl specifikovat některé detaily, plánovací krok Devina to často zachytí a vyzve k objasnění. V jedné ukázce asistent automaticky přidal konfiguraci účtu GitHub do plánu, i když ji uživatel výslovně nezmínil (www.developersdigest.tech) (www.linkedin.com). Tyto kroky plánování (kladení otázek, výčet úkolů, mapování souborů) se provádějí v dialogovém rozhraní Devina předtím, než se napíše jakýkoli kód. Pokud uživatel souhlasí nebo je zapnuto automatické schvalování, Devin přejde k provedení.

Práce ve vývojovém prostředí: Editor, Terminál a Prohlížeč

Devin pracuje v sandboxed vývojovém prostředí. Materiály Cognition jej popisují jako disponující známou sadou vývojářských nástrojů: shell terminálem, editorem kódu a webovým prohlížečem, vše k dispozici (medium.com) (docs.devin.ai). V praxi, když Devin běží, vše, co dělá, je zaznamenáno a viditelné ve webovém uživatelském rozhraní. Pohled „Sledovat Devina“ zvýrazňuje každou akci (například úpravu souboru nebo shell příkaz) a dokonce umožňuje člověku kliknout na ikonu a přeskočit přímo do editoru kódu nebo terminálu, kde k této akci došlo (docs.devin.ai). Například, pokud Devin upraví soubor JavaScript, uživatel může kliknout a zobrazit si pohled editoru VSCode se změnami, nebo pokud Devin spustí shell příkaz, kliknout a zobrazit výstup terminálu.

Můžete se také ručně připojit do pracovního prostoru Devina, pokud chcete. Nedávná aktualizace přidala tlačítko „Použít stroj Devina“, které otevře prostředí Devina ve VSCode přes web (docs.devin.ai). To znamená, že vývojář může nahlížet do souborů Devina, spouštět příkazy, nebo dokonce ručně upravovat kód v jeho pracovním prostoru. (U dlouhodobě běžících úloh je to vhodné, pokud chcete něco zkontrolovat za běhu.) V jednom příkladu uživatel tuto funkci aktivoval, aby sledoval, jak Devin vytváří prvky uživatelského rozhraní: uživatel doslova otevřel VSCode Devina, viděl nové soubory, které Devin napsal, a mohl prozkoumat uživatelské rozhraní živě.

Nástroj prohlížeč umožňuje Devinovi vyhledávat nebo testovat věci na internetu. V ukázkách je vidět, jak Devin používá webové vyhledávání k nalezení dokumentace nebo knihoven, a dokonce spouští lokální webový server, aby zkontroloval, že jeho kód není rozbitý (např. nasměruje prohlížeč na localhost, aby ověřil funkčnost UI). Celkově je rozhraní Devina multimodální: dokáže přijímat vstupy jako textové výzvy, připojené návrhové obrázky nebo dokumenty, a dokonce i úryvky kódu, a interaguje jak prostřednictvím chatu, tak těchto vývojářských nástrojů (www.developersdigest.tech) (medium.com). Výsledkem je zkušenost mnohem bližší „kolegovi píšícímu kód“ než statickému chatu s umělou inteligencí.

Paměť, znalosti a kontext relace

Devin si uchovává informace napříč relacemi pomocí vestavěného systému „Znalostí“. Představte si Znalosti jako poznámkový blok pracovního prostoru: Devin zde může ukládat tipy, pokyny specifické pro projekt nebo důležitý kontext a později si je vyvolat. Například dokumentace popisuje pracovní postupy pro připnutí určitých znalostí, aby na ně Devin nikdy nezapomněl, například důležitá architektonická omezení nebo průvodce stylem kódování (docs.devin.ai). Uživatelé mohou tuto znalostní banku upravovat nebo do ní přidávat. Devin také automaticky generuje užitečné poznámky: skenuje váš repozitář, aby se dozvěděl o struktuře kódu, komponentách a vaší dokumentaci, a automaticky vytváří souhrn „Znalostí repozitáře“ (docs.devin.ai) (docs.devin.ai). V praxi, po provedení několika úkolů, může Devin říci „Všiml jsem si, že často používáte React a Redux; navrhuji přidat to do Znalostí,“ a pokud to schválíte, informace se uloží.

Během relace bude Devin uchovávat relevantní znalosti v pracovní paměti. Cognition tvrdí, že si „v každém kroku pamatuje relevantní kontext“ (www.linkedin.com). Například, pokud se dříve naučil, že preferujete Python 3.11 nebo že vaše webová aplikace používá OAuth, tyto informace podle potřeby zahrne do výzev. Relace je ze své podstaty dlouhá a stavová: můžete s Devinem mluvit desítky tahů (minuty i déle), zatímco upravuje mnoho souborů, a zachovává historii chatu. Pokud se Devin někdy zhroutí, můžete procházet protokolem nebo zapnout „režim průběhu“ pro zobrazení každé akce, kterou provedl.

Pokud vaše relace skončí (například, pokud zastavíte úkol nebo dokončíte práci), Devin zapomene běžící stav daného stroje a jeho virtuální stroj se příště resetuje na základní snímek (docs.devin.ai). Ve výchozím nastavení tento základní stav zahrnuje repozitáře, které jste předem načetli do svého pracovního prostoru, takže Devin nemusí pokaždé klonovat od nuly (docs.devin.ai). (Bez nastavení pracovního prostoru by každá relace začínala s prázdným strojem, proto Cognition zdůrazňuje předkonfiguraci vašeho repozitáře pro rychlost (docs.devin.ai).) Kromě kódu však Devin přenáší znalosti prostřednictvím své znalostní banky. Vyzve vás k přidání poznatků nebo definic, které se zdají být užitečné pro budoucí úkoly (docs.devin.ai). Během několika relací to znamená, že Devin postupně buduje paměť o konvencích a architektuře vašeho projektu.

Kromě Znalostí vydala společnost Cognition DeepWiki, související nástroj, který indexuje celé kódové základny a poskytuje nad nimi chatovací rozhraní (medium.com). Přestože je DeepWiki samostatný produkt, naznačuje širší architekturu: Devin může dotazovat svou vlastní nebo externí wiki kódu, aby odpovídal na otázky. V praxi, pokud se Devina zeptáte na něco ohledně kódu, může interně použít stejné vyhledávací systémy jako DeepWiki k podložení svých odpovědí.

Autonomie, iterace a samooprava

Devin je navržen tak, aby byl autonomní, ale v případě potřeby s cykly zpětné vazby. Po plánování provádí kroky jeden po druhém a neustále kontroluje chyby. V ukázkách agent často sleduje tento vzorec: používá prohlížeč nebo dokumentaci k pochopení problému, píše kód, spustí ho, uvidí chybu a pak vyhledá, jak ji opravit – napodobuje lidský cyklus ladění (www.developersdigest.tech) (www.linkedin.com). Například jeden prezentující ukazuje, jak Devin přidává přihlašovací formulář, poté spouští front-end test, najde chybu a vrací se k výzkumu, jak tuto chybu opravit. Každý „tah“ Devina je smyčka mysli → jednej → pozoruj → oprav.

Více zdrojů uvádí, že Devin má vestavěnou „samoopravu“ (medium.com) (www.linkedin.com). Blog Cognition s GPT-5 skutečně zmiňuje, že GPT-5 „dobře rozumí chybám a dokáže se sám opravit“, což zdůrazňují jako skvělé pro dlouhé úkoly (www.linkedin.com). Jinými slovy, pokud se kód Devina nezkompiluje nebo selže v testu, model (často GPT-5 nebo podobný) uvidí chybovou zprávu a vymyslí opravu za běhu. Je dokonce schopen opakovaných smyček: pokud akce částečně uspěje, Devin může provést druhý průchod. Tyto smyčky jsou viditelné v uživatelském rozhraní jako opakované sekvence úprav a spouštění.

Pro systematické zvládání selhání Devin používá kombinaci automatizace a lidského dohledu. Například, pokud Devin otevře pull request a obdrží selhání CI nebo komentář k revizi kódu, systém Cognition automaticky probudí Devina ze spánku a nechá ho problém vyřešit (docs.devin.ai) (docs.devinenterprise.com). Devin ve výchozím nastavení reaguje na chyby lintu nebo komentáře, ačkoli uživatelé to mohou zakázat. Uživatelské rozhraní také zvýrazňuje jeho stav a akce v reálném čase, takže vývojář může kdykoli zasáhnout. Vývojářům se doporučuje sledovat prvních několik spuštění v „živém režimu“ (kde je zobrazen každý krok) k vybudování důvěry, a poté nechat Devina běžet plně bezhlavě, jakmile si jsou jisti (www.developersdigest.tech).

Bezpečnost, ochranná opatření a přizpůsobení

Operátoři mohou Devinovi dát explicitní pokyny, co nemá dělat. Jednou z mocných funkcí jsou „Zakázané akce“. Můžete uvést věci, kterých se Devin nesmí dotknout – například „NETLAČIT přímo na main“ nebo „Neupravovat soubor X.“ Systém zajišťuje, že Devin respektuje tyto příkazy, když se objeví ve výzvě nebo v Playbooku (docs.devin.ai). Podle poznámek k vydání Devin nyní zpracovává seznamy zakázaných akcí spolehlivě, což znamená, že kontroluje své akce proti těmto pravidlům. To pomáhá předcházet běžným chybám, jako je úprava špatné větve nebo souboru.

Devin také poskytuje různé ovládací prvky. Ve Slacku nebo webovém uživatelském rozhraní můžete Devinovi říct, aby „spal“ (pozastavil práci) nebo „archivoval“ relaci (docs.devin.ai). Můžete si vybrat, zda Devin vyžaduje vaše schválení před provedením plánu (prostřednictvím nastavení Agency) nebo běží plně autonomně (docs.devin.ai) (docs.devin.ai). Jeho výpočetní výkon se měří v jednotkách Agent Compute Units (ACU) a uživatelské rozhraní zobrazuje varování, pokud se Devin chystá dosáhnout limitů, takže můžete zasáhnout nebo přidělit více prostředků (docs.devin.ai).

Pokud se něco pokazí v zákulisí, Cognition má zavedený monitoring. V dřívějších verzích někteří uživatelé hlásili, že relace Devina „zamrzly“ nebo spadly. Tým uvádí, že tyto problémy byly opraveny a nabízí vrácení ACU, pokud se Devin zasekne (docs.devin.ai). Jinými slovy, společnost aktivně instrumentuje systém pro spolehlivost. Externí analytici upozorňují, že jako každá chatovací AI, Devin může občas produkovat chyby nebo „halucinovat“ kód. Doporučenou praxí je kontrolovat jeho výstup, stejně jako byste kontrolovali práci juniorního vývojáře. Z bezpečnostních důvodů mnoho týmů používá code reviews na commity Devina a omezuje jeho oprávnění (např. ve výchozím nastavení žádný přímý přístup k tajným údajům). Dosud jsou veřejně popsaná ochranná opatření většinou uživatelsky definovaná (zakázané akce, vyžadování schválení plánu atd.) a kontroly stavu systému, spíše než vestavěné etické filtry.

Co (zatím) nevíme

Společnost Cognition záměrně ponechala některé detaily interní, takže části Devina jsou neprůhledné. Například přesný velký jazykový model, který používá, nebyl zpočátku veřejný. Zvěsti a pozdější příspěvky naznačují, že Cognition nyní integruje GPT-5 do Devina pro jeho plánovací a uvažovací jádro (www.linkedin.com), a mají preview agenta založeného na Claude Sonnet 4.5 (docs.devinenterprise.com). Celá architektura je však nejasná: Devin pravděpodobně orchestruje více modelů a má vlastní jemné ladění (jak naznačuje RFT plánovací subagent), ale tyto vrstvy nejsou open-source.

Také plně neznáme limity jeho paměti. Devin tvrdí, že se „učí v průběhu času“, ale jak integruje nové znalosti do své stávající sítě (oproti pouhému ukládání do znalostní banky), není specifikováno. Maximální délka historie konverzace, kterou efektivně používá, není zdokumentována. Pokud je relace velmi dlouhá, je možné, že dřívější části konverzace nebo kontextu kódu jsou v zákulisí prořezány. Prakticky většina uživatelů udržuje výzvy a kód stručné, aby se vyhnula přetížení kontextu.

Na straně bezpečnosti zůstávají některé neznámé. Například, zatímco „zakázané akce“ pokrývají uživatelsky specifikovaná pravidla, není jasné, zda Devin má nějaké implicitní bezpečnostní vrstvy (jako detekce zneužití dat, kontroly zkreslení nebo úniky ze sandboxu). Protože běží ve VM, člověk doufá, že nemůže poškodit hostitelské systémy, ale detaily o tomto sandboxingu nejsou veřejné. Komunita usuzuje, že stroj Devina pravděpodobně používá snímky kontejnerů (jak je zmíněno pro trénink RL) k izolaci běhů (medium.com).

Nakonec, mnoho členů komunity sleduje, jak se Devin vypořádá s nejednoznačnými nebo otevřenými úkoly. Prodejní kampaň jej označuje za „plně autonomní“, ale analytici poznamenávají, že stále často potřebuje přesné pokyny. Například, pokud je výzva uživatele vágní, Devin může vygenerovat plán, který se zdá rozumný, ale opomíjí důležité okrajové případy. Může se zeptat na objasňující otázky v navazující konverzaci, ale vývojáři se někdy ptají, jak dobře rozumí záměru oproti pouhému porovnávání vzorů v kódu. Tyto aspekty poznání Devina závisí na schopnostech podkladového LLM, které pozorujeme pouze nepřímo. Zkrátka, uživatelé by měli Devina vnímat spíše jako vysoce kvalifikovaného juniorního inženýra než jako produktového manažera – dobře plánuje, ale nemusí vždy dokonale pochopit váš záměr.

Začínáme s Devinem

Devin je zaměřen hlavně na inženýrské týmy, které se hodně věnují kódování. Vyniká u jasně definovaných úkolů: vytváření funkcí podle specifikací, refaktorování, psaní testů a opravování chyb. Méně osvědčený je v oblasti designu na vysoké úrovni nebo u velmi špatně definovaných problémů. Pro softwarový tým může Devin pomoci odstranit rutinní práci, aby se lidé mohli soustředit na kreativní architekturu a dohled.

Pro nekodéry nebo nováčky může být Devin stále užitečný, ale vyžaduje určité nastavení. Prvním krokem je dát Devinovi přístup k vašemu kódovému repozitáři (přes GitHub, GitLab atd.) a případně jej připojit ve Slacku nebo Teams. Poté zkuste jednoduchý úkol. Například se zeptejte: „Devin, přidej novou stránku pro zobrazení všech produktů z naší databáze ve webovém uživatelském rozhraní, včetně testovacího pokrytí.“ Sledujte dialogovou fázi plánování: Devin nastíní, které soubory změnit (např. HTML šablonu, backend API kód atd.) a položí případné potřebné otázky. Schvalte plán (nebo jej nechte automaticky spustit) a sledujte jeho provedení. Použijte panel „Sledovat“ k zobrazení každého kroku: uvidíte úpravy souborů, shell příkazy (jako spouštění testovacích sad) a snímky prohlížeče uživatelského rozhraní. Pokud Devin udělá chybu nebo chcete změnu, jednoduše interagujte jako v chatu („Ve skutečnosti použij tento CSS motiv“ nebo „název produktu by měl být velkými písmeny“), a Devin zahájí další editační smyčku.

Klíčovým akčním krokem je iterovat a kontrolovat. Vždy zkontrolujte kód, který Devin vyprodukuje, a otestujte jej lokálně. Postupem času můžete obohatit znalostní banku: přidejte poznámky jako „Naše databáze používá PostgreSQL 13“ nebo „V PHP dodržujeme styl PSR-12“. Devin je začne zahrnovat do budoucích relací. Prozkoumejte také nastavení: vypněte Agency, pokud chcete vždy prověřovat návrhy, nebo zapněte, pokud mu více důvěřujete. Propojte Devina s vaším CI pro automatickou revizi pull requestů, ale začněte s notifikacemi, abyste mohli sledovat, jak zpracovává zpětnou vazbu.

Nakonec je pracovní postup Devina hustý a výkonný, ale stále závisí na vašem vedení. Pochopením toho, jak plánuje, používá nástroje a učí se ze zpětné vazby (jak je podrobně popsáno výše), můžete z této nové třídy agentního kódovacího asistenta vytěžit maximum. Nejlepším dalším krokem pro tým, který se zajímá o Devina, je zaregistrovat se na devin.ai a spustit malý pilotní projekt: přidat jeden webový repozitář, požádat Devina o implementaci funkce a nechat ho běžet v režimu průběhu. Pozorujte celou „myšlenkovou“ stopu – tato praktická zkušenost objasní, jak přesně Devin propojuje plánování, úpravy a samoopravu. Odtud můžete přejít na více úkolů a doladit jeho použití (například vlastní playboooky pro vaši doménu). I když se stále vyvíjí, Devin představuje velký skok v nástrojích AI. Tím, že se dnes naučí jeho pracovní postup, se týmy mohou připravit na éru, kdy bude možné programovací úkoly skutečně sdílet s AI kolegou.

Získejte nové výzkumy a podcasty o AI kódování

Přihlaste se k odběru nových výzkumných aktualizací a podcastových epizod o nástrojích pro AI kódování, tvůrcích AI aplikací, no-code nástrojích, vibe kódování a budování online produktů s AI.

Uvnitř pracovního postupu Devina: Použití nástrojů, plánování a autonomie | AI Builds It: Easy Coding Tools