
Por Dentro do Fluxo de Trabalho de Devin: Uso de Ferramentas, Planeamento e Autonomia
Introdução
Devin (da Cognition AI) é um novo engenheiro de software de IA autônomo que pode planear tarefas de desenvolvimento de software e executá-las em grande parte por conta própria. Ele trabalha de ponta a ponta em projetos de código, usando ferramentas como um editor de código, um terminal de linha de comando e um navegador web para pesquisar, escrever, testar e implementar código. Em demonstrações e na imprensa, Devin tem sido mostrado examinando uma base de código, gerando um plano, editando arquivos, executando testes e fazendo pull requests com surpreendentemente pouca intervenção humana (medium.com) (www.linkedin.com). A Cognition afirma que Devin pode lidar com “tarefas de engenharia complexas que exigem milhares de decisões,” relembrando o contexto a cada passo e até aprendendo com erros (medium.com) (www.linkedin.com). Por isso, exploramos os detalhes públicos do design e do fluxo de trabalho de Devin. Isso inclui como Devin divide as tarefas (seu processo de planeamento), como ele literalmente funciona em um ambiente de desenvolvedor (editor, terminal, navegador), como ele mantém a memória ou o contexto ao longo de uma sessão de codificação, como ele se autocorrige e itera, e quais barreiras de proteção ou medidas de segurança ele usa. Também notamos o que não é revelado – por exemplo, os detalhes exatos dos internos do modelo não são divulgados, então algumas discussões da comunidade dependem de suposições bem-informadas.
Planeamento e Decomposição de Tarefas
Quando um desenvolvedor dá a Devin uma nova atribuição, o primeiro passo é planear quais arquivos devem ser alterados e em que ordem. As notas da Cognition explicam que Devin usa um subagente de “modo de planeamento” cuja função é descobrir quais arquivos no repositório são relevantes para a tarefa (medium.com) (docs.devin.ai). Na prática, Devin “investiga” o repositório e propõe um plano antes de escrever qualquer código (docs.devin.ai) (docs.devin.ai). Para tarefas complexas, os desenvolvedores veem esse plano e podem aprová-lo ou ajustá-lo; se o modo Agency estiver habilitado, Devin procederá automaticamente com seu plano sem esperar por aprovação (docs.devin.ai) (docs.devin.ai).
Nos bastidores, a Cognition treinou este agente de planeamento com aprendizagem por reforço. Em uma análise, a equipe descreve ter dado ao planeador apenas ferramentas somente de leitura (como ls, grep ou read_file) e recompensá-lo quando ele prevê corretamente o conjunto de arquivos que um humano editaria (medium.com) (medium.com). O resultado: o planeador de Devin aprende a emitir consultas paralelas ao sistema de arquivos (por exemplo, executando ls e grep em diferentes diretórios ao mesmo tempo) e, em seguida, a restringir as pistas promissoras (medium.com). A penalidade de treino incentiva a eficiência, então o agente evita a força bruta (por exemplo, pesquisar o repositório inteiro indefinidamente) e, em vez disso, “confirma” prontamente ao encontrar um alvo (medium.com). Isso significa que o planeamento de Devin é orientado por dados: ele aprendeu estratégias genéricas de navegação em bases de código (como a Cognition observa, o modelo foi treinado em muitos repositórios e consultas de usuário) (medium.com) (medium.com).
No nível do usuário, você vê o resultado como um esboço de passos. Por exemplo, com uma nova solicitação de recurso, Devin sugerirá algo como “modificar o arquivo A para implementar X, adicionar testes no arquivo B e, em seguida, atualizar a configuração C.” Em demonstrações, se um usuário esquecesse de especificar alguns detalhes, a etapa de planeamento de Devin frequentemente o detecta e solicita esclarecimentos. Em uma demonstração, o assistente adicionou automaticamente a configuração de uma conta GitHub ao plano, embora o usuário não a tenha mencionado explicitamente (www.developersdigest.tech) (www.linkedin.com). Esses passos de planeamento (fazer perguntas, listar tarefas, mapear arquivos) são todos feitos dentro da interface de diálogo de Devin antes que qualquer código seja escrito. Se o usuário concordar ou a aprovação automática estiver ativada, Devin passa para a execução.
Trabalhando em um Ambiente de Desenvolvimento: Editor, Terminal e Navegador
Devin opera dentro de um ambiente de desenvolvedor em sandbox. Os materiais da Cognition o descrevem como tendo um kit de ferramentas de desenvolvedor familiar: um terminal shell, um editor de código e um navegador web à sua disposição (medium.com) (docs.devin.ai). Na prática, quando Devin é executado, tudo o que ele faz é registado e visível na interface web. Uma vista “Seguir Devin” destaca cada ação (como uma edição de arquivo ou comando shell) e até permite que um humano clique num ícone para ir diretamente para o editor de código ou para o terminal onde essa ação ocorreu (docs.devin.ai). Por exemplo, se Devin editar um arquivo JavaScript, um usuário pode clicar para ver a vista do editor VSCode com as alterações, ou se Devin executar um comando shell, clicar para ver a saída do terminal.
Você também pode entrar manualmente no espaço de trabalho de Devin, se desejar. Uma atualização recente adicionou um botão “Usar a Máquina de Devin” que abre o ambiente de Devin no VSCode pela web (docs.devin.ai). Isso significa que um desenvolvedor pode espiar os arquivos de Devin, executar comandos ou até editar manualmente o código em seu espaço de trabalho. (Para tarefas de longa duração, isso é conveniente se você quiser inspecionar algo em andamento.) Em um exemplo, um usuário ativou isso para observar Devin a criar elementos de UI: o usuário literalmente abriu o VSCode de Devin, viu os novos arquivos que Devin escreveu e pôde explorar a UI ao vivo.
A ferramenta navegador permite que Devin pesquise ou teste coisas na Internet. Em demonstrações, Devin é visto usando a pesquisa web para procurar documentação ou bibliotecas, e até executando o servidor web local para verificar se seu código não está quebrado (por exemplo, ele apontará um navegador para localhost para verificar se a UI funciona). No geral, a interface de Devin é multimodal: ela pode receber entradas como prompts de texto, imagens de design anexadas ou documentos, e interage tanto por chat quanto por essas ferramentas de desenvolvedor (www.developersdigest.tech) (medium.com). O resultado é uma experiência muito mais próxima de “um colega a escrever código” do que um chat estático com uma IA.
Memória, Conhecimento e Contexto da Sessão
Devin rastreia informações ao longo de uma sessão usando um sistema de “Conhecimento” integrado. Pense em Conhecimento como um caderno de trabalho: Devin pode armazenar dicas, instruções específicas do projeto ou contexto importante lá, e recuperá-los mais tarde. Por exemplo, os documentos descrevem fluxos de trabalho para fixar certas informações para que Devin nunca as esqueça, como importantes restrições arquitetónicas ou guias de estilo de codificação (docs.devin.ai). Os usuários podem editar ou adicionar a este banco de conhecimento. Devin também gerará automaticamente notas úteis: ele examina seu repositório para aprender sobre a estrutura do código, componentes e sua documentação, e cria um resumo de “Conhecimento do Repositório” automaticamente (docs.devin.ai) (docs.devin.ai). Na prática, depois de executar algumas tarefas, Devin pode dizer “Notei que você costuma usar React e Redux; sugiro adicionar isso ao Conhecimento,” e se você aprovar, essa informação será salva.
Durante uma sessão, Devin manterá o conhecimento relevante na memória de trabalho. A Cognition afirma que ele “relembra o contexto relevante a cada passo” (www.linkedin.com). Por exemplo, se antes ele aprendeu que você prefere Python 3.11 ou que seu aplicativo web usa OAuth, ele trará essa informação para os prompts conforme necessário. A sessão é inerentemente longa e com estado: você pode conversar com Devin por dezenas de turnos (minutos ou mais) enquanto ele edita muitos arquivos, e ele retém o histórico do chat. Se Devin alguma vez falhar, você pode rolar o log ou ligar o “modo de progresso” para ver cada ação que ele tomou.
Se sua sessão terminar (por exemplo, se você parar a tarefa ou finalizar), Devin esquece o estado de execução dessa máquina, e sua máquina virtual é redefinida para um instantâneo base na próxima vez (docs.devin.ai). Por padrão, este estado base inclui os repositórios que você pré-carregou em seu espaço de trabalho, então Devin não precisa clonar do zero a cada vez (docs.devin.ai). (Sem a configuração do espaço de trabalho, cada sessão começaria com uma máquina vazia, então a Cognition enfatiza a pré-configuração do seu repositório para agilidade (docs.devin.ai).) Mas, além do código, Devin leva o conhecimento adiante através de seu banco de Conhecimento. Ele o solicitará a adicionar lições ou definições que pareçam úteis para futuras tarefas (docs.devin.ai). Ao longo de várias sessões, isso significa que Devin constrói gradualmente uma memória das convenções e da arquitetura do seu projeto.
Além do Conhecimento, a Cognition lançou o DeepWiki, uma ferramenta relacionada que indexa bases de código inteiras e fornece uma interface de chat sobre elas (medium.com). Embora o DeepWiki seja um produto separado, ele sugere a arquitetura mais ampla: Devin pode consultar seu próprio wiki ou um wiki externo do código para responder a perguntas. Na prática, se você perguntar a Devin algo sobre o código, ele pode usar internamente os mesmos sistemas de recuperação do DeepWiki para fundamentar suas respostas.
Autonomia, Iteração e Autocorreção
Devin foi projetado para ser autônomo, mas com ciclos de feedback quando necessário. Após o planeamento, ele executa os passos um por um, verificando constantemente por erros. Em demonstrações, o agente frequentemente segue este padrão: ele usa o navegador ou documentos para entender um problema, escreve algum código, executa-o, vê um erro e, em seguida, pesquisa como corrigi-lo – imitando um ciclo de depuração humano (www.developersdigest.tech) (www.linkedin.com). Por exemplo, um apresentador mostra Devin a adicionar um formulário de login, depois a executar o teste de front-end, a encontrar um bug e a voltar a pesquisar como corrigir esse erro. Cada “turno” de Devin é um ciclo de pensar → agir → observar → corrigir.
Múltiplas fontes notam que Devin possui “autocorreção” integrada (medium.com) (www.linkedin.com). De fato, o blog da Cognition com o GPT-5 menciona que o GPT-5 “é bom em entender erros e autocorriger-se”, o que eles destacam como ótimo para tarefas longas (www.linkedin.com). Em outras palavras, se o código de Devin não compilar ou falhar em um teste, o modelo (muitas vezes GPT-5 ou similar) verá a mensagem de erro e descobrirá uma correção em tempo real. Ele é até capaz de loops de nova tentativa: se uma ação for parcialmente bem-sucedida, Devin pode fazer uma segunda passagem. Esses loops são visíveis na UI como sequências repetidas de edição e execução.
Para lidar sistematicamente com falhas, Devin usa uma mistura de automação e supervisão humana. Por exemplo, se Devin abrir um pull request e receber uma falha de CI ou um comentário de revisão de código, o sistema da Cognition automaticamente despertará Devin do modo de espera e o fará resolver o problema (docs.devin.ai) (docs.devinenterprise.com). Por padrão, Devin responde a erros de lint ou comentários, embora os usuários possam desativar isso. A UI também destaca seu status e ações em tempo real, para que um desenvolvedor possa intervir a qualquer momento. Os desenvolvedores são incentivados a observar as primeiras execuções no “modo ao vivo” (onde cada passo é mostrado) para construir confiança, e então deixar Devin a funcionar totalmente sem interface uma vez que estejam confiantes (www.developersdigest.tech).
Segurança, Barreiras de Proteção e Personalização
Os operadores podem dar a Devin instruções explícitas sobre o que não fazer. Uma característica poderosa são as “Ações Proibidas”. Você pode listar coisas que Devin não tem permissão para tocar – por exemplo, “NÃO fazer push diretamente para a main” ou “Não editar o arquivo X.” O sistema garante que Devin respeita esses comandos quando aparecem no prompt ou em um Playbook (docs.devin.ai). De acordo com as notas de lançamento, Devin agora lida com listas de ações proibidas de forma fiável, o que significa que ele verifica suas ações contra essas regras. Isso ajuda a prevenir erros comuns, como modificar o branch ou arquivo errado.
Devin também oferece vários controles. No Slack ou na UI web, você pode dizer a Devin para “dormir” (pausar o trabalho) ou “arquivar” uma sessão (docs.devin.ai). Você pode escolher se Devin exige sua aprovação antes de executar um plano (através da configuração de Agência) ou se ele é executado de forma totalmente autônoma (docs.devin.ai) (docs.devin.ai). Seu uso de computação é medido em Unidades de Computação de Agente (ACUs), e a UI mostra avisos se Devin estiver prestes a atingir os limites, para que você possa intervir ou conceder mais recursos (docs.devin.ai).
Se algo der errado nos bastidores, a Cognition tem monitorização em vigor. Em lançamentos anteriores, alguns usuários relataram sessões de Devin “presas” ou travadas. A equipa observa que esses problemas foram corrigidos e oferece reembolsos de ACU se Devin travar (docs.devin.ai). Em outras palavras, a empresa está instrumentando ativamente o sistema para fiabilidade. Analistas externos alertam que, como qualquer IA baseada em chat, Devin pode produzir erros ou “alucinar” código ocasionalmente. A prática recomendada é revisar sua saída como você faria com o trabalho de um desenvolvedor júnior. Para segurança, muitas equipas usam revisões de código nos commits de Devin e restringem as permissões de Devin (por exemplo, sem acesso direto a segredos por padrão). Até agora, as barreiras de proteção publicamente descritas são principalmente definidas pelo usuário (ações proibidas, exigência de aprovação do plano, etc.) e verificações de saúde do sistema, em vez de filtros éticos integrados.
O Que (Ainda) Não Sabemos
A Cognition intencionalmente manteve alguns detalhes internos, então partes de Devin são opacas. Por exemplo, o modelo de linguagem grande exato que ele usa não era inicialmente público. Rumores e posts posteriores sugerem que a Cognition agora integra o GPT-5 ao Devin para seu núcleo de planeamento e raciocínio (www.linkedin.com), e eles têm um agente de pré-visualização baseado no Claude Sonnet 4.5 (docs.devinenterprise.com). Mas a arquitetura completa não é clara: Devin provavelmente orquestra vários modelos e tem ajuste fino personalizado (como sugerido pelo subagente de planeamento RFT), mas essas camadas não são de código aberto.
Também não conhecemos totalmente os limites de sua memória. Devin afirma “aprender ao longo do tempo”, mas como ele mescla novos conhecimentos em sua rede existente (em vez de apenas armazená-los no banco de Conhecimento) não é especificado. O comprimento máximo do histórico de conversas que ele usa eficazmente não é documentado. Quando uma sessão é muito longa, é possível que partes anteriores do chat ou do contexto do código sejam podadas nos bastidores. Na prática, a maioria dos usuários mantém os prompts e o código concisos para evitar a sobrecarga de contexto.
No lado da segurança, algumas incógnitas permanecem. Por exemplo, embora as “ações proibidas” cubram regras especificadas pelo usuário, não está claro se Devin possui alguma camada de segurança implícita (como detecção de uso indevido de dados, verificações de viés ou escapes de sandbox). Como ele é executado em uma VM, espera-se que ele não possa danificar os sistemas do host, mas detalhes sobre essa sandbox não são públicos. A comunidade infere que a máquina de Devin provavelmente usa instantâneos de contêiner (conforme mencionado para o treino de RL) para isolar as execuções (medium.com).
Finalmente, muitos na comunidade estão a observar como Devin lida com tarefas ambíguas ou abertas. O discurso de vendas o chama de “totalmente autônomo”, mas os analistas notam que ele ainda precisa frequentemente de instruções precisas. Por exemplo, se o prompt do usuário for vago, Devin pode gerar um plano que parece razoável, mas que ignora casos extremos importantes. Ele pode fazer perguntas esclarecedoras no acompanhamento, mas os desenvolvedores às vezes se perguntam quão bem ele entende a intenção versus apenas a correspondência de padrões no código. Esses aspetos da cognição de Devin dependem das capacidades do LLM subjacente, que observamos apenas indiretamente. Em suma, os usuários devem julgar Devin mais como um engenheiro júnior altamente qualificado do que um gerente de produto – ele planeia bem, mas pode nem sempre entender perfeitamente sua intenção.
Começando com Devin
Devin é principalmente direcionado a equipas de engenharia que fazem muito trabalho de codificação. Ele brilha em tarefas claramente definidas: construir recursos a partir de especificações, refatorar, escrever testes e corrigir bugs. É menos comprovado em design de alto nível ou problemas muito mal definidos. Para uma equipa de software, Devin pode ajudar a resolver o trabalho rotineiro para que os humanos se concentrem na arquitetura criativa e na supervisão.
Para não-codificadores ou novatos, Devin ainda pode ser útil, mas requer alguma configuração. O primeiro passo é dar a Devin acesso ao seu repositório de código (via GitHub, GitLab, etc.) e talvez conectá-lo ao Slack ou Teams. Em seguida, experimente uma tarefa simples. Por exemplo, pergunte: “Devin, adicione uma nova página para listar todos os produtos do nosso banco de dados na UI web, incluindo cobertura de testes.” Observe o diálogo da fase de planeamento: Devin delineará quais arquivos alterar (por exemplo, modelo HTML, código da API de backend, etc.) e fará as perguntas necessárias. Aprovê o plano (ou deixe-o executar automaticamente) e observe-o a executar. Use o painel “Seguir” para ver cada passo: você verá edições de arquivos, comandos shell (como a execução de suites de teste) e instantâneos do navegador da UI. Se Devin cometer um erro ou você quiser uma mudança, basta interagir como faria no chat (“Na verdade, use este tema CSS” ou “o título do produto deve estar em maiúsculas”), e Devin iniciará outro ciclo de edição.
O passo chave acionável é iterar e revisar. Sempre verifique o código que Devin produz e teste-o localmente. Com o tempo, você pode enriquecer o banco de Conhecimento: adicione notas como “Nosso banco de dados usa PostgreSQL 13” ou “Seguimos o estilo PSR-12 em PHP”. Devin começará a incorporar isso em sessões futuras. Explore também as configurações: desative a Agência se quiser sempre vetar propostas, ou ative-a se confiar mais. Vincule Devin ao seu CI para revisão automática de pull requests, mas comece com notificações para que você possa observar como ele lida com o feedback.
Em última análise, o fluxo de trabalho de Devin é denso e poderoso, mas ainda depende de você para orientação. Ao entender como ele planeia, usa ferramentas e aprende com o feedback (conforme detalhado acima), você pode aproveitar ao máximo esta nova classe de assistente de codificação agêntico. O melhor próximo passo para uma equipa interessada em Devin é se inscrever em devin.ai e executar um pequeno projeto piloto: adicione um repositório web, peça a Devin para implementar um recurso e deixe-o executar no modo de progresso. Observe o rastreamento completo de “pensamento” – essa experiência prática esclarecerá exatamente como Devin entrelaça o planeamento, a edição e a autocorreção. A partir daí, você pode escalar para mais tarefas e refinar seu uso (por exemplo, playbooks personalizados para o seu domínio). Embora ainda esteja em evolução, Devin representa um grande salto nas ferramentas de IA. Ao aprender seu fluxo de trabalho hoje, as equipas podem se preparar para uma era em que as tarefas de codificação podem ser verdadeiramente compartilhadas com um colega de equipa de IA.
Receba Novas Pesquisas e Episódios de Podcast sobre Codificação com IA
Assine para receber novas atualizações de pesquisa e episódios de podcast sobre ferramentas de codificação com IA, construtores de aplicativos com IA, ferramentas no-code, vibe coding e a criação de produtos online com IA.