El Flujo de Trabajo de Devin: Uso de Herramientas, Planificación y Autonomía

26 de abril de 2026

asistente de codificación de IA desarrollador autónomo Cognition AI agente Devin IA de planificación de tareas herramientas de desarrollador memoria de IA salvaguardias de seguridad

Introducción

Devin (de Cognition AI) es un nuevo ingeniero de software de IA autónomo que puede planificar tareas de desarrollo de software y llevarlas a cabo en gran medida por sí mismo. Trabaja de principio a fin en proyectos de código, utilizando herramientas como un editor de código, una terminal de línea de comandos y un navegador web para investigar, escribir, probar e implementar código. En demostraciones y prensa, se ha mostrado a Devin escaneando una base de código, generando un plan, editando archivos, ejecutando pruebas y creando solicitudes de extracción (pull requests) con sorprendentemente poca intervención humana (medium.com) (www.linkedin.com). Cognition afirma que Devin puede manejar “tareas de ingeniería complejas que requieren miles de decisiones,” recordando el contexto en cada paso e incluso aprendiendo de sus errores (medium.com) (www.linkedin.com). Por lo tanto, exploramos los detalles públicos del diseño y flujo de trabajo de Devin. Esto incluye cómo Devin descompone las tareas (su proceso de planificación), cómo funciona literalmente en un entorno de desarrollador (editor, terminal, navegador), cómo mantiene la memoria o el contexto a lo largo de una sesión de codificación, cómo se autocorrige e itera, y qué salvaguardias o medidas de seguridad utiliza. También señalamos lo que no se revela; por ejemplo, los detalles internos exactos del modelo no se divulgan, por lo que algunas discusiones de la comunidad se basan en conjeturas bien informadas.

Planificación y Descomposición de Tareas

Cuando un desarrollador le asigna una nueva tarea a Devin, el primer paso es planificar qué archivos cambiar y en qué orden. Las notas de Cognition explican que Devin utiliza un subagente en “modo de planificación” cuya función es determinar qué archivos del repositorio son relevantes para la tarea (medium.com) (docs.devin.ai). En la práctica, Devin “investiga” el repositorio y propone un plan antes de escribir cualquier código (docs.devin.ai) (docs.devin.ai). Para tareas complejas, los desarrolladores ven este plan y pueden aprobarlo o ajustarlo; si el modo Agency está habilitado, Devin procederá automáticamente con su plan sin esperar aprobación (docs.devin.ai) (docs.devin.ai).

Detrás de escena, Cognition entrenó a este agente de planificación con aprendizaje por refuerzo. En un análisis, el equipo describe cómo le dieron al planificador solo herramientas de solo lectura (como ls, grep o read_file) y lo recompensaron cuando predecía correctamente el conjunto de archivos que un humano editaría (medium.com) (medium.com). El resultado: el planificador de Devin aprende a emitir consultas paralelas al sistema de archivos (por ejemplo, ejecutar ls y grep en diferentes directorios a la vez) y luego a reducir las posibles opciones (medium.com). La penalización del entrenamiento fomenta la eficiencia, por lo que el agente evita la fuerza bruta (por ejemplo, buscar con grep en todo el repositorio interminablemente) y, en cambio, se “compromete” rápidamente una vez que encuentra un objetivo (medium.com). Esto significa que la planificación de Devin está basada en datos: ha aprendido estrategias genéricas de navegación de bases de código (como señala Cognition, el modelo fue entrenado con muchos repositorios y consultas de usuarios) (medium.com) (medium.com).

A nivel de usuario, el resultado se presenta como un esquema de pasos. Por ejemplo, con una nueva solicitud de función, Devin sugerirá algo como “modificar el archivo A para implementar X, agregar pruebas en el archivo B y luego actualizar la configuración C.” En las demostraciones, si un usuario olvidaba especificar algunos detalles, el paso de planificación de Devin a menudo lo detecta y solicita una aclaración. En una demostración, el asistente agregó automáticamente la configuración de una cuenta de GitHub al plan, aunque el usuario no lo mencionó explícitamente (www.developersdigest.tech) (www.linkedin.com). Estos pasos de planificación (hacer preguntas, listar tareas, mapear archivos) se realizan dentro de la interfaz de diálogo de Devin antes de que se escriba cualquier código. Si el usuario está de acuerdo o la aprobación automática está activada, Devin pasa a la ejecución.

Trabajando en un Entorno de Desarrollo: Editor, Terminal y Navegador

Devin opera dentro de un entorno de desarrollador en sandbox. Los materiales de Cognition lo describen como poseedor de un conjunto de herramientas de desarrollador familiar: una terminal de shell, un editor de código y un navegador web a su disposición (medium.com) (docs.devin.ai). En la práctica, cuando Devin se ejecuta, todo lo que hace se registra y es visible en la interfaz de usuario web. Una vista “Seguir a Devin” resalta cada acción (como la edición de un archivo o un comando de shell) e incluso permite a un humano hacer clic en un icono para saltar directamente al editor de código o a la terminal donde ocurrió esa acción (docs.devin.ai). Por ejemplo, si Devin edita un archivo JavaScript, un usuario puede hacer clic para ver la vista del editor VSCode con los cambios, o si Devin ejecuta un comando de shell, hacer clic para ver la salida de la terminal.

También puedes acceder manualmente al espacio de trabajo de Devin si lo deseas. Una actualización reciente agregó un botón “Usar la Máquina de Devin” que abre el entorno de Devin en VSCode a través de la web (docs.devin.ai). Esto significa que un desarrollador puede echar un vistazo a los archivos de Devin, ejecutar comandos o incluso editar código manualmente en su espacio de trabajo. (Para tareas de larga duración, esto es conveniente si deseas inspeccionar algo en medio del proceso.) En un ejemplo, un usuario activó esto para ver a Devin crear elementos de interfaz de usuario: el usuario abrió literalmente el VSCode de Devin, vio los nuevos archivos que Devin escribió y pudo explorar la interfaz de usuario en vivo.

La herramienta de navegador permite a Devin investigar o probar cosas en Internet. En las demostraciones se ve a Devin utilizando la búsqueda web para consultar documentación o bibliotecas, e incluso ejecutando el servidor web local para comprobar que su código no está roto (por ejemplo, apuntará un navegador a localhost para verificar que la interfaz de usuario funciona). En definitiva, la interfaz de Devin es multimodal: puede recibir entradas como indicaciones de texto, imágenes de diseño o documentos adjuntos, e incluso fragmentos de código, y interactúa tanto a través del chat como de estas herramientas de desarrollador (www.developersdigest.tech) (medium.com). El resultado es una experiencia mucho más cercana a “un colega escribiendo código” que a un chat estático con una IA.

Memoria, Conocimiento y Contexto de Sesión

Devin rastrea la información a lo largo de una sesión utilizando un sistema “Knowledge” incorporado. Piensa en Knowledge como un cuaderno de espacio de trabajo: Devin puede almacenar consejos, instrucciones específicas del proyecto o contexto importante allí, y recordarlo más tarde. Por ejemplo, la documentación describe flujos de trabajo para fijar cierto conocimiento para que Devin nunca lo olvide, como restricciones arquitectónicas importantes o guías de estilo de codificación (docs.devin.ai). Los usuarios pueden editar o añadir a este banco de conocimientos. Devin también auto-generará notas útiles: escanea tu repositorio para aprender sobre la estructura del código, los componentes y tu documentación, y construye automáticamente un resumen de “Conocimiento del Repositorio” (docs.devin.ai) (docs.devin.ai). En la práctica, después de ejecutar algunas tareas, Devin podría decir “Noté que a menudo usas React y Redux; sugiero agregar eso a Knowledge”, y si lo apruebas, esa información se guarda.

Durante una sesión, Devin mantendrá el conocimiento relevante en la memoria de trabajo. Cognition afirma que “recuerda el contexto relevante en cada paso” (www.linkedin.com). Por ejemplo, si anteriormente aprendió que prefieres Python 3.11 o que tu aplicación web usa OAuth, incorporará esa información en las indicaciones según sea necesario. La sesión es inherentemente larga y con estado: puedes hablar con Devin durante docenas de turnos (minutos o más) mientras edita muchos archivos, y retiene el historial de chat. Si Devin alguna vez falla, puedes desplazarte por el registro o activar el “modo de progreso” para ver cada acción que realizó.

Si tu sesión termina (por ejemplo, si detienes la tarea o finalizas), Devin olvida el estado de ejecución de esa máquina, y su máquina virtual se restablece a una instantánea base la próxima vez (docs.devin.ai). Por defecto, este estado base incluye los repositorios que has precargado en tu espacio de trabajo, para que Devin no tenga que clonarlos desde cero cada vez (docs.devin.ai). (Sin la configuración del espacio de trabajo, cada sesión comenzaría con una máquina vacía, por lo que Cognition enfatiza la preconfiguración de tu repositorio para mayor velocidad (docs.devin.ai).) Pero más allá del código, Devin sí traslada el conocimiento a través de su banco de Knowledge. Te pedirá que añadas lecciones o definiciones que parezcan útiles para futuras tareas (docs.devin.ai). A lo largo de múltiples sesiones, esto significa que Devin construye gradualmente una memoria de las convenciones y la arquitectura de tu proyecto.

Además de Knowledge, Cognition ha lanzado DeepWiki, una herramienta relacionada que indexa bases de código completas y proporciona una interfaz de chat sobre ellas (medium.com). Aunque DeepWiki es un producto separado, sugiere la arquitectura más amplia: Devin puede consultar su propia wiki o una externa del código para responder preguntas. En la práctica, si le preguntas a Devin algo sobre el código, internamente puede utilizar los mismos sistemas de recuperación que DeepWiki para fundamentar sus respuestas.

Autonomía, Iteración y Autocorrección

Devin está diseñado para ser autónomo, pero con bucles de retroalimentación cuando sea necesario. Después de planificar, ejecuta los pasos uno por uno, comprobando constantemente si hay errores. En las demostraciones, el agente sigue frecuentemente este patrón: usa el navegador o la documentación para entender un problema, escribe algo de código, lo ejecuta, ve un error y luego busca cómo solucionarlo, imitando un ciclo de depuración humano (www.developersdigest.tech) (www.linkedin.com). Por ejemplo, un presentador muestra a Devin añadiendo un formulario de inicio de sesión, luego ejecutando la prueba de front-end, encontrando un error y volviendo a investigar cómo solucionar ese error. Cada “turno” de Devin es un bucle de pensar → actuar → observar → corregir.

Múltiples fuentes señalan que Devin tiene “autocorrección” incorporada (medium.com) (www.linkedin.com). De hecho, el blog de Cognition con GPT-5 menciona que GPT-5 “es bueno para comprender errores y autocorregirse”, lo que destacan como excelente para tareas largas (www.linkedin.com). En otras palabras, si el código de Devin no compila o falla una prueba, el modelo (a menudo GPT-5 o similar) verá el mensaje de error y encontrará una solución sobre la marcha. Incluso es capaz de bucles de reintento: si una acción tiene éxito parcial, Devin puede hacer una segunda pasada. Estos bucles son visibles en la interfaz de usuario como secuencias repetidas de edición y ejecución.

Para manejar sistemáticamente las fallas, Devin utiliza una combinación de automatización y supervisión humana. Por ejemplo, si Devin abre una solicitud de extracción (pull request) y recibe un fallo de CI o un comentario de revisión de código, el sistema de Cognition automáticamente despertará a Devin y hará que aborde el problema (docs.devin.ai) (docs.devinenterprise.com). Por defecto, Devin responde a errores de lint o comentarios, aunque los usuarios pueden desactivar esto. La interfaz de usuario también resalta su estado y acciones en tiempo real, para que un desarrollador pueda intervenir en cualquier momento. Se anima a los desarrolladores a observar las primeras ejecuciones en “modo en vivo” (donde se muestra cada paso) para generar confianza, y luego dejar que Devin se ejecute completamente sin interfaz una vez que tengan seguridad (www.developersdigest.tech).

Seguridad, Salvaguardias y Personalización

Los operadores pueden darle a Devin instrucciones explícitas sobre qué no hacer. Una característica poderosa son las “Acciones Prohibidas”. Puedes listar cosas que Devin no tiene permitido tocar, por ejemplo, “NO hagas push directamente a main” o “No edites el archivo X.” El sistema asegura que Devin respete estos comandos cuando aparecen en la indicación o en un Playbook (docs.devin.ai). Según las notas de lanzamiento, Devin ahora maneja las listas de acciones prohibidas de forma fiable, lo que significa que verifica sus acciones contra esas reglas. Esto ayuda a prevenir errores comunes como modificar la rama o el archivo incorrecto.

Devin también ofrece varios controles. En Slack o en la interfaz de usuario web, puedes indicarle a Devin que “duerma” (pause el trabajo) o “archive” una sesión (docs.devin.ai). Puedes elegir si Devin requiere tu aprobación antes de ejecutar un plan (mediante la configuración de Agency) o si se ejecuta de forma completamente autónoma (docs.devin.ai) (docs.devin.ai). Su uso de cómputo se mide en Unidades de Cómputo de Agente (ACU), y la interfaz de usuario muestra advertencias si Devin está a punto de alcanzar los límites, para que puedas intervenir o conceder más recursos (docs.devin.ai).

Si algo sale mal detrás de escena, Cognition tiene implementada una monitorización. En versiones anteriores, algunos usuarios reportaron sesiones de Devin “atascadas” o caídas. El equipo señala que esos problemas han sido solucionados y ofrece reembolsos de ACU si Devin se cuelga (docs.devin.ai). En otras palabras, la empresa está instrumentando activamente el sistema para su fiabilidad. Analistas externos advierten que, como cualquier IA basada en chat, Devin puede producir errores o “alucinar” código ocasionalmente. La práctica recomendada es revisar su salida como lo harías con el trabajo de un desarrollador junior. Por seguridad, muchos equipos utilizan revisiones de código en los commits de Devin y restringen los permisos de Devin (por ejemplo, sin acceso directo a secretos por defecto). Hasta ahora, las salvaguardias descritas públicamente son en su mayoría definidas por el usuario (acciones prohibidas, requerimiento de aprobación de planes, etc.) y verificaciones de salud del sistema, en lugar de filtros éticos incorporados.

Lo Que (Todavía) No Sabemos

Cognition ha mantenido intencionalmente algunos detalles internos, por lo que partes de Devin son opacas. Por ejemplo, el modelo de lenguaje grande exacto que utiliza no fue inicialmente público. Los rumores y publicaciones posteriores sugieren que Cognition ahora integra GPT-5 en Devin para su núcleo de planificación y razonamiento (www.linkedin.com), y tienen un agente de vista previa basado en Claude Sonnet 4.5 (docs.devinenterprise.com). Pero la arquitectura completa no está clara: Devin probablemente orquesta múltiples modelos y tiene un ajuste fino personalizado (como sugiere el subagente de planificación RFT), pero esas capas no son de código abierto.

Tampoco conocemos completamente los límites de su memoria. Devin afirma “aprender con el tiempo”, pero cómo fusiona el nuevo conocimiento en su red existente (en lugar de solo almacenarlo en el banco de Knowledge) no está especificado. La longitud máxima del historial de conversación que utiliza eficazmente no está documentada. Cuando una sesión es muy larga, es posible que partes anteriores del chat o del contexto del código se eliminen entre bastidores. En la práctica, la mayoría de los usuarios mantienen las indicaciones y el código concisos para evitar la sobrecarga de contexto.

En cuanto a la seguridad, persisten algunas incógnitas. Por ejemplo, si bien las “acciones prohibidas” cubren reglas especificadas por el usuario, no está claro si Devin tiene alguna capa de seguridad implícita (como la detección de uso indebido de datos, verificaciones de sesgos o escapes del sandbox). Dado que se ejecuta en una VM, se espera que no pueda dañar los sistemas host, pero los detalles sobre ese sandboxing no son públicos. La comunidad infiere que la máquina de Devin probablemente utiliza instantáneas de contenedores (como se mencionó para el entrenamiento de RL) para aislar las ejecuciones (medium.com).

Finalmente, muchos en la comunidad están observando cómo Devin maneja tareas ambiguas o de final abierto. El argumento de venta lo llama “totalmente autónomo”, pero los analistas señalan que a menudo todavía necesita instrucciones precisas. Por ejemplo, si la indicación del usuario es vaga, Devin podría generar un plan que parezca razonable pero que omita casos de borde importantes. Puede hacer preguntas aclaratorias de seguimiento, pero los desarrolladores a veces se preguntan qué tan bien comprende la intención en comparación con solo la coincidencia de patrones en el código. Estos aspectos de la cognición de Devin dependen de las capacidades del LLM subyacente, que solo observamos indirectamente. En resumen, los usuarios deberían juzgar a Devin más como un ingeniero junior altamente capacitado que como un gerente de producto: planifica bien, pero es posible que no siempre comprenda perfectamente tu intención.

Cómo Empezar con Devin

Devin está dirigido principalmente a equipos de ingeniería que realizan mucho trabajo de codificación. Destaca en tareas claramente definidas: construir funcionalidades a partir de especificaciones, refactorizar, escribir pruebas y corregir errores. Está menos probado en diseño de alto nivel o problemas muy mal definidos. Para un equipo de software, Devin puede ayudar a eliminar el trabajo rutinario para que los humanos se centren en la arquitectura creativa y la supervisión.

Para no-programadores o recién llegados, Devin aún puede ser útil pero requiere cierta configuración. El primer paso es darle a Devin acceso a tu repositorio de código (a través de GitHub, GitLab, etc.) y quizás conectarlo en Slack o Teams. Luego, intenta una tarea sencilla. Por ejemplo, pregunta: “Devin, añade una nueva página para listar todos los productos de nuestra base de datos en la interfaz de usuario web, incluyendo la cobertura de pruebas.” Observa el diálogo de la fase de planificación: Devin esbozará qué archivos cambiar (por ejemplo, plantilla HTML, código API de backend, etc.) y hará las preguntas necesarias. Aprueba el plan (o deja que se ejecute automáticamente) y observa su ejecución. Usa el panel “Seguir” para ver cada paso: verás ediciones de archivos, comandos de shell (como ejecutar suites de pruebas) y capturas de pantalla del navegador de la interfaz de usuario. Si Devin comete un error o deseas un cambio, simplemente interactúa como lo harías en un chat (“En realidad, usa este tema CSS” o “el título del producto debe estar en mayúsculas”), y Devin comenzará otro bucle de edición.

El paso clave y accionable es iterar y revisar. Siempre revisa el código que Devin produce y pruébalo localmente. Con el tiempo, puedes enriquecer el banco de Knowledge: añade notas como “Nuestra base de datos usa PostgreSQL 13” o “Seguimos el estilo PSR-12 en PHP”. Devin comenzará a incorporar esto en futuras sesiones. También explora la configuración: desactiva Agency si quieres siempre revisar las propuestas, o actívala si confías más en ella. Vincula a Devin con tu CI para la revisión automática de solicitudes de extracción, pero empieza con notificaciones para que puedas observar cómo maneja la retroalimentación.

En última instancia, el flujo de trabajo de Devin es denso y potente, pero aún depende de ti para obtener orientación. Al comprender cómo planifica, utiliza herramientas y aprende de la retroalimentación (como se detalla anteriormente), puedes sacar el máximo provecho de esta nueva clase de asistente de codificación agéntico. El mejor siguiente paso para un equipo interesado en Devin es registrarse en devin.ai y ejecutar un pequeño piloto: añadir un repositorio web, pedirle a Devin que implemente una característica y dejarlo ejecutar en modo de progreso. Observa el rastro completo de “pensamiento”; esa experiencia práctica aclarará exactamente cómo Devin entrelaza la planificación, la edición y la autocorrección. A partir de ahí, puedes escalar a más tareas y ajustar su uso (por ejemplo, playbooks personalizados para tu dominio). Aunque todavía está evolucionando, Devin representa un gran avance en las herramientas de IA. Al aprender su flujo de trabajo hoy, los equipos pueden prepararse para una era en la que las tareas de codificación realmente se pueden compartir con un compañero de equipo de IA.

Reciba nuevas investigaciones y episodios de podcast sobre codificación con IA

Suscríbase para recibir nuevas actualizaciones de investigación y episodios de podcast sobre herramientas de codificación con IA, creadores de aplicaciones con IA, herramientas sin código, 'vibe coding' y construcción de productos en línea con IA.

← Volver a AI Builds It: Easy Coding Tools