Di Balik Alur Kerja Devin: Penggunaan Alat, Perencanaan, dan Otonomi

Di Balik Alur Kerja Devin: Penggunaan Alat, Perencanaan, dan Otonomi

26 April 2026

Pendahuluan

Devin (dari Cognition AI) adalah insinyur perangkat lunak AI otonom baru yang dapat merencanakan tugas pengembangan perangkat lunak dan melaksanakannya sebagian besar secara mandiri. Ia bekerja secara end-to-end pada proyek-proyek kode, menggunakan alat seperti editor kode, shell baris perintah, dan peramban web untuk meneliti, menulis, menguji, dan menerapkan kode. Dalam demo dan pemberitaan, Devin telah ditunjukkan memindai basis kode, menghasilkan rencana, mengedit berkas, menjalankan pengujian, dan membuat pull request dengan masukan manusia yang sangat minim (medium.com) (www.linkedin.com). Cognition mengklaim Devin dapat menangani “tugas rekayasa kompleks yang membutuhkan ribuan keputusan,” mengingat konteks pada setiap langkah dan bahkan belajar dari kesalahan (medium.com) (www.linkedin.com). Oleh karena itu, kami akan menjelajahi detail publik tentang desain dan alur kerja Devin. Ini termasuk bagaimana Devin memecah tugas (proses perencanaannya), bagaimana ia benar-benar bekerja di lingkungan pengembang (editor, terminal, peramban), bagaimana ia menyimpan memori atau konteks sepanjang sesi pengkodean, bagaimana ia mengoreksi diri dan berulang, serta pengaman atau langkah-langkah keselamatan apa yang digunakannya. Kami juga mencatat apa yang tidak diungkapkan – misalnya, internal model yang tepat tidak diungkapkan, sehingga beberapa diskusi komunitas bergantung pada dugaan yang berdasar.

Perencanaan dan Dekomposisi Tugas

Ketika seorang pengembang memberikan tugas baru kepada Devin, langkah pertama adalah merencanakan berkas mana yang akan diubah dan dalam urutan apa. Catatan Cognition menjelaskan bahwa Devin menggunakan sub-agen “mode perencanaan” yang tugasnya adalah mencari tahu berkas mana dalam repositori yang relevan dengan tugas tersebut (medium.com) (docs.devin.ai). Dalam praktiknya, Devin “menyelidiki” repo dan mengusulkan rencana sebelum menulis kode apa pun (docs.devin.ai) (docs.devin.ai). Untuk tugas-tugas kompleks, pengembang melihat rencana ini dan dapat menyetujui atau menyesuaikannya; jika mode Agency diaktifkan, Devin akan secara otomatis melanjutkan rencananya tanpa menunggu persetujuan (docs.devin.ai) (docs.devin.ai).

Di balik layar, Cognition melatih agen perencanaan ini dengan reinforcement learning. Dalam satu analisis, tim menjelaskan bahwa mereka hanya memberi perencana alat baca-saja (seperti ls, grep, atau read_file) dan memberinya penghargaan ketika berhasil memprediksi set berkas yang akan diedit oleh manusia (medium.com) (medium.com). Hasilnya: perencana Devin belajar mengeluarkan kueri sistem berkas paralel (misalnya menjalankan ls dan grep pada direktori berbeda secara bersamaan) dan kemudian mempersempit pilihan yang menjanjikan (medium.com). Hukuman pelatihan mendorong efisiensi, sehingga agen menghindari brute-force (misalnya grepping seluruh repo tanpa henti) dan malah segera “berkomitmen” setelah menemukan target (medium.com). Ini berarti perencanaan Devin didorong oleh data: ia telah mempelajari strategi navigasi basis kode generik (seperti yang dicatat Cognition, model ini dilatih pada banyak repo dan kueri pengguna) (medium.com) (medium.com).

Pada tingkat pengguna, Anda melihat hasilnya sebagai kerangka langkah-langkah. Misalnya, dengan permintaan fitur baru, Devin akan menyarankan sesuatu seperti “memodifikasi berkas A untuk mengimplementasikan X, menambahkan pengujian di berkas B, lalu memperbarui konfigurasi C.” Dalam demo, jika pengguna lupa menentukan beberapa detail, langkah perencanaan Devin sering menangkapnya dan meminta klarifikasi. Dalam satu demo, asisten secara otomatis menambahkan konfigurasi akun GitHub ke dalam rencana meskipun pengguna tidak menyebutkannya secara eksplisit (www.developersdigest.tech) (www.linkedin.com). Langkah-langkah perencanaan ini (bertanya, membuat daftar tugas, memetakan berkas) semuanya dilakukan dalam antarmuka dialog Devin sebelum kode apa pun ditulis. Jika pengguna setuju atau persetujuan otomatis aktif, Devin akan melanjutkan ke eksekusi.

Bekerja di Lingkungan Pengembang: Editor, Terminal, dan Peramban

Devin beroperasi dalam lingkungan pengembang yang terisolasi (sandboxed). Materi Cognition menggambarkannya memiliki perangkat pengembang yang akrab: terminal shell, editor kode, dan peramban web semuanya siap digunakan (medium.com) (docs.devin.ai). Dalam praktiknya, saat Devin berjalan, setiap hal yang dilakukannya dicatat dan terlihat di antarmuka web. Tampilan “Ikuti Devin” menyoroti setiap tindakan (seperti pengeditan berkas atau perintah shell) dan bahkan memungkinkan manusia mengklik ikon untuk melompat langsung ke editor kode atau terminal tempat tindakan itu terjadi (docs.devin.ai). Misalnya, jika Devin mengedit berkas JavaScript, pengguna dapat mengklik untuk melihat tampilan editor VSCode dengan perubahan, atau jika Devin menjalankan perintah shell, klik untuk melihat keluaran terminal.

Anda juga dapat masuk secara manual ke ruang kerja Devin jika Anda mau. Pembaruan terbaru menambahkan tombol “Gunakan Mesin Devin” yang membuka lingkungan Devin di VSCode melalui web (docs.devin.ai). Ini berarti pengembang dapat melihat berkas Devin, menjalankan perintah, atau bahkan mengedit kode secara manual di ruang kerjanya. (Untuk tugas-tugas yang berjalan lama, ini nyaman jika Anda ingin memeriksa sesuatu di tengah jalan.) Dalam satu contoh, seorang pengguna mengaktifkan ini untuk melihat Devin membuat elemen UI: pengguna benar-benar membuka VSCode Devin, melihat berkas baru yang ditulis Devin, dan dapat menjelajahi UI secara langsung.

Alat peramban memungkinkan Devin meneliti atau menguji hal-hal di Internet. Dalam demo, Devin terlihat menggunakan pencarian web untuk mencari dokumentasi atau pustaka, dan bahkan menjalankan server web lokal untuk memeriksa apakah kodenya tidak rusak (misalnya, ia akan mengarahkan peramban ke localhost untuk memverifikasi UI berfungsi). Secara keseluruhan, antarmuka Devin bersifat multimodal: ia dapat mengambil masukan seperti perintah teks, gambar desain atau dokumen terlampir, dan bahkan potongan kode, serta berinteraksi melalui obrolan dan alat pengembang ini (www.developersdigest.tech) (medium.com). Hasilnya adalah pengalaman yang jauh lebih dekat dengan “seorang rekan kerja yang menulis kode” daripada obrolan statis dengan AI.

Memori, Pengetahuan, dan Konteks Sesi

Devin melacak informasi sepanjang sesi menggunakan sistem “Pengetahuan” bawaan. Anggap Pengetahuan seperti buku catatan ruang kerja: Devin dapat menyimpan tip, instruksi khusus proyek, atau konteks penting di sana, dan mengingatnya nanti. Misalnya, dokumen menjelaskan alur kerja untuk *menjepit (pin) pengetahuan tertentu agar Devin tidak pernah melupakannya, seperti batasan arsitektur penting atau panduan gaya pengkodean (docs.devin.ai). Pengguna dapat mengedit atau menambah bank pengetahuan ini. Devin juga akan membuat catatan berguna secara otomatis: ia memindai repositori Anda untuk mempelajari struktur kode, komponen, dan dokumentasi Anda, serta membangun ringkasan “Pengetahuan Repo” secara otomatis (docs.devin.ai) (docs.devin.ai). Dalam praktiknya, setelah Anda menjalankan beberapa tugas, Devin mungkin berkata “Saya menyadari Anda sering menggunakan React dan Redux; saya menyarankan untuk menambahkannya ke Pengetahuan,” dan jika Anda menyetujui, informasi tersebut akan disimpan.

Selama sesi, Devin akan menyimpan pengetahuan yang relevan dalam memori kerja. Cognition mengklaim bahwa ia “mengingat konteks yang relevan di setiap langkah” (www.linkedin.com). Misalnya, jika sebelumnya ia mengetahui bahwa Anda lebih suka Python 3.11 atau aplikasi web Anda menggunakan OAuth, ia akan membawa informasi tersebut ke dalam perintah sesuai kebutuhan. Sesi secara inheren panjang dan stateful: Anda mungkin berbicara dengan Devin selama puluhan giliran (menit atau lebih) saat ia mengedit banyak berkas, dan ia mempertahankan riwayat obrolan. Jika Devin pernah rusak, Anda dapat menggulir log atau mengaktifkan “mode kemajuan” untuk melihat setiap tindakan yang dilakukannya.

Jika sesi Anda berakhir (misalnya, jika Anda menghentikan tugas atau menyelesaikannya), Devin melupakan status berjalan mesin tersebut, dan mesin virtualnya diatur ulang ke snapshot dasar lain kali (docs.devin.ai). Secara default, status dasar ini mencakup repositori yang telah Anda muat sebelumnya di ruang kerja Anda, sehingga Devin tidak perlu mengkloning dari awal setiap saat (docs.devin.ai). (Tanpa pengaturan ruang kerja, setiap sesi akan dimulai dengan mesin kosong, jadi Cognition menekankan pra-konfigurasi repositori Anda untuk kecepatan (docs.devin.ai).) Namun di luar kode, Devin memang membawa pengetahuan ke depan melalui bank Pengetahuannya. Ia akan meminta Anda untuk menambahkan pelajaran atau definisi yang terlihat berguna untuk tugas-tugas di masa mendatang (docs.devin.ai). Selama beberapa sesi, ini berarti Devin secara bertahap membangun memori tentang konvensi dan arsitektur proyek Anda.

Selain Pengetahuan, Cognition telah merilis DeepWiki, alat terkait yang mengindeks seluruh codebase dan menyediakan antarmuka obrolan di atasnya (medium.com). Meskipun DeepWiki adalah produk terpisah, ini menunjukkan arsitektur yang lebih luas: Devin dapat menanyakan wikinya sendiri atau wiki eksternal kode untuk menjawab pertanyaan. Dalam praktiknya, jika Anda bertanya kepada Devin sesuatu tentang kode, ia mungkin secara internal menggunakan sistem pengambilan yang sama dengan DeepWiki untuk mendasari jawabannya.

Otonomi, Iterasi, dan Koreksi Diri

Devin dirancang untuk menjadi otonom, tetapi dengan loop umpan balik saat dibutuhkan. Setelah perencanaan, ia menjalankan langkah-langkah satu per satu, terus-menerus memeriksa kesalahan. Dalam demo, agen sering mengikuti pola ini: ia menggunakan peramban atau dokumen untuk memahami masalah, menulis beberapa kode, menjalankannya, melihat kesalahan, dan kemudian mencari cara untuk memperbaikinya – meniru siklus debug manusia (www.developersdigest.tech) (www.linkedin.com). Misalnya, seorang presenter menunjukkan Devin menambahkan formulir login, lalu menjalankan pengujian front-end, menemukan bug, dan kembali meneliti cara memperbaiki kesalahan tersebut. Setiap “giliran” Devin adalah loop dari pikir → bertindak → amati → koreksi.

Beberapa sumber mencatat bahwa Devin memiliki “koreksi diri” yang terpasang (medium.com) (www.linkedin.com). Memang, blog Cognition dengan GPT-5 menyebutkan bahwa GPT-5 “pandai memahami kesalahan dan mengoreksi dirinya sendiri” yang mereka soroti sebagai hal yang bagus untuk tugas-tugas panjang (www.linkedin.com). Dengan kata lain, jika kode Devin tidak terkompilasi atau gagal dalam pengujian, model (seringkali GPT-5 atau yang serupa) akan melihat pesan kesalahan dan mencari tahu perbaikan secara langsung. Ia bahkan mampu melakukan retry loops: jika suatu tindakan berhasil sebagian, Devin dapat melakukan pass kedua. Loop ini terlihat di UI sebagai urutan edit-dan-jalankan yang berulang.

Untuk menangani kegagalan secara sistematis, Devin menggunakan campuran otomatisasi dan pengawasan manusia. Misalnya, jika Devin membuka pull request dan menerima kegagalan CI atau komentar code review, sistem Cognition akan secara otomatis membangunkan Devin dari tidur dan memintanya untuk mengatasi masalah tersebut (docs.devin.ai) (docs.devinenterprise.com). Secara default, Devin menanggapi kesalahan lint atau komentar, meskipun pengguna dapat menonaktifkan ini. UI juga menyoroti status dan tindakannya secara real-time, sehingga pengembang dapat campur tangan kapan saja. Pengembang didorong untuk menonton beberapa run pertama dalam “mode langsung” (di mana setiap langkah ditampilkan) untuk membangun kepercayaan, kemudian membiarkan Devin berjalan sepenuhnya tanpa pengawasan (headless) setelah yakin (www.developersdigest.tech).

Keamanan, Pengaman, dan Kustomisasi

Operator dapat memberikan instruksi eksplisit kepada Devin tentang apa yang tidak boleh dilakukan. Salah satu fitur yang kuat adalah “Tindakan Terlarang” (Forbidden Actions). Anda dapat membuat daftar hal-hal yang tidak boleh disentuh Devin – misalnya, “JANGAN dorong langsung ke main” atau “Jangan edit berkas X.” Sistem memastikan Devin menghormati perintah-perintah ini ketika muncul dalam prompt atau dalam Playbook (docs.devin.ai). Menurut catatan rilis, Devin sekarang menangani daftar tindakan terlarang secara andal, yang berarti ia memeriksa tindakannya terhadap aturan-aturan tersebut. Ini membantu mencegah kesalahan umum seperti memodifikasi cabang atau berkas yang salah.

Devin juga menyediakan berbagai kontrol. Di Slack atau antarmuka web, Anda dapat memberi tahu Devin untuk “tidur” (menjeda pekerjaan) atau “mengarsipkan” sesi (docs.devin.ai). Anda dapat memilih apakah Devin memerlukan persetujuan Anda sebelum mengeksekusi rencana (melalui pengaturan Agency) atau berjalan sepenuhnya secara otonom (docs.devin.ai) (docs.devin.ai). Penggunaan komputasinya diukur dalam Unit Komputasi Agen (ACU), dan UI menunjukkan peringatan jika Devin akan mencapai batas, sehingga Anda dapat campur tangan atau memberikan lebih banyak sumber daya (docs.devin.ai).

Jika terjadi kesalahan di balik layar, Cognition memiliki pemantauan yang tepat. Dalam rilis sebelumnya, beberapa pengguna melaporkan sesi Devin “macet” atau crash. Tim mencatat bahwa masalah tersebut telah diperbaiki dan menawarkan pengembalian dana ACU jika Devin macet (docs.devin.ai). Dengan kata lain, perusahaan secara aktif menginstrumen sistem untuk keandalan. Analis eksternal memperingatkan bahwa, seperti AI berbasis obrolan lainnya, Devin dapat menghasilkan kesalahan atau “berhalusinasi” kode sesekali. Praktik yang direkomendasikan adalah meninjau keluarannya seperti Anda meninjau pekerjaan seorang pengembang junior. Demi keamanan, banyak tim menggunakan code review pada komit Devin, dan membatasi izin Devin (misalnya, tidak ada akses langsung ke rahasia secara default). Sejauh ini, pengaman yang dijelaskan secara publik sebagian besar adalah yang ditentukan pengguna (tindakan terlarang, memerlukan persetujuan rencana, dll.) dan pemeriksaan kesehatan sistem, bukan filter etis bawaan.

Apa yang Belum (Kita) Ketahui

Cognition sengaja menyimpan beberapa detail secara internal, sehingga sebagian Devin tidak transparan. Misalnya, model bahasa besar yang tepat yang digunakannya awalnya tidak publik. Rumor dan postingan selanjutnya menunjukkan bahwa Cognition kini mengintegrasikan GPT-5 ke dalam Devin sebagai inti perencanaan dan penalaran (www.linkedin.com), dan mereka memiliki agen preview berdasarkan Claude Sonnet 4.5 (docs.devinenterprise.com). Namun arsitektur lengkapnya tidak jelas: Devin kemungkinan mengorkestrasi beberapa model dan memiliki finetuning kustom (seperti yang diisyaratkan oleh sub-agen perencanaan RFT), tetapi lapisan-lapisan tersebut tidak open-source.

Kita juga tidak sepenuhnya mengetahui batas memorinya. Devin mengklaim “belajar seiring waktu,” tetapi bagaimana ia menggabungkan pengetahuan baru ke dalam jaringannya yang ada (versus hanya menyimpannya di bank Pengetahuan) tidak ditentukan. Panjang maksimum riwayat percakapan yang efektif digunakannya tidak didokumentasikan. Ketika sesi sangat panjang, ada kemungkinan bagian-bagian awal obrolan atau konteks kode terhapus di balik layar. Secara praktis, sebagian besar pengguna menjaga prompt dan kode tetap ringkas untuk menghindari context overload.

Dari sisi keamanan, beberapa hal yang belum diketahui masih ada. Misalnya, meskipun “tindakan terlarang” mencakup aturan yang ditentukan pengguna, tidak jelas apakah Devin memiliki lapisan keamanan implisit (seperti mendeteksi penyalahgunaan data, pemeriksaan bias, atau sandbox escapes). Karena ia berjalan di VM, kita berharap ia tidak dapat merusak sistem host, tetapi detail tentang sandboxing tersebut tidak publik. Komunitas menyimpulkan bahwa mesin Devin kemungkinan menggunakan container snapshots (seperti yang disebutkan untuk pelatihan RL) untuk mengisolasi run (medium.com).

Akhirnya, banyak di komunitas yang mengamati bagaimana Devin menangani tugas yang ambigu atau terbuka (open-ended). Sales pitch menyebutnya “sepenuhnya otonom,” tetapi analis mencatat bahwa ia masih sering membutuhkan instruksi yang tepat. Misalnya, jika prompt pengguna tidak jelas, Devin mungkin menghasilkan rencana yang terlihat masuk akal tetapi melewatkan edge case penting. Ia mungkin mengajukan pertanyaan klarifikasi di tindak lanjut, tetapi pengembang terkadang bertanya-tanya seberapa baik ia memahami niat versus hanya mencocokkan pola pada kode. Aspek-aspek kognisi Devin ini bergantung pada kemampuan LLM yang mendasarinya, yang hanya kita amati secara tidak langsung. Singkatnya, pengguna harus menilai Devin lebih sebagai insinyur junior yang sangat terampil daripada seorang manajer produk – ia merencanakan dengan baik, tetapi mungkin tidak selalu memahami niat Anda dengan sempurna.

Memulai dengan Devin

Devin terutama ditujukan untuk tim rekayasa yang melakukan banyak pekerjaan pengkodean. Ia sangat unggul dalam tugas-tugas yang didefinisikan dengan jelas: membangun fitur dari spesifikasi, refactoring, menulis pengujian, dan memperbaiki bug. Ia kurang terbukti dalam desain tingkat tinggi atau masalah yang sangat tidak terdefinisi. Untuk tim perangkat lunak, Devin dapat membantu menyelesaikan pekerjaan rutin sehingga manusia dapat fokus pada arsitektur kreatif dan pengawasan.

Untuk non-pemrogram atau pendatang baru, Devin masih dapat berguna tetapi membutuhkan beberapa pengaturan. Langkah pertama adalah memberi Devin akses ke repositori kode Anda (melalui GitHub, GitLab, dll.) dan mungkin menghubungkannya di Slack atau Teams. Kemudian coba tugas sederhana. Misalnya, tanyakan: “Devin, tambahkan halaman baru untuk mencantumkan semua produk dari basis data kami di UI web, termasuk cakupan pengujian.” Perhatikan dialog fase perencanaan: Devin akan menguraikan berkas mana yang akan diubah (misalnya templat HTML, kode API backend, dll.) dan mengajukan pertanyaan yang diperlukan. Setujui rencana (atau biarkan berjalan otomatis), dan lihat ia mengeksekusi. Gunakan panel “Ikuti” untuk melihat setiap langkah: Anda akan melihat pengeditan berkas, perintah shell (seperti menjalankan suite pengujian), dan snapshot peramban UI. Jika Devin membuat kesalahan atau Anda ingin perubahan, cukup berinteraksi seperti yang Anda lakukan dalam obrolan (“Sebenarnya, gunakan tema CSS ini” atau “judul produk harus huruf besar”), dan Devin akan memulai loop edit lainnya.

Langkah utama yang dapat ditindaklanjuti adalah iterasi dan tinjauan. Selalu periksa kode yang dihasilkan Devin dan uji secara lokal. Seiring waktu, Anda dapat memperkaya bank Pengetahuan: tambahkan catatan seperti “Basis data kami menggunakan PostgreSQL 13” atau “Kami mengikuti gaya PSR-12 di PHP”. Devin akan mulai menggabungkan ini dalam sesi mendatang. Jelajahi juga pengaturannya: matikan Agency jika Anda selalu ingin meninjau proposal, atau hidupkan jika Anda lebih mempercayainya. Hubungkan Devin ke CI Anda untuk tinjauan pull request otomatis, tetapi mulailah dengan notifikasi sehingga Anda dapat melihat bagaimana ia menangani umpan balik.

Pada akhirnya, alur kerja Devin padat dan kuat, tetapi ia masih bergantung pada Anda untuk panduan. Dengan memahami bagaimana ia merencanakan, menggunakan alat, dan belajar dari umpan balik (seperti yang dijelaskan di atas), Anda dapat memaksimalkan kelas baru asisten pengkodean agenik ini. Langkah terbaik berikutnya untuk tim yang tertarik pada Devin adalah mendaftar di devin.ai dan menjalankan pilot kecil: tambahkan satu repo web, minta Devin untuk mengimplementasikan fitur, dan biarkan berjalan dalam mode progres. Amati jejak “pemikiran” lengkap – pengalaman langsung itu akan memperjelas bagaimana Devin menjalin perencanaan, pengeditan, dan koreksi diri bersama. Dari sana, Anda dapat meningkatkan ke lebih banyak tugas dan menyempurnakan penggunaannya (misalnya, playbook kustom untuk domain Anda). Meskipun masih berkembang, Devin mewakili lompatan besar dalam peralatan AI. Dengan mempelajari alur kerjanya hari ini, tim dapat mempersiapkan era di mana tugas pengkodean benar-benar dapat dibagikan dengan rekan tim AI.

Dapatkan Riset & Episode Podcast Kode AI Terbaru

Berlangganan untuk menerima pembaruan riset baru dan episode podcast tentang alat kode AI, pembangun aplikasi AI, alat tanpa kode, vibe coding, dan membangun produk online dengan AI.