เจาะลึกเวิร์กโฟลว์ของ Devin: การใช้เครื่องมือ, การวางแผน, และความเป็นอิสระ

เจาะลึกเวิร์กโฟลว์ของ Devin: การใช้เครื่องมือ, การวางแผน, และความเป็นอิสระ

26 เมษายน 2569

บทนำ

Devin (จาก Cognition AI) คือ วิศวกรซอฟต์แวร์ AI อัตโนมัติ ใหม่ล่าสุดที่สามารถวางแผนงานพัฒนาซอฟต์แวร์และดำเนินการส่วนใหญ่ได้ด้วยตัวเอง มันทำงานแบบครบวงจรตั้งแต่ต้นจนจบสำหรับโปรเจกต์โค้ด โดยใช้เครื่องมือต่างๆ เช่น ตัวแก้ไขโค้ด (code editor), เชลล์บรรทัดคำสั่ง (command-line shell) และเว็บเบราว์เซอร์ เพื่อค้นคว้า, เขียน, ทดสอบ และปรับใช้โค้ด ในงานสาธิตและการเผยแพร่ข่าว Devin ได้แสดงให้เห็นถึงความสามารถในการ สแกนโค้ดเบส, สร้างแผน, แก้ไขไฟล์, รันการทดสอบ และสร้างพูลรีเควสต์ โดยมีการป้อนข้อมูลจากมนุษย์น้อยอย่างน่าประหลาดใจ (medium.com) (www.linkedin.com) Cognition อ้างว่า Devin สามารถจัดการ “งานวิศวกรรมที่ซับซ้อนซึ่งต้องมีการตัดสินใจหลายพันครั้ง” โดยการเรียกคืนบริบทในแต่ละขั้นตอนและแม้กระทั่งเรียนรู้จากข้อผิดพลาด (medium.com) (www.linkedin.com). ดังนั้น เราจึงสำรวจรายละเอียดสาธารณะของการออกแบบและเวิร์กโฟลว์ของ Devin ซึ่งรวมถึงวิธีการที่ Devin แบ่งงาน (กระบวนการวางแผน), วิธีการทำงานในสภาพแวดล้อมนักพัฒนา (editor, terminal, browser), วิธีการเก็บความทรงจำหรือบริบทตลอดเซสชันการเขียนโค้ด, วิธีการแก้ไขและทำซ้ำด้วยตัวเอง, และมาตรการป้องกันหรือความปลอดภัยที่ใช้ เรายังสังเกตเห็นสิ่งที่ ไม่ ได้เปิดเผย—เช่น รายละเอียดภายในของโมเดลยังไม่เปิดเผย ดังนั้นการอภิปรายของชุมชนบางส่วนจึงอาศัยการคาดเดาจากความรู้

การวางแผนและแบ่งงาน

เมื่อนักพัฒนาให้งานใหม่แก่ Devin ขั้นตอนแรกคือ การวางแผน ว่าจะแก้ไขไฟล์ใดบ้างและเรียงลำดับอย่างไร บันทึกของ Cognition อธิบายว่า Devin ใช้ซับเอเจนต์ "โหมดการวางแผน" ที่มีหน้าที่ในการค้นหา ว่าไฟล์ใดใน repository มีความเกี่ยวข้อง กับงาน (medium.com) (docs.devin.ai) ในทางปฏิบัติ Devin จะ "ตรวจสอบ" repo และเสนอแผนก่อนที่จะเขียนโค้ดใดๆ (docs.devin.ai) (docs.devin.ai) สำหรับงานที่ซับซ้อน นักพัฒนาจะเห็นแผนนี้และสามารถอนุมัติหรือปรับเปลี่ยนได้; หากเปิดใช้งานโหมด Agency Devin จะดำเนินการตามแผนโดยอัตโนมัติโดยไม่ต้องรอการอนุมัติ (docs.devin.ai) (docs.devin.ai)

เบื้องหลัง Cognition ได้ฝึกฝนเอเจนต์การวางแผนนี้ด้วยการเรียนรู้แบบเสริมแรง (reinforcement learning) ในการวิเคราะห์หนึ่ง ทีมงานอธิบายว่าได้ให้เครื่องมืออ่านอย่างเดียว (read-only tools) แก่ตัววางแผน (เช่น ls, grep, หรือ read_file) และให้รางวัลเมื่อมันทายชุดไฟล์ที่มนุษย์จะแก้ไขได้อย่างถูกต้อง (medium.com) (medium.com) ผลลัพธ์: ตัววางแผนของ Devin เรียนรู้ที่จะออก คำสั่ง query ระบบไฟล์แบบขนาน (เช่น รัน ls และ grep พร้อมกันในไดเรกทอรีที่แตกต่างกัน) จากนั้นจึงจำกัดการค้นหาให้แคบลง (medium.com) บทลงโทษในการฝึกช่วยส่งเสริมประสิทธิภาพ ทำให้เอเจนต์หลีกเลี่ยงการ brute-force (เช่น grepping ทั้ง repo อย่างไม่มีที่สิ้นสุด) และจะ " commit" ทันทีที่พบเป้าหมาย (medium.com) ซึ่งหมายความว่าการวางแผนของ Devin นั้นขับเคลื่อนด้วยข้อมูล: มันได้เรียนรู้ กลยุทธ์การนำทางโค้ดเบสแบบทั่วไป (ตามที่ Cognition ระบุ โมเดลได้รับการฝึกฝนจาก repo จำนวนมากและคำสั่ง query ของผู้ใช้) (medium.com) (medium.com)

ในระดับผู้ใช้ คุณจะเห็นผลลัพธ์เป็นโครงร่างของขั้นตอนต่างๆ ตัวอย่างเช่น หากมีการร้องขอคุณสมบัติใหม่ Devin จะแนะนำบางอย่างเช่น "แก้ไขไฟล์ A เพื่อใช้ X, เพิ่มการทดสอบในไฟล์ B, จากนั้นอัปเดตการกำหนดค่า C" ในการสาธิต หากผู้ใช้ลืมระบุรายละเอียดบางอย่าง ขั้นตอนการวางแผนของ Devin มักจะตรวจจับได้และแจ้งให้มีการชี้แจง ในการสาธิตหนึ่ง ผู้ช่วยได้เพิ่มการกำหนดค่าบัญชี GitHub ลงในแผนโดยอัตโนมัติ แม้ว่าผู้ใช้จะไม่ได้กล่าวถึงอย่างชัดเจน (www.developersdigest.tech) (www.linkedin.com). ขั้นตอนการวางแผนเหล่านี้ (การถามคำถาม, การระบุงาน, การแมปไฟล์) ทั้งหมดนี้ทำภายในอินเทอร์เฟซไดอะล็อกของ Devin ก่อนที่จะมีการเขียนโค้ดใดๆ หากผู้ใช้เห็นด้วยหรือเปิดใช้งานการอนุมัติอัตโนมัติ Devin จะดำเนินการต่อไป

การทำงานในสภาพแวดล้อมการพัฒนา: Editor, Terminal และ Browser

Devin ทำงานภายใน สภาพแวดล้อมนักพัฒนาแบบแซนด์บ็อกซ์ (sandboxed developer environment) เอกสารของ Cognition อธิบายว่ามันมีชุดเครื่องมือสำหรับนักพัฒนาที่คุ้นเคย: เทอร์มินัลเชลล์, ตัวแก้ไขโค้ด และเว็บเบราว์เซอร์ ทั้งหมดนี้พร้อมใช้งาน (medium.com) (docs.devin.ai) ในทางปฏิบัติ เมื่อ Devin ทำงาน ทุกสิ่งที่มันทำจะถูกบันทึกและมองเห็นได้ใน UI บนเว็บ มุมมอง "Follow Devin" จะไฮไลต์แต่ละการกระทำ (เช่น การแก้ไขไฟล์หรือคำสั่งเชลล์) และแม้กระทั่งให้มนุษย์คลิกไอคอนเพื่อกระโดดโดยตรงไปยังตัวแก้ไขโค้ดหรือเทอร์มินัลที่การกระทำนั้นเกิดขึ้น (docs.devin.ai) ตัวอย่างเช่น หาก Devin แก้ไขไฟล์ JavaScript ผู้ใช้สามารถคลิกเพื่อดูมุมมองตัวแก้ไข VSCode พร้อมกับการเปลี่ยนแปลง หรือหาก Devin รันคำสั่งเชลล์ ก็สามารถคลิกเพื่อดูผลลัพธ์ของเทอร์มินัลได้

คุณยังสามารถเข้าสู่พื้นที่ทำงานของ Devin ได้ด้วยตนเองหากต้องการ การอัปเดตล่าสุดได้เพิ่มปุ่ม "Use Devin’s Machine" ที่เปิดสภาพแวดล้อมของ Devin ใน VSCode ผ่านเว็บ (docs.devin.ai) ซึ่งหมายความว่านักพัฒนาสามารถดูไฟล์ของ Devin รันคำสั่ง หรือแม้กระทั่งแก้ไขโค้ดด้วยมือในพื้นที่ทำงานของมันได้ (สำหรับงานที่ใช้เวลานาน นี่สะดวกหากคุณต้องการตรวจสอบบางอย่างระหว่างที่งานกำลังดำเนินอยู่) ในตัวอย่างหนึ่ง ผู้ใช้เปิดใช้งานสิ่งนี้เพื่อดู Devin สร้างองค์ประกอบ UI: ผู้ใช้เปิด VSCode ของ Devin เห็นไฟล์ใหม่ที่ Devin เขียน และสามารถสำรวจ UI ได้แบบสดๆ

เครื่องมือ เบราว์เซอร์ ช่วยให้ Devin ค้นคว้าหรือทดสอบสิ่งต่างๆ บนอินเทอร์เน็ต ในการสาธิต Devin ถูกแสดงให้เห็นว่าใช้การค้นหาบนเว็บเพื่อดูเอกสารหรือไลบรารี และแม้กระทั่งรันเว็บเซิร์ฟเวอร์ในเครื่องเพื่อตรวจสอบว่าโค้ดของมันไม่เสียหาย (เช่น จะชี้เบราว์เซอร์ไปที่ localhost เพื่อตรวจสอบว่า UI ทำงานได้) สรุปแล้ว อินเทอร์เฟซของ Devin นั้น multimodal: สามารถรับอินพุตต่างๆ เช่น ข้อความแจ้งเตือน, รูปภาพออกแบบหรือเอกสารที่แนบมา และแม้แต่โค้ดส Snippet และมันโต้ตอบผ่านทั้งแชทและเครื่องมือสำหรับนักพัฒนาเหล่านี้ (www.developersdigest.tech) (medium.com) ผลลัพธ์คือประสบการณ์ที่ใกล้เคียงกับ "เพื่อนร่วมงานกำลังเขียนโค้ด" มากกว่าการแชทแบบคงที่กับ AI

หน่วยความจำ, ความรู้ และบริบทเซสชัน

Devin ติดตามข้อมูลตลอดเซสชันโดยใช้ระบบ “Knowledge” ที่สร้างขึ้นภายใน ลองนึกภาพ Knowledge เหมือนสมุดบันทึกในพื้นที่ทำงาน: Devin สามารถจัดเก็บเคล็ดลับ, คำแนะนำเฉพาะโปรเจกต์ หรือบริบทที่สำคัญไว้ที่นั่น และเรียกใช้ในภายหลังได้ ตัวอย่างเช่น เอกสารอธิบายเวิร์กโฟลว์เพื่อ ปักหมุด ความรู้บางอย่างเพื่อให้ Devin ไม่มีวันลืมมัน เช่น ข้อจำกัดทางสถาปัตยกรรมที่สำคัญหรือคู่มือสไตล์การเขียนโค้ด (docs.devin.ai) ผู้ใช้สามารถแก้ไขหรือเพิ่มความรู้นี้ได้ Devin ยังจะ สร้างบันทึกที่เป็นประโยชน์โดยอัตโนมัติ: มันจะสแกน repository ของคุณเพื่อเรียนรู้เกี่ยวกับโครงสร้างโค้ด, ส่วนประกอบ และเอกสารของคุณ และสร้างสรุป "Repo Knowledge" โดยอัตโนมัติ (docs.devin.ai) (docs.devin.ai) ในทางปฏิบัติ หลังจากที่คุณรันงานไม่กี่ครั้ง Devin อาจกล่าวว่า "ฉันสังเกตว่าคุณมักจะใช้ React และ Redux; ฉันแนะนำให้เพิ่มสิ่งนั้นลงใน Knowledge" และหากคุณอนุมัติ ข้อมูลนั้นจะถูกบันทึกไว้

ระหว่างเซสชัน Devin จะเก็บความรู้ที่เกี่ยวข้องไว้ในหน่วยความจำทำงาน Cognition อ้างว่ามัน "เรียกคืนบริบทที่เกี่ยวข้องในทุกขั้นตอน" (www.linkedin.com). ตัวอย่างเช่น หากก่อนหน้านี้มันเรียนรู้ว่าคุณชอบ Python 3.11 หรือเว็บแอปของคุณใช้ OAuth มันจะนำข้อมูลนั้นมาใช้ในคำสั่งแจ้งเตือนตามที่จำเป็น เซสชันนั้นมีลักษณะเป็นแบบยาวและมีการรักษา state: คุณอาจพูดคุยกับ Devin เป็นสิบๆ รอบ (หลายนาทีขึ้นไป) ในขณะที่มันแก้ไขไฟล์จำนวนมาก และมันจะเก็บประวัติการแชทไว้ หาก Devin เกิดปัญหา คุณสามารถเลื่อนดูบันทึกหรือเปิด "progress mode" เพื่อดูทุกการกระทำที่มันทำ

หากเซสชันของคุณสิ้นสุดลง (เช่น หากคุณหยุดงานหรือปิดงาน) Devin จะ ลืมสถานะการทำงาน ของเครื่องนั้น และเครื่องเสมือนของมันจะรีเซ็ตเป็นภาพรวมพื้นฐานในครั้งถัดไป (docs.devin.ai) โดยค่าเริ่มต้น สถานะพื้นฐานนี้รวมถึง repository ที่คุณโหลดไว้ล่วงหน้าในพื้นที่ทำงานของคุณ ดังนั้น Devin จึงไม่จำเป็นต้องโคลนตั้งแต่ต้นทุกครั้ง (docs.devin.ai) (หากไม่มีการตั้งค่าพื้นที่ทำงาน แต่ละเซสชันจะเริ่มต้นด้วยเครื่องเปล่า ดังนั้น Cognition จึงเน้นย้ำถึงการกำหนดค่า repo ล่วงหน้าเพื่อความเร็ว (docs.devin.ai)) แต่นอกเหนือจากโค้ด Devin ยังคงส่งต่อความรู้ผ่านธนาคารความรู้ (Knowledge bank) ของมัน มันจะแจ้งให้คุณเพิ่มบทเรียนหรือคำจำกัดความที่ดูเหมือนจะเป็นประโยชน์สำหรับงานในอนาคต (docs.devin.ai) เมื่อเวลาผ่านไปหลายเซสชัน สิ่งนี้หมายความว่า Devin ค่อยๆ สร้างความทรงจำเกี่ยวกับข้อกำหนดและสถาปัตยกรรมของโปรเจกต์ของคุณ

นอกเหนือจาก Knowledge แล้ว Cognition ยังได้เปิดตัว DeepWiki ซึ่งเป็นเครื่องมือที่เกี่ยวข้องที่จัดทำดัชนีโค้ดเบสทั้งหมดและมีอินเทอร์เฟซแชทอยู่ด้านบน (medium.com) แม้ว่า DeepWiki จะเป็นผลิตภัณฑ์แยกต่างหาก แต่ก็ชี้ให้เห็นถึงสถาปัตยกรรมที่กว้างขึ้น: Devin สามารถ query จาก wiki ภายในของตัวเองหรือ wiki ภายนอกของโค้ดเพื่อตอบคำถามได้ ในทางปฏิบัติ หากคุณถาม Devin บางอย่างเกี่ยวกับโค้ด มันอาจใช้ระบบการดึงข้อมูลเดียวกันกับ DeepWiki ภายในเพื่อตอบคำถาม

ความเป็นอิสระ, การทำซ้ำ และการแก้ไขตัวเอง

Devin ได้รับการออกแบบมาให้มี ความเป็นอิสระ แต่มีวงจรการตอบรับเมื่อจำเป็น หลังจากวางแผนแล้ว มันจะดำเนินการทีละขั้นตอน โดยตรวจสอบหาข้อผิดพลาดอยู่เสมอ ในการสาธิต เอเจนต์มักจะทำตามรูปแบบนี้: ใช้เบราว์เซอร์หรือเอกสารเพื่อทำความเข้าใจปัญหา, เขียนโค้ดบางส่วน, รันโค้ด, พบข้อผิดพลาด, จากนั้นค้นหาวิธีแก้ไข – เลียนแบบวงจรการดีบักของมนุษย์ (www.developersdigest.tech) (www.linkedin.com) ตัวอย่างเช่น ผู้นำเสนอคนหนึ่งแสดงให้เห็นว่า Devin เพิ่มฟอร์มเข้าสู่ระบบ จากนั้นรันการทดสอบส่วนหน้า (front-end test) พบข้อบกพร่อง และกลับไปค้นคว้าหาวิธีแก้ไขข้อผิดพลาดนั้น แต่ละ "รอบ" ของ Devin คือวงจรของ คิด → ทำ → สังเกต → แก้ไข

แหล่งข้อมูลหลายแห่งระบุว่า Devin มี "การแก้ไขตัวเอง" ที่สร้างขึ้นภายใน (medium.com) (www.linkedin.com) แท้จริงแล้ว บล็อกของ Cognition ที่เกี่ยวกับ GPT-5 ระบุว่า GPT-5 "เก่งในการทำความเข้าใจข้อผิดพลาดและแก้ไขเส้นทางด้วยตัวเอง" ซึ่งพวกเขาเน้นว่าเป็นสิ่งที่ดีเยี่ยมสำหรับงานที่ใช้เวลานาน (www.linkedin.com) กล่าวอีกนัยหนึ่ง หากโค้ดของ Devin ไม่สามารถคอมไพล์ได้หรือการทดสอบล้มเหลว โมเดล (มักจะเป็น GPT-5 หรือคล้ายกัน) จะเห็นข้อความแสดงข้อผิดพลาดและหาวิธีแก้ไขทันที มันยังสามารถทำ วงจรการลองใหม่ (retry loops) ได้: หากการกระทำสำเร็จบางส่วน Devin อาจทำซ้ำอีกครั้ง วงจรเหล่านี้จะมองเห็นได้ใน UI ในรูปแบบของการแก้ไขและรันซ้ำๆ

เพื่อจัดการกับความล้มเหลวอย่างเป็นระบบ Devin ใช้การผสมผสานระหว่างระบบอัตโนมัติและการกำกับดูแลโดยมนุษย์ ตัวอย่างเช่น หาก Devin เปิดพูลรีเควสต์และได้รับความล้มเหลวจาก CI หรือความคิดเห็นการรีวิวโค้ด ระบบของ Cognition จะ ปลุก Devin จากการหลับ โดยอัตโนมัติ และให้มันจัดการกับปัญหา (docs.devin.ai) (docs.devinenterprise.com) โดยค่าเริ่มต้น Devin จะตอบสนองต่อข้อผิดพลาด lint หรือความคิดเห็น แม้ว่าผู้ใช้สามารถปิดการใช้งานได้ UI ยังไฮไลต์สถานะและการกระทำของมันแบบเรียลไทม์ ทำให้นักพัฒนาสามารถเข้าแทรกแซงได้ตลอดเวลา นักพัฒนาได้รับการสนับสนุนให้ดูการรันไม่กี่ครั้งแรกใน "โหมดสด" (ซึ่งแสดงแต่ละขั้นตอน) เพื่อสร้างความเชื่อมั่น จากนั้นจึงให้ Devin รันแบบ headless เต็มรูปแบบเมื่อมั่นใจ (www.developersdigest.tech)

ความปลอดภัย, การป้องกัน และการปรับแต่ง

ผู้ปฏิบัติงานสามารถให้คำแนะนำที่ชัดเจนแก่ Devin ว่า ไม่ควร ทำอะไร คุณสมบัติที่ทรงพลังอย่างหนึ่งคือ "Forbidden Actions" คุณสามารถระบุสิ่งที่ Devin ไม่ได้รับอนุญาตให้แตะต้องได้ – ตัวอย่างเช่น "ห้าม push โดยตรงไปยัง main" หรือ "ห้ามแก้ไขไฟล์ X" ระบบจะตรวจสอบให้แน่ใจว่า Devin เคารพคำสั่งเหล่านี้เมื่อปรากฏในข้อความแจ้งเตือนหรือใน Playbook (docs.devin.ai) ตามบันทึกการเปิดตัว Devin สามารถจัดการรายการการกระทำที่ต้องห้ามได้อย่าง น่าเชื่อถือ ซึ่งหมายความว่ามันจะตรวจสอบการกระทำของมันเทียบกับกฎเหล่านั้น สิ่งนี้ช่วยป้องกันข้อผิดพลาดทั่วไป เช่น การแก้ไข branch หรือไฟล์ที่ไม่ถูกต้อง

Devin ยังมี การควบคุม ที่หลากหลาย ใน Slack หรือ UI บนเว็บ คุณสามารถสั่งให้ Devin "sleep" (หยุดงานชั่วคราว) หรือ "archive" เซสชันได้ (docs.devin.ai) คุณสามารถเลือกได้ว่า Devin ต้องการการอนุมัติของคุณก่อนที่จะดำเนินการตามแผน (ผ่านการตั้งค่า Agency) หรือรันอย่างเป็นอิสระเต็มรูปแบบ (docs.devin.ai) (docs.devin.ai) การใช้ทรัพยากรคำนวณของมันจะถูกวัดเป็น Agent Compute Units (ACUs) และ UI จะแสดงคำเตือนหาก Devin กำลังจะถึงขีดจำกัด ดังนั้นคุณสามารถเข้าแทรกแซงหรือให้ทรัพยากรเพิ่มได้ (docs.devin.ai)

หากเกิดข้อผิดพลาดเบื้องหลัง Cognition มีการเฝ้าระวังอยู่แล้ว ในการเปิดตัวครั้งก่อน ผู้ใช้บางรายรายงานว่าเซสชันของ Devin "ติดขัด" หรือขัดข้อง ทีมงานระบุว่าปัญหาเหล่านั้นได้รับการแก้ไขแล้วและเสนอการคืนเงิน ACU หาก Devin ค้าง (docs.devin.ai) กล่าวอีกนัยหนึ่ง บริษัทกำลังพัฒนาเครื่องมือระบบอย่างแข็งขันเพื่อความน่าเชื่อถือ นักวิเคราะห์ภายนอกเตือนว่า เช่นเดียวกับ AI ที่ใช้แชทอื่นๆ Devin สามารถสร้างข้อผิดพลาดหรือ "หลอน" โค้ดได้เป็นครั้งคราว แนวทางปฏิบัติที่แนะนำคือการ ตรวจสอบผลลัพธ์ ของมันเช่นเดียวกับที่คุณตรวจสอบงานของนักพัฒนารุ่นเยาว์ เพื่อความปลอดภัย ทีมงานหลายทีมใช้การรีวิวโค้ดในการ commit ของ Devin และจำกัดสิทธิ์ของ Devin (เช่น ไม่มีสิทธิ์เข้าถึงความลับโดยตรงโดยค่าเริ่มต้น) จนถึงตอนนี้ การป้องกันที่อธิบายในที่สาธารณะส่วนใหญ่เป็นการกำหนดโดยผู้ใช้ (การกระทำที่ต้องห้าม, การอนุมัติแผน ฯลฯ) และการตรวจสอบสุขภาพของระบบ มากกว่าที่จะเป็นตัวกรองทางจริยธรรมที่สร้างขึ้นภายใน

สิ่งที่เรายังไม่รู้

Cognition จงใจเก็บรายละเอียดบางอย่างไว้เป็นความลับ ดังนั้นบางส่วนของ Devin จึงไม่โปร่งใส ตัวอย่างเช่น โมเดลภาษาขนาดใหญ่ที่ใช้ตอนแรกไม่เปิดเผยต่อสาธารณะ ข่าวลือและโพสต์ในภายหลังแนะนำว่า Cognition ตอนนี้ได้รวม GPT-5 เข้ากับ Devin สำหรับแกนหลักของการวางแผนและการให้เหตุผล (www.linkedin.com) และพวกเขามีเอเจนต์ตัวอย่างที่อิงจาก Claude Sonnet 4.5 (docs.devinenterprise.com) แต่สถาปัตยกรรมทั้งหมดไม่ชัดเจน: Devin อาจจะประสานงานหลายโมเดลและมีการปรับแต่งพิเศษ (ตามที่ซับเอเจนต์การวางแผน RFT บอกใบ้) แต่เลเยอร์เหล่านั้นไม่ได้เป็นโอเพ่นซอร์ส

เรายังไม่ทราบขีดจำกัดของหน่วยความจำของมันอย่างสมบูรณ์ Devin อ้างว่า "เรียนรู้เมื่อเวลาผ่านไป" แต่ยังไม่ระบุว่ามันรวมความรู้ใหม่เข้ากับเครือข่ายที่มีอยู่ได้อย่างไร (เทียบกับการเก็บไว้ในธนาคารความรู้) ความยาวสูงสุดของประวัติการสนทนาที่มันใช้อย่างมีประสิทธิภาพยังไม่มีการบันทึก เมื่อเซสชันยาวมาก เป็นไปได้ว่าส่วนต้นๆ ของการแชทหรือบริบทโค้ดอาจถูกตัดออกไปเบื้องหลัง ในทางปฏิบัติ ผู้ใช้ส่วนใหญ่จะเก็บข้อความแจ้งเตือนและโค้ดให้กระชับเพื่อหลีกเลี่ยงการรับบริบทมากเกินไป

ในด้านความปลอดภัย ยังคงมีสิ่งที่ไม่ทราบอยู่บ้าง ตัวอย่างเช่น ในขณะที่ "การกระทำที่ต้องห้าม" ครอบคลุมกฎที่ผู้ใช้ระบุ แต่ไม่ชัดเจนว่า Devin มีชั้นความปลอดภัย โดยนัย หรือไม่ (เช่น การตรวจจับการใช้ข้อมูลในทางที่ผิด, การตรวจสอบอคติ หรือการหลบหนีออกจากแซนด์บ็อกซ์) เนื่องจากมันทำงานใน VM จึงหวังว่ามันจะไม่สามารถสร้างความเสียหายให้กับระบบโฮสต์ได้ แต่รายละเอียดเกี่ยวกับการทำแซนด์บ็อกซ์นั้นไม่เป็นสาธารณะ ชุมชนอนุมานว่าเครื่องของ Devin น่าจะใช้ container snapshots (ตามที่กล่าวถึงสำหรับการฝึกอบรม RL) เพื่อแยกการรัน (medium.com)

สุดท้าย หลายคนในชุมชนกำลังจับตาดูว่า Devin จัดการกับ งานที่ไม่ชัดเจนหรือไม่กำหนดขอบเขตที่แน่นอน อย่างไร การนำเสนอขายเรียกว่า "อัตโนมัติอย่างสมบูรณ์" แต่นักวิเคราะห์ตั้งข้อสังเกตว่ามันยังคงต้องการคำแนะนำที่แม่นยำบ่อยครั้ง ตัวอย่างเช่น หากข้อความแจ้งเตือนของผู้ใช้คลุมเครือ Devin อาจสร้างแผนที่ดูเหมือนสมเหตุสมผลแต่พลาดกรณีขอบ (edge cases) ที่สำคัญไปได้ มันอาจจะถามคำถามเพื่อความชัดเจนในการติดตามผล แต่บางครั้งนักพัฒนาก็สงสัยว่ามันเข้าใจ เจตนา ได้ดีเพียงใด เทียบกับการจับคู่รูปแบบโค้ดเท่านั้น แง่มุมของการรับรู้ของ Devin เหล่านี้อาศัยความสามารถของ LLM ที่อยู่เบื้องหลัง ซึ่งเราสังเกตเห็นได้โดยอ้อมเท่านั้น กล่าวโดยสรุป ผู้ใช้ควรมอง Devin เหมือนวิศวกรฝึกหัดที่มีทักษะสูงมากกว่าผู้จัดการผลิตภัณฑ์ – มันวางแผนได้ดี แต่ก็อาจจะไม่สามารถ เข้าใจเจตนาของคุณ ได้อย่างสมบูรณ์เสมอไป

เริ่มต้นใช้งาน Devin

Devin มุ่งเป้าไปที่ทีมวิศวกรรมที่ทำงานเขียนโค้ดเป็นจำนวนมากเป็นหลัก มันโดดเด่นในงานที่กำหนดไว้อย่างชัดเจน: การสร้างคุณสมบัติจากข้อกำหนด, การ refactoring, การเขียนการทดสอบ และการแก้ไขข้อบกพร่อง มันยังไม่ได้รับการพิสูจน์มากนักในด้านการออกแบบระดับสูงหรือปัญหาที่ไม่ชัดเจนมาก สำหรับทีมซอฟต์แวร์ Devin สามารถช่วยจัดการงานประจำได้ เพื่อให้มนุษย์มุ่งเน้นไปที่สถาปัตยกรรมเชิงสร้างสรรค์และการกำกับดูแล

สำหรับผู้ที่ไม่ใช่โปรแกรมเมอร์หรือผู้เริ่มต้น Devin ยังคงมีประโยชน์แต่ต้องมีการตั้งค่าบางอย่าง ขั้นตอนแรกคือการให้สิทธิ์ Devin เข้าถึง code repository ของคุณ (ผ่าน GitHub, GitLab ฯลฯ) และอาจเชื่อมต่อกับ Slack หรือ Teams จากนั้นลองทำ งานง่ายๆ ตัวอย่างเช่น ถามว่า: “Devin ช่วยเพิ่มหน้าใหม่เพื่อแสดงรายการผลิตภัณฑ์ทั้งหมดจากฐานข้อมูลของเราใน UI บนเว็บ รวมถึงการครอบคลุมการทดสอบด้วย” ดูการสนทนาในขั้นตอนการวางแผน: Devin จะร่างไฟล์ที่จะเปลี่ยนแปลง (เช่น เทมเพลต HTML, โค้ด API ส่วนหลัง ฯลฯ) และถามคำถามที่จำเป็น อนุมัติแผน (หรือปล่อยให้มันรันอัตโนมัติ) และดูมันดำเนินการ ใช้แผง "Follow" เพื่อดูแต่ละขั้นตอน: คุณจะเห็นการแก้ไขไฟล์, คำสั่งเชลล์ (เช่น การรันชุดทดสอบ) และภาพหน้าจอของ UI จากเบราว์เซอร์ หาก Devin ทำผิดพลาดหรือคุณต้องการเปลี่ยนแปลง เพียงโต้ตอบเหมือนที่คุณทำในแชท ("จริงๆ แล้ว ใช้ธีม CSS นี้" หรือ "ชื่อผลิตภัณฑ์ควรเป็นตัวพิมพ์ใหญ่") และ Devin จะเริ่มวงจรการแก้ไขใหม่

ขั้นตอนสำคัญที่สามารถทำได้คือ ทำซ้ำและตรวจสอบ ตรวจสอบโค้ดที่ Devin สร้างขึ้นและทดสอบในเครื่องเสมอ เมื่อเวลาผ่านไป คุณสามารถเพิ่มข้อมูลในธนาคารความรู้ (Knowledge bank): เพิ่มบันทึกเช่น "ฐานข้อมูลของเราใช้ PostgreSQL 13" หรือ "เราทำตามสไตล์ PSR-12 ใน PHP" Devin จะเริ่มนำสิ่งเหล่านี้ไปใช้ในเซสชันในอนาคต สำรวจการตั้งค่าด้วย: ปิด Agency หากคุณต้องการตรวจสอบข้อเสนอเสมอ หรือเปิดใช้งานหากคุณเชื่อใจมันมากขึ้น เชื่อมโยง Devin กับ CI ของคุณเพื่อการรีวิวพูลรีเควสต์อัตโนมัติ แต่เริ่มต้นด้วยการแจ้งเตือนเพื่อให้คุณสามารถดูว่ามันจัดการกับข้อเสนอแนะอย่างไร

ท้ายที่สุด เวิร์กโฟลว์ของ Devin นั้นมีความหนาแน่นและทรงพลัง แต่ก็ยังคงต้องอาศัยคำแนะนำจากคุณ ด้วยความเข้าใจว่ามันวางแผนอย่างไร, ใช้เครื่องมืออย่างไร และเรียนรู้จากข้อเสนอแนะอย่างไร (ตามที่กล่าวไว้ข้างต้น) คุณจะสามารถใช้ประโยชน์จาก ผู้ช่วยเขียนโค้ดแบบ agentic รุ่นใหม่นี้ได้อย่างเต็มที่ ขั้นตอนต่อไปที่ดีที่สุดสำหรับทีมที่สนใจ Devin คือการลงทะเบียนที่ devin.ai และทดลองใช้งานโครงการนำร่องเล็กๆ: เพิ่มเว็บ repo หนึ่งอัน, ขอให้ Devin นำคุณสมบัติไปใช้ และปล่อยให้มันทำงานในโหมด progress สังเกตการติดตาม "การคิด" ทั้งหมด – ประสบการณ์จริงนั้นจะช่วยให้ชัดเจนว่า Devin ผสมผสานการวางแผน, การแก้ไข และการแก้ไขตัวเองเข้าด้วยกันได้อย่างไร จากนั้นคุณสามารถขยายไปยังงานอื่นๆ และปรับแต่งการใช้งาน (เช่น playbooks แบบกำหนดเองสำหรับโดเมนของคุณ) แม้จะยังคงพัฒนาอยู่ Devin ก็แสดงถึงการก้าวกระโดดครั้งสำคัญในเครื่องมือ AI ด้วยการเรียนรู้เวิร์กโฟลว์ของมันในวันนี้ ทีมงานสามารถเตรียมพร้อมสำหรับยุคที่งานเขียนโค้ดสามารถแบ่งปันกับเพื่อนร่วมทีม AI ได้อย่างแท้จริง

รับงานวิจัยและตอนพอดแคสต์เกี่ยวกับการเขียนโค้ด AI ใหม่ล่าสุด

สมัครสมาชิกเพื่อรับการอัปเดตงานวิจัยใหม่และตอนพอดแคสต์เกี่ยวกับเครื่องมือเขียนโค้ด AI, เครื่องมือสร้างแอป AI, เครื่องมือ No-code, การเขียนโค้ด Vibe และการสร้างผลิตภัณฑ์ออนไลน์ด้วย AI