Bỏ qua đến nội dung chính

Architecting for model step-changes: A fireside with Vercel's Guillermo Rauch

TL;DR

  • Vercel đang chuyển đổi từ tập trung vào trải nghiệm nhà phát triển (DX) sang tận dụng AI và các tác nhân để biến những ý tưởng thành hiện thực nhanh chóng hơn, hướng tới việc xây dựng "hạ tầng di truyền" nơi chính đám mây có thể tự hoạt động như một tác nhân thông minh.
  • Nội bộ Vercel vận hành như một "nhà máy phần mềm AI", nơi tất cả nhân viên, không chỉ các nhà phát triển, được trao quyền để xây dựng các công cụ và quy trình làm việc dựa trên tác nhân, từ đó tăng năng suất và thúc đẩy đổi mới liên tục.
  • Việc Vercel nhanh chóng tích hợp các mô hình AI tiên tiến như Opus 4.5 đã chứng minh nhu cầu mạnh mẽ về "trí thông minh" tốt nhất, cho phép đơn giản hóa kiến trúc sản phẩm và tạo ra các sản phẩm hoàn chỉnh, tham vọng hơn với chi phí phát triển giảm đáng kể.

Điểm chính

  • Ưu tiên Công thái học của Tác nhân và DX cho Tác nhân: Tập trung vào việc tạo ra trải nghiệm phát triển dễ dàng và hiệu quả cho việc xây dựng, triển khai và quản lý các tác nhân AI.
  • Phát triển "Hạ tầng Di truyền": Xây dựng hạ tầng đám mây có khả năng tự động chữa lành, tối ưu hóa và cấu hình thông qua việc sử dụng các tác nhân AI, biến đám mây thành một tác nhân thông minh.
  • Nuôi dưỡng Văn hóa "Nhà máy Phần mềm AI": Khuyến khích mọi nhóm (thiết kế, bảo mật, kỹ sư) tự tạo ra các công cụ và quy trình làm việc hỗ trợ bởi AI để tự động hóa, tăng năng suất và giảm chi phí phát triển phần mềm nội bộ.
  • Sử dụng AI Gateway để Tối ưu hóa Mô hình và Chi phí: Triển khai một AI Gateway làm lớp trừu tượng để quản lý việc sử dụng token, cho phép nâng cấp mô hình nhanh chóng, thử nghiệm A/B và tối ưu hóa chi phí khi chuyển đổi giữa các mô hình AI khác nhau.
  • Đơn giản hóa Kiến trúc với Mô hình AI Thông minh hơn: Tận dụng khả năng của các mô hình AI tiên tiến để giảm bớt sự phức tạp trong kiến trúc sản phẩm, loại bỏ các bước xử lý hoặc sửa lỗi tự động mà các mô hình cũ yêu cầu.
  • Đảm bảo Bảo mật thông qua Sandbox cho Tác nhân: Cung cấp các môi trường thử nghiệm biệt lập (sandbox) cho các tác nhân AI, đặc biệt khi chúng tạo mã, để giảm thiểu rủi ro bảo mật và cho phép sự sáng tạo mà không ảnh hưởng đến hệ thống chính.
  • Trao quyền cho Tác nhân bằng Công cụ và Kỹ năng: Trang bị cho tác nhân các công cụ tương tự con người (ví dụ: trình duyệt tác nhân, công cụ dòng lệnh) và cho phép chúng tự học, thích nghi với các công cụ mới thay vì vi quản lý từng bước hoạt động.
  • Thử nghiệm và Cờ tính năng là "Thành phần Hạng nhất": Tích hợp mạnh mẽ các cơ chế A/B testing và cờ tính năng vào hạ tầng để liên tục đánh giá, thử nghiệm và triển khai các cải tiến do AI mang lại một cách an toàn và nhanh chóng.

Từ vựng

  • AGI — Trí tuệ tổng quát nhân tạo
  • Developer Experience (DX) — Trải nghiệm nhà phát triển
  • Agent — Tác nhân
  • Genetic Infrastructure — Hạ tầng di truyền
  • Sandbox — Môi trường thử nghiệm biệt lập
  • Token — Token (đơn vị xử lý trong AI)
  • Model (AI Model) — Mô hình (AI)
  • Self-heal/optimize/configure — Tự chữa lành/tối ưu hóa/cấu hình
  • First-class citizen — Thành phần hạng nhất
  • Over-engineer — Thiết kế quá mức

Nội dung chi tiết

Vercel và Tầm nhìn AGI

Chào mừng CEO của Vercel, Guillermo Rauch, và Giám đốc Sản phẩm Nền tảng Đám mây của Anthropic, Angela Jang, đến với sân khấu. Guillermo, cảm ơn bạn đã tham gia. Thật tuyệt khi được ở đây trực tiếp. Vâng, Guillermo đã gửi cho tôi nhiều yêu cầu qua tin nhắn. Bây giờ chúng ta có thể thực hiện điều này trực tiếp trước nhiều người. Xin chào các bạn. Tôi là Angela đến từ Anthropic, và mọi người đều biết Guillermo, một nhà tư tưởng, nhà xây dựng, và người tạo ra một số công nghệ phổ biến nhất, thực sự đáng kinh ngạc. Tôi nghĩ thật sự đáng kinh ngạc khi thấy Vercel trở thành một nơi và nhà cung cấp công nghệ mà rất nhiều startup, nhà sáng tạo và nhà xây dựng đã tìm đến để xây dựng các tác nhân của họ, xây dựng sản phẩm của họ, trải nghiệm nhiều loại hình trải nghiệm 'đậm chất AGI' hơn ngoài kia. Tôi rất muốn bắt đầu bằng quan điểm của bạn về cách bạn đã thấy Vercel biến đổi. Và tôi biết bạn đã công khai nói một chút, hoặc thực ra là rất nhiều, về việc AGI có khả năng biến đổi công nghệ mạnh mẽ như thế nào, biến đổi cách chúng ta xây dựng những thứ này ra sao. Có lẽ bạn có thể chia sẻ quan điểm của Vercel về điều đó và cách các bạn tiếp nhận nó nội bộ.

Sứ mệnh Vercel và Hạ tầng được hỗ trợ bởi AI

Vâng, điều này thú vị vì khi Vercel ra đời, ý tưởng là loại bỏ mọi trở ngại giữa một ý tưởng và việc đưa nó lên mạng. Tôi rất thích điều đó. Và các công cụ mà chúng tôi có để thực hiện điều đó, tóm lại, đó là Trải nghiệm nhà phát triển. Nhiều người ghi nhận chúng tôi đã giới thiệu nỗi ám ảnh về Trải nghiệm nhà phát triển vào hạ tầng đám mây. Và sứ mệnh là làm cho nó trở nên phổ biến hơn. Ví dụ, nếu bạn chỉ biết front-end, React là lựa chọn mà chúng tôi đặt cược trong phần lớn thời gian. Nếu bạn chỉ có thể học JavaScriptReact, giờ đây bạn có thể sử dụng hạ tầng mà trước đây chỉ dành cho các tập đoàn khổng lồ (mega-manga, megafan hoặc bất cứ cách gọi nào ngày nay).

Tiến nhanh đến ngày hôm nay, tôi nghĩ chúng tôi vẫn tập trung vào ý tưởng kết nối ý tưởng với thực tế, nhưng chúng tôi có những siêu năng lực mới tuyệt vời. Cứ như thể bạn đang chơi một game RPG và những siêu vũ khí đã xuất hiện. Đó chính là tác nhânAI. Vì vậy, tôi dành rất nhiều thời gian những ngày này để suy nghĩ về công thái học của tác nhân (agent ergonomics) và Trải nghiệm nhà phát triển cho các tác nhân. Và chúng ta đang sống trong một thực tế nơi nhóm người có thể triển khai lên đám mây lớn hơn vô hạn, phải không? Với các công cụ như V0 và Claude Code, bạn biết đấy, giờ đây bạn nghe thấy mỗi ngày rằng mọi người đều có thể phát hành sản phẩm. Vì vậy, nó đã trở thành một yếu tố thúc đẩy sứ mệnh của chúng tôi, nhưng nó thực sự đã thay đổi cách chúng tôi nghĩ về việc xây dựng. Và điều mà chúng tôi đang tập trung hẹp vào xây dựng hiện nay là thứ chúng tôi gọi là hạ tầng di truyền (genetic infrastructure). Tức là trở thành đối tác hạ tầng tốt nhất cho các công cụ như Claude Code, giúp bạn triển khai tác nhân, và sau đó cũng biến chính hạ tầng thành một tác nhân. Nghĩa là, hãy tưởng tượng nếu đám mây tự nó có thể tự chữa lành (self-heal), tự tối ưu hóa (self-optimize), tự cấu hình (self-configure), v.v. Điều đó thật đáng kinh ngạc.

Quy trình Làm việc Nội bộ dựa trên Tác nhân tại Vercel

Tôi nghĩ một trong những điều thực sự đọng lại trong tôi khi bạn mô tả một số khái niệm công khai là ý tưởng về một 'nhà máy phần mềm AI'. Và tôi biết V0 đã, nhiều người trong chúng ta biết đến bạn với những sản phẩm đáng kinh ngạc mà bạn cung cấp cho các nhà xây dựng, nhưng ngay cả nội bộ, tôi nghĩ các bạn cũng rất 'đậm chất tác nhân' (agent-pilled), làm việc rất nhanh chóng và cực kỳ đổi mới trong lĩnh vực đó. Và chúng tôi rất muốn nghe cách các bạn tạo tác nhân nội bộ, ngay cả cho chính mình trong quy trình làm việc của mình.

Nhà máy Phần mềm AI và Năng suất của Nhà Phát triển

Vâng, chúng tôi rất 'đậm chất tác nhân' vì chúng tôi đã trải nghiệm việc sử dụng tác nhân và trở nên năng suất hơn rất nhiều. Một trong những luận điểm cốt lõi trong triết lý phát triển sản phẩm của chúng tôi là chúng tôi thử rất nhiều thứ nội bộ tại Vercel, và bất cứ khi nào điều gì đó hiệu quả, chúng tôi trở thành những người ủng hộ nhiệt tình. Chúng tôi xây dựng xung quanh nó. Tôi nhớ, ví dụ, khi lần đầu tiên tôi có quyền truy cập vào bản phát hành xem trước của Claude Code, Mikey đã mời tôi. Và tôi đã có niềm tin mạnh mẽ rằng đây không chỉ là, ví dụ, kỹ thuật front-end. Nó không chỉ là tự động hoàn thành trong một trình soạn thảo , mà đây về cơ bản là một cách mới để tự động hóa máy tính và hệ điều hành của bạn, rằng CLI là một lớp trừu tượng rất đẹp để 'tác nhân hóa' (agentify) mọi thứ. Và điều tôi đã làm là nói với toàn bộ công ty: ngân sách token không giới hạn, hãy sử dụng tất cả các công cụ này.

Và một trong những điều đã xảy ra kể từ đó, điều mà tôi nghĩ đã làm tôi ngạc nhiên, đó là ý tưởng về 'nhà máy phần mềm AI' đã hình thành và kết tinh, đó là mọi người đã sử dụng các công cụ như Claude Code và V0 để xây dựng các công cụ của riêng họ. Ví dụ, khi Ralph Wigham trở nên phổ biến, tôi nhớ đi ngang qua một trong những kỹ sư của chúng tôi và anh ấy đang làm việc, tôi hỏi: 'Đó là gì vậy? Phần mềm gì mà bạn đang chạy vậy?' Anh ấy trả lời: 'À, tôi đã tạo ra môi trường lập trình AI nhỏ của riêng mình.' Vì vậy, tôi đã trải nghiệm ý tưởng này: nếu chi phí phát triển phần mềm giảm xuống, mọi người sẽ lắp ráp lại tất cả các khối này và khai sinh ra các công cụ mới và những cách mới để mở rộng năng suất của riêng họ.

Và sau đó tôi thấy điều đó với đội ngũ thiết kế của chúng tôi. Tôi đã công khai điều này trên X, và nó khá đáng kinh ngạc. Chúng tôi có một công cụ nội bộ tên là Leap, nơi các nhà thiết kế tại Vercel đã quyết định: 'Tôi sẽ không chỉ phản ứng với các yêu cầu thiết kế trên Slack nữa. Thay vào đó, tôi sẽ đưa ra một công cụ, một công cụ nội bộ, tự động hóa rất nhiều công việc của họ và tạo ra những thành phẩm đẹp mắt.' Vì vậy, chúng tôi bây giờ có một loại nhà máy thiết kế. Và đầu tuần này, chúng tôi đã mã nguồn mở nhà máy kỹ thuật bảo mật của mình, hoặc tôi gọi đó là kiểm tra chất lượng (QA) và kiểm tra bảo mật của dây chuyền sản xuất phần mềm. Và như vậy, chúng ta hiện đang ở trong một thế giới mà bạn không chỉ có thể phát hành phần mềm, mà còn có thể tạo ra những công cụ tiện lợi nhất có thể cho nhóm của riêng bạn. Và tôi gọi đây là 'nhà máy phần mềm'. Điều đó thật đáng kinh ngạc.

Văn hóa Sáng tạo và Môi trường Sandbox

Điều đó thật đáng kinh ngạc. Và tôi thực sự tò mò, để tiếp nối điều đó, liệu bạn có coi phần lớn sự sáng tạo nội bộ này là sản phẩm phụ của văn hóa mà bạn đã tạo ra, hay bạn coi đó chỉ là thực tế rằng tất cả các công cụ này rất dễ tiếp cận, và do đó, trí tưởng tượng của tất cả những người này là yếu tố thúc đẩy nó. Vâng, tôi nghĩ một phần là do văn hóa, bởi vì tất cả chúng tôi, mọi người đến Vercel đều được thúc đẩy mạnh mẽ bởi sứ mệnh tạo ra những công cụ tốt nhất có thể trên thế giới. Điều đó thật tuyệt vời. Và tôi có thể hình dung một thế giới nơi các công cụ tốt nhất hiện nay không liên quan đến tác nhân dưới bất kỳ hình thức nào. Ví dụ, đối với DeepSec, ý tưởng không chỉ là một công cụ giúp bạn đánh giá mã nhanh hơn. Mà là việc bạn có thể tạo ra các sandbox (môi trường thử nghiệm biệt lập) trên đám mây và tự động hóa công việc của mình đến mức bạn chưa bao giờ có thể làm được bằng tay. Chúng ta đang nói về việc chạy hàng nghìn sandbox song song, kiểm thử các giả thuyết khác nhau. Vì vậy, tôi nghĩ có sự giao thoa giữa Trải nghiệm nhà phát triển và việc Vercel xây dựng hạ tầng hỗ trợ tác nhân.

Vì vậy, tôi nghĩ mọi người đang tìm ra những cách sáng tạo để sử dụng điều này. Chúng ta đang nói về sandbox, quy trình làm việc, AI Gateway. Chúng tôi khuyến khích mọi người kiểm thử nhiều mô hình khác nhau. Và vì vậy, tôi nghĩ, nếu tôi phải chia sẻ công thức, tôi nghĩ một phần lớn của điều này là tạo ra một môi trường sandbox an toàn nơi mọi người có thể tạo và triển khai các công cụ của riêng họ. Và rõ ràng, đây là sự hợp tác hoàn hảo giữa, ví dụ, Claude Codeplugin của Vercel. Nếu tôi chỉ cung cấp cho bạn một công cụ kỹ thuật tác nhân tuyệt vời, nhưng mã nguồn chỉ tồn tại và chết trên máy tính của bạn. Và không có cơ chế để chia sẻ nó với đồng nghiệp của bạn. Không có cơ chế để triển khai nó một cách an toàn để mở rộng. Thì bạn chỉ giống như đang chết ở giai đoạn nguyên mẫu (prototype). Nhưng bất kỳ ai chạm vào những công cụ này đều muốn thấy ý tưởng của họ trở thành hiện thực và đạt đến môi trường sản phẩm. Vâng, hoàn toàn đồng ý với điều đó. Và là một fan hâm mộ lớn của các sandbox của Vercel.

Vercel và Tốc độ Áp dụng các Mô hình Mới

Được rồi, có lẽ chúng ta có thể quay ngược thời gian một chút. Và tôi tò mò liệu bạn có thể đưa chúng ta trở lại ngày Opus 4.5 được phát hành. V0, tôi nghĩ, được biết đến với tốc độ đáng kinh ngạc, trải nghiệm sản phẩm đẹp mắt. Và các bạn đã xây dựng hỗ trợ ngay trong cùng một ngày. Thực sự muốn hiểu đối với bạn, sự sẵn sàng thực sự có nghĩa là gì khi bạn xây dựng trong những tháng tới để làm cho trải nghiệm ngay ngày đầu tiên đó trở nên khả thi và nhanh chóng cho người dùng. Vâng, tôi có rất nhiều bài học rút ra từ thành công đáng kinh ngạc của việc chỉ nâng cấp mô hình, mà rõ ràng là việc chỉ nâng cấp mô hình (tôi sẽ đi sâu vào chi tiết) không hề dễ dàng như nghe có vẻ.

Nhưng để cung cấp một số ngữ cảnh, AI Gateway của Vercel, một loại, tôi gọi đó là CDN cho token. Và nó tổng hợp phần lớn lượng sử dụng token của hàng triệu, triệu, triệu khách hàng của Vercel. Và token Opus chiếm khoảng hơn 20 phần trăm lượng sử dụng trên AI Gateway. Nhưng chúng thực sự chiếm tới hơn 70 phần trăm tổng chi phí trên AI Gateway. Khi nhìn vào dữ liệu mà tôi có từ rất nhiều khách hàng khác nhau, bài học mà tôi nhận thấy là mọi người thực sự theo đuổi trí thông minh tốt nhất mà họ có thể tìm thấy. Khi Opus ra mắt, chúng tôi đặt câu hỏi: mô hình mặc định của V0 sẽ là gì? Chúng tôi nâng cấp nhanh đến mức nào? Chúng tôi có cung cấp nó cho tất cả mọi người không?

Và đó là sự kết hợp của việc chạy các đánh giá (e-val) để hiểu rằng sản phẩm đang ngày càng tốt hơn. Một trong những bất ngờ với Opus thực ra là chúng tôi có thể đơn giản hóa cơ sở mã. Chúng tôi đã thêm và ghi lại một quy trình khá rộng rãi đã làm rất nhiều để nâng cao trí thông minh của các phiên bản mô hình trước đó, bao gồm, ví dụ, chúng tôi có một bước xem xét đầu ra và thực hiện tự động sửa lỗi. Bởi vì các phiên bản mô hình trước đó thường mắc nhiều lỗi cú pháp. Và chúng sẽ tạo ra lỗi trong ứng dụng, hoặc chúng sẽ làm chậm vòng lặp tác nhân (agent loop). Và vì vậy, một trong những điều đáng chú ý đối với chúng tôi là vì mô hình này thông minh hơn, chúng tôi có thể đơn giản hóa kiến trúc của sản phẩm.

Điều khác là chất lượng vượt trội. Tôi nhớ đã nói chuyện với công ty kiểu như, 'Này, bất cứ khi nào tôi thấy AI tốt hơn, tôi đều cập nhật kiến thức tiên nghiệm (priors).' Và một trong những kiến thức tiên nghiệm mà tôi phải cập nhật là liệu mô hình có thực sự tạo ra đầu ra có gu thẩm mỹ không? Và tôi nghĩ có lẽ đó là một bản sửa lỗi trong mô hình từ đầu ra màu tím sang đầu ra tối hơn, linh hoạt hơn. Nhưng chúng tôi cũng nhận thấy mô hình rất dễ uốn nắn (malleable). Vì vậy, một trong những giá trị gia tăng mà chúng tôi tìm thấy với V0 là chúng tôi có thể thực sự truyền tải nhiều thực tiễn tốt nhất (best practices) mà chúng tôi đã học được trong 10 năm qua về thiết kế, về thẩm mỹ của chúng tôi, về những gì tạo nên một sản phẩm tốt hơn. Và vì vậy, chúng tôi đã thêm điều đó vào mô hình.

Và sau đó chúng tôi thực hiện rất nhiều kiểm thử A/B. Vì vậy, một trong những khả năng của hạ tầng Vercel là chúng tôi coi cờ (flags) và thử nghiệm là một thành phần hạng nhất (first-class citizen) của nền tảng. Vì vậy, chúng tôi luôn kiểm thử mọi thứ. Và tôi nhớ đã tăng tốc triển khai Opus rất nhanh vì kết quả thật đáng kinh ngạc. Tôi tin rằng từ đầu năm đến nay, kể từ lần nâng cấp mô hình Anthropic gần đây nhất của chúng tôi, đây thực sự là một sự thật đáng kinh ngạc: chi tiêu tín dụng cho sản phẩm đã tăng gấp 2 lần. Chà! Và đây là một dấu hiệu không chỉ là 'đầu ra thật tuyệt vời' hay 'đầu ra đẹp hơn', v.v. Mà còn là bạn có thể tiến xa hơn rất nhiều với các mô hình thông minh hơn, nghĩa là tham vọng của mọi nhà sáng tạo là làm cho sản phẩm của họ hoàn chỉnh nhất có thể: sẵn sàng môi trường sản phẩm, bảo mật, chất lượng cao, không lỗi, nhưng cũng là full-stack. Và vì vậy, khi chúng tôi hợp tác với tất cả các bạn và triển khai các nâng cấp mô hình, chúng tôi đã thấy rằng các sản phẩm mà chúng tôi tạo ra có thể trở nên hoàn chỉnh và tham vọng hơn. Điều đó thật tuyệt vời. Nhóm của tôi rất yêu thích V0. Họ thực sự chủ động đến V0 trước để có được trải nghiệm đẹp mắt. Họ sẽ lặp lại (iterate) ở đó trước khi họ mang nó xuống. Một phần ba tổng số đăng ký của chúng tôi hiện đến từ V0 vì nó thực sự đã mở rộng khả năng tiếp cận cho những ai có thể xây dựng hoặc ít nhất là những ai có thể bắt đầu xây dựng.

Mở Rộng Khả Năng Đóng Góp

Ngày nay, chúng tôi nhận thấy rằng tại bất kỳ tổ chức công nghệ nào, các vai trò không phải nhà phát triển trực tiếp đã đạt được rất nhiều lợi ích vì trước đây, họ thực sự không thể đóng góp trực tiếp vào phần mềm. Giờ đây, mọi người trong công ty đều có thể nói: 'Đây là đề xuất của tôi,' hoặc 'Đây là cải tiến của tôi,' hoặc 'Đây là công cụ mà tôi đang xây dựng.' Vâng. Bạn đã đề cập một chút về các mô hình thông minh hơn. Với chúng, bạn có thể tiến xa hơn một chút, đạt được sự hoàn chỉnh trong sản phẩm của mình.

Từ Thiết Kế Quá Mức đến Khả Năng Sáng Tạo của Tác nhân

Bạn cũng đã nói về việc dọn dẹp mã nguồn một chút để cho phép mô hình "thở" dễ hơn. Tôi tò mò, từ góc độ của VZero hoặc các tác nhân khác mà bạn đã xây dựng, bạn đã từng "thiết kế quá mức" (over-engineer) ở đâu cho thế hệ mô hình hiện tại? Có thể với một vài ví dụ trong lĩnh vực đó và cách bạn hình dung điều đó có thể thay đổi hoặc cải thiện như thế nào khi các thế hệ mô hình tương lai ra đời, nhằm mang lại sự hoàn chỉnh hơn cho người dùng cuối.

Vâng, tôi nghĩ đã có một số điểm. Một là số lượng công cụ mà chúng tôi cung cấp cho mô hình. Chúng tôi cố gắng đôi khi thiết kế quá mức một chút bằng cách xây dựng các tác nhân con rất cụ thể hoặc các công cụ rất cụ thể. Trong thực tế, tôi nghĩ đây cũng là điều đã làm tôi ngạc nhiên về Claude Codemô hình kết hợp với sandbox có thể trở nên rất sáng tạo. Đôi khi nó còn quá sáng tạo. Bạn đọc các lệnh mà nó tạo ra và tự hỏi: 'Nó vừa làm gì vậy?' đúng không? Nhưng cái ý tưởng mô hình hoặc tác nhân có thể tự tạo mã nguồn để giải quyết vấn đề một cách sáng tạo thì thật điên rồ. Nó không chỉ tạo ra mã nguồn kết quả cuối cùng của ứng dụng mà người dùng muốn viết. Mô hìnhtác nhân có thể viết các bước trung gian này để đi đến giải pháp đúng hoặc để gỡ lỗi đầu ra.

Tầm Quan Trọng của Sandbox và Bảo Mật

Do đó, một trong những bước tiến lớn về khả năng đối với chúng tôi là việc chấp nhận ý tưởng cung cấp cho mỗi tác nhân một máy tính riêng. Từ đó thấy được tầm quan trọng của sandbox. Vậy tại sao lại cần sandbox? Bởi vì nếu mô hình viết mã nguồn, nó có thể trở nên hơi "điên rồ" – nó có thể là bất kỳ mã nguồn nào. Và tôi nghĩ rằng lĩnh vực mà chúng tôi đang kỹ thuật nhiều hơn hiện nay là xung quanh việc phê duyệt công cụ. Đó là về việc tạo ra các rào cản bảo mật phù hợp. Tôi nghĩ có nhiều điều cần nói về việc tìm kiếm điểm cân bằng lý tưởng giữa bảo mậtsự giám sát của người vận hành, đồng thời không làm phiền người dùng cuối bằng những yêu cầu 'phê duyệt, phê duyệt, phê duyệt' liên tục. Đôi khi thậm chí còn yêu cầu người dùng phê duyệt các lệnh mà họ không hiểu, ví dụ như: 'Đây là một Perl inline script. Vui lòng phê duyệt,' đúng không? Vì vậy, tôi nghĩ việc tìm kiếm sự cân bằng đó là quan trọng. Sandboxmáy tính cho mỗi tác nhân được coi là một khả năng vô cùng lớn vì chúng tôi có thể giảm số lượng công cụ cố định và chỉ cần để những công cụ đó xuất hiện như một phần của quá trình tác nhân.

Trao Quyền cho Tác nhân với Công cụ và Kỹ năng

Điều này cũng đúng với việc giải quyết vấn đề. Tôi nghĩ trong các phiên bản đầu tiên của những sản phẩm này, tôi có tư duy rằng kỹ sư con người là người cần chuẩn bị để vạch ra và đối mặt với tất cả các kịch bản lỗiAIcông cụ tác nhân của bạn có thể gặp phải, thay vì mong đợi nó tự đưa ra các giải pháp mới lạ. Một ví dụ điển hình ở đây là chúng tôi đã tạo ra một công cụ dòng lệnh nhỏ gọi là agent browser. Giờ đây, VZero có khả năng viết mã nguồn. Nó biết rất rõ cách sử dụng Next.js. Và nếu nó phát hiện ra điều gì đó bị lỗi, nó có thể sử dụng trình duyệt để xem đầu ra. Nó có thể chụp ảnh màn hình, đọc developer log. Vì vậy, nó giống như trang bị cho tác nhân những công cụ mà con người sẽ có và không quá vi quản lý. Đây có thể là một bài học trong quản lý kỹ thuật nói chung. Bạn không muốn trở thành một người quản lý kiểu như: 'Này, bạn đã kiểm tra cái này chưa?' Hãy cứ để mô hình tự "thở" như bạn đã nói. Đây là những điều ở cấp độ cao. Điều đó cũng bao gồm việc áp dụng công cụ dòng lệnh. Vì vậy, tôi đã đề cập agent browser là một công cụ dòng lệnh. Thật đáng kinh ngạc khi thấy tác nhân học các công cụ mới mà không có trong dữ liệu huấn luyện. Agent browser, vốn là chương trình đối tác mà chúng tôi cung cấp cho tác nhân, ban đầu nó không thực sự biết cách sử dụng. Giờ đây, chúng tôi đã bổ sung thêm kỹ năng cho nó. Rõ ràng tại Vercel, chúng tôi rất chú trọng đến kỹ năng. Chúng tôi nhận thấy rằng nó giúp mô hình đạt được ý địnhkết quả nhanh hơn. Nhưng vâng, chứng kiến sự xuất hiện của việc tác nhân có cảm giác về cách các công cụ này "kết nối" với nhau, và nó có thể bắt đầu giải quyết vấn đề một cách rất sáng tạo, thì thật tuyệt vời.

Các Mô hình Tương tác và Quan điểm về Tương lai của Tác nhân

Vâng, hoàn toàn chính xác. Tôi tò mò về một số quan điểm mà bạn có. Có lẽ những điểm mà bạn có ý kiến về hướng đi của các mô hình mà đồng nghiệp của bạn có thể không đồng ý. Tôi biết bạn đôi khi có những quan điểm táo bạo, vậy hãy chia sẻ một cái ở đây nhé.

Được rồi, vâng, tôi nghĩ đây có lẽ là một sự đồng thuận rõ ràng rằng các tác nhân ngày càng cần ít sự giám sát hơn. Vì vậy, chúng tôi đang thử nghiệm tích hợp Slack để khởi chạy VZero Tasks trực tiếp từ Slack. Chúng tôi đã thấy rất nhiều đồng nghiệp xây dựng tác nhân của riêng họ và tự gọi chúng một cách bất đồng bộ. Có lẽ chúng ta đang chứng kiến sự thay đổi từ đồng bộ sang bất đồng bộ. Nói rộng hơn, tôi nghĩ tất cả các chế độ tương tác giữa con người và tác nhân sẽ tiếp tục tồn tại dưới một hình thức nào đó.

Chẳng hạn, cá nhân tôi thực sự thích CLI khi làm những việc rất cụ thể. Tôi đang giải quyết vấn đề. Tôi cần lấy debug log, tôi cần xem xét nó. Tôi cần sử dụng một loạt công cụ mà tôi đã biết có sẵn trên máy của mình, và tôi sử dụng CLI. Sau đó có một mô hình tương tác khác mà VZero thực sự giỏi, đó là khi bạn làm việc trên giao diện sản phẩm của mình hoặc gần giống như phát triển hướng giao diện người dùng (UI-driven development), nơi bạn cần phản hồi nhanh chóng giữa đầu ra front-endlời nhắc của mình. Và người vận hành con người thực sự tham gia vào một quá trình sáng tạo. Điều đó thay vì kéo dài hơn thì tôi cảm thấy nó đang thu hẹp lại. Ví dụ, tôi khá "nghiện" VZero Max Fast, được hỗ trợ bởi Claude Code Fast Mode. Nó thật điên rồ và cực kỳ đắt tiền. Tin tốt cho Anthropic đấy. Nhưng nó sẽ khiến bạn rơi vào trạng thái tập trung đáng kinh ngạc. Và điều này là vì loại mô hình tương tác với tác nhân này yêu cầu các vòng lặp cực kỳ nhanh. Tôi cảm thấy rất nhiều khách hàng nói với tôi rằng nó đã thay thế công cụ thiết kế của họ. Điều này có lẽ hơi táo bạo vì ngay cả tại Vercel, có rất nhiều nhà thiết kế yêu thích các công cụ kéo thả, art board và những thứ tương tự. Nhân tiện, tôi cũng yêu thích những công cụ đó. Tôi luôn nói với mọi người rằng điều này khá sốc. Nhưng khi tôi tạo ra Vercel deployment CLI và phiên bản đầu tiên của Next.js, tôi không bắt đầu bằng mã nguồn. Tôi đã thiết kế nó trong Sketch, tiền thân của Figma. Tôi đã thiết kế tất cả các trạng thái của CLI, chẳng hạn như lỗi triển khai. Điều này đã bị "ảnh hưởng nặng" bởi công cụ thiết kế. Nhưng tôi đã thấy cách mà khách hàng nói với tôi rằng VZero có thể thay thế những công cụ đó.

Và cuối cùng là điều tôi nghĩ sẽ có sự tăng trưởng lớn nhất trong tương lai: mô hình bất đồng bộ ít được con người giám sát hơn. Nơi bạn khởi chạy tác vụ của mình và nói: 'Tác nhân, hãy quay lại với tôi cùng giải pháp.'

Mô hình Tương tác Tác nhân Không Giám sát và Các Tổ chức Tự chủ

Và rõ ràng, chúng ta biết đây là Ralph với tiêu chí thoát. Nhưng ví dụ, CTO của chúng tôi đã tạo ra công cụ DeepSec tuyệt vời này, nơi chúng tôi áp dụng Claude CodeCodex vào các cơ sở mã nguồn khổng lồ song song bằng cách sử dụng sandbox. Và tiêu chí thoát là: 'hãy quay lại với tôi với một lỗi bảo mật có thể tái tạo được.' Và kết quả của nó thật đáng kinh ngạc. Chúng tôi hiện đã hợp tác với gần một tá dự án mã nguồn mở mà chúng tôi đã phát hiện ra các lỗ hổng nghiêm trọng. Và quá trình này thật kỳ diệu. Điều này khá buồn cười vì tôi ngồi trước CTO của mình ở văn phòng và anh ấy cứ lơ đãng một chút vì những tác nhân này đang chạy ngầm. Và đây là một chế độ hoàn toàn mới của tương tác giữa người và máy tính và tôi nghĩ nó sẽ phát triển rất nhiều.

Một quan điểm khác có thể còn táo bạo hơn là, mục tiêu của tác nhân không giám sát đó là xây dựng phần mềm của bạn. Nhưng tôi phải dừng lại ở đó, nó có thể là quảng bá phần mềm của bạn. Nó có thể là chạy chiến dịch. Nó có thể là phản hồi các yêu cầu hỗ trợ. Vì vậy, tôi nghĩ có một tương lai phía trước mà thay vì chỉ xây dựng phần mềm, chúng ta còn tiến xa hơn. Giống như chúng ta đang xây dựng các công ty tự chủtổ chức tự chủ. Và một lần nữa, nó ít được giám sát hơn. Và tôi nghĩ khi bạn thấy sự phấn khích xung quanh những thứ như OpenClawphát triển tác nhân dựa trên tin nhắn văn bản, bạn chỉ cần sử dụng ứng dụng nhắn tin của mình như một cách để giao phó tác vụ cho tác nhân của mình. Và bạn kỳ vọng rằng chúng sẽ mất một thời gian. Và một lần nữa, đây là một hình mẫu hoàn toàn khác so với cách chúng ta đã sử dụng máy tính trong quá khứ, đó là chúng ta mong đợi sự thỏa mãn tức thì. Nhưng thay vào đó, chúng ta chỉ gửi những tác nhân này đi làm việc.

Tôi đã sử dụng phép ẩn dụ gần đây, bởi vì có rất nhiều công ty tự chủ này đang tăng trưởng rất nhanh trên Vercel, hoặc các nhà xây dựng công ty tự chủ. Và nó hơi giống như bạn là thành viên hội đồng quản trị. Họ nghĩ về việc trở thành thành viên hội đồng quản trị của một công ty, đúng không? Bạn có cuộc họp hội đồng quản trị hàng quý. Bạn đưa phản hồi cho CEO. Bạn cấp cho họ nguồn lực. Có lẽ bạn là một nhà đầu tư. Bạn cấp cho họ vốn. Và họ bỏ đi và làm những điều tuyệt vời trên thế giới, hy vọng là vậy. Và sau đó quay lại và cung cấp cho bạn một báo cáo trạng thái. Vì vậy, bạn giống như đang nhìn thế giới từng quý một. Và tôi nghĩ người ta có thể ngoại suy mô hình tương tác đó với các tác nhân. 'Tôi sẽ cấp cho bạn một số nguồn lực. Tôi sẽ cấp cho bạn một thẻ tín dụng ảo. Tôi sẽ cấp cho bạn cái này. Hãy quay lại với tôi. Hãy xem bạn đã làm gì trong một tuần, một tháng, một quý.'

Kiến trúc cho Tương lai: Trao quyền và Token là Hạ tầng Mới

Vâng, hoàn toàn chính xác. Tôi tò mò về một số quan điểm mà bạn có. Và rõ ràng, bạn thấy rằng một số mô hình tương tác này sẽ thay đổi. Tại Vercel, các bạn kiến trúc như thế nào cho sự thay đổi đó? Rõ ràng bạn đã nói nhiều về sandbox và quan điểm của mình về nó. Nhưng khi bạn dự phóng về phía trước và những gì bạn có thể dự đoán từ một vài bản phát hành mô hình tiếp theo, bạn chuẩn bị cho điều đó như thế nào?

Vâng, một điều là tiếp tục trao quyền cho mọi người. Mỗi khi bạn gia nhập Vercel, chúng tôi sẽ yêu cầu bạn triển khai một cái gì đó. Bất kể vai trò của bạn là kỹ sư hay không, chúng tôi sẽ yêu cầu bạn triển khai một cái gì đó để bạn trải nghiệm. Chúng tôi thậm chí còn yêu cầu mọi người đăng ký tài khoản GitHub. Có thể đó là Git commit đầu tiên và cuối cùng họ thực hiện cho một số vai trò. Và tôi nghĩ rằng điều đó luôn là về việc trao quyền cho mọi người và giúp họ nhận ra rằng họ không có giới hạn nào cả. Họ có thể sử dụng những công cụ này. Và tôi cố gắng làm gương. Tôi có một kênh Slack nơi tôi đổ não, được gọi là brain route G. Và tôi cố gắng thường xuyên cho công ty thấy cách tôi sử dụng các công cụ khác nhau, mô hình hình ảnh, mô hình video, cách tôi tự lập trình các công cụ năng suất nhỏ của riêng mình, cách tôi sử dụng AI cấp độ hệ điều hành. Vì vậy, cố gắng thật năng động trong việc chia sẻ kiến thức về các phương pháp hay nhất, tôi đã trao quyền cho mọi người ngay cả từ góc độ vốn. Tôi không thích ý tưởng về một bảng xếp hạng token ai đốt cháy nhiều token nhất nhanh nhất. Nhưng tôi thích ý tưởng rằng, và nhân tiện, có một sự tương đồng giữa mô hình tiêu thụ token đám mây và những gì đám mây đã làm cho chúng ta. Giống như khi Vercel mới bắt đầu, thật kỳ diệu khi tôi có thể chỉ cần đăng ký một tài khoản AWS và sau đó làm phép thuật với nó. Và tôi nghĩ có điều gì đó cần nói về việc token gần giống như cơ sở hạ tầng mới bởi vì bạn nói với mọi người, 'Được rồi, bạn biết đấy, bạn có tất cả những token này. Một số rất thông minh, có thể rất thông minh và rất nhanh như fast mode. Bạn sẽ cẩn thận hơn một chút với những token đó. Một số thực sự không đắt tiền như mô hình mở của các nhà cung cấp suy luận nhất định.' Và vì vậy, biết rằng đây là nguyên liệu thô mới của bạn, đất sét mới của bạn để định hình các giải pháp mới.

Trao quyền và Hợp tác trong Phát triển Tác nhân

Và tôi nghĩ rằng việc nhận ra mọi người trong công ty, không chỉ riêng Giám đốc Công nghệ (CTO), đều có thể thực hiện những điều này đã giúp chúng tôi tiến xa. Điều đó thật đáng kinh ngạc. Tôi cho rằng Vercel là một công ty tuyệt vời. Thật tuyệt vời khi có bạn ở đây và được lắng nghe quan điểm của bạn về cách các nhóm này có thể cải thiện, cũng như cách các bạn đang xây dựng các tác nhân và trao quyền cho rất nhiều nhà phát triển để thực hiện điều này. Thật vinh dự khi được hợp tác với các bạn. Cảm ơn rất nhiều.

Góp ý / Báo lỗiPhát hiện sai sót hoặc có ý tưởng cải thiện?