Building the future of agents with Claude

Nền tảng nhà phát triển Claude đã phát triển từ một API đơn thuần thành một hệ sinh thái toàn diện, cung cấp các công cụ và SDK nâng cao để xây dựng các Tác nhân AI tự chủ, bao gồm các tính năng như caching prompt, web search và thực thi mã.
Anthropic định nghĩa Tác nhân AI là mô hình AI có khả năng tự chủ trong việc lựa chọn, gọi công cụ, xử lý kết quả và quyết định bước đi tiếp theo, khuyến khích xu hướng giảm thiểu "khung sườn hỗ trợ" (scaffolding) để "giải phóng" trí tuệ của mô hình.
SDK Claude Code được khuyến nghị làm điểm khởi đầu cho việc xây dựng Tác nhân AI, hoạt động như một "khung tác nhân" (agent harness) đa năng giúp tự động hóa các vòng lặp tác nhân và việc gọi công cụ, đồng thời nhấn mạnh tầm quan trọng của việc xác định giá trị kinh doanh và khả năng quan sát cho các tác vụ dài hạn.

Tận dụng Nền tảng nhà phát triển Claude: Khám phá và sử dụng toàn bộ các API, SDK, tài liệu và trải nghiệm bảng điều khiển vì nền tảng này đã mở rộng đáng kể để hỗ trợ việc xây dựng các ứng dụng AI phức tạp.
Thiết kế cho khả năng tự chủ của Tác nhân AI: Tập trung vào việc cho phép mô hình AI tự quyết định các bước tiếp theo, chọn và sử dụng công cụ một cách độc lập thay vì định tuyến cứng nhắc, để khai thác tối đa trí tuệ của mô hình.
Giảm thiểu "khung sườn hỗ trợ" (Scaffolding): Tránh các framework quá nặng nề hoặc các "guardrails" hạn chế, vì các mô hình AI hiện đại có khả năng hiểu ngữ cảnh và lý luận tốt hơn, có thể bị cản trở bởi quá nhiều hướng dẫn.
Bắt đầu với SDK Claude Code: Sử dụng SDK Claude Code để nhanh chóng tạo prototype Tác nhân AI, vì nó cung cấp một "khung tác nhân" đa năng giúp tự động hóa vòng lặp tác nhân và việc gọi công cụ cơ bản.
Khai thác các công cụ tích hợp: Sử dụng các tính năng nền tảng như web search và web fetch để mở rộng khả năng của tác nhân, cho phép chúng thực hiện các tác vụ nghiên cứu sâu một cách hiệu quả.
Xác định rõ ràng Giá trị Kinh doanh: Trước khi triển khai các dự án Tác nhân AI, hãy xác định rõ ràng giá trị kinh doanh mà nó sẽ mang lại (ví dụ: tiết kiệm giờ kỹ thuật, tự động hóa công việc thủ công) để định hướng phạm vi và mục tiêu.
Đầu tư vào Khả năng Quan sát (Observability): Chuẩn bị cho việc giám sát và kiểm toán các Tác nhân AI, đặc biệt là các tác vụ chạy lâu, để hiểu cách chúng hoạt động, điều chỉnh prompt và tinh chỉnh việc gọi công cụ khi cần thiết.
Tận dụng Trừu tượng hóa bậc cao: Chú ý đến các giải pháp và trừu tượng hóa bậc cao hơn từ Anthropic trong tương lai, vì chúng được thiết kế để tối ưu hóa hiệu suất và đơn giản hóa quá trình phát triển Tác nhân AI.

nhà phát triển — Developer
mô hình AI — AI Model
Tác nhân AI — AI Agent
Nền tảng nhà phát triển Claude — Claude Developer Platform
API — Application Programming Interface
SDK — Software Development Kit
tự chủ — Autonomous / Autonomy
gọi công cụ — Tool Calling
khung sườn hỗ trợ — Scaffolding
khả năng quan sát — Observability
vòng lặp tác nhân — Agentic Loop
trường hợp sử dụng — Use Case

Giới thiệu Nền tảng và Định nghĩa Tác nhân AI

Với tư cách là một nhà phát triển, khả năng sáng tạo của tôi có giới hạn, tôi chỉ có thể nghĩ ra bấy nhiêu trường hợp sử dụng. Nhưng mô hình AI, giống như bất cứ thứ gì, bất cứ điều gì mà ai đó đưa ra, mô hình AI sẽ tìm ra cách để thực hiện điều đó. Xin chào, tôi là Alex, tôi phụ trách Quan hệ Claude tại Anthropic. Hôm nay, chúng ta sẽ nói về việc xây dựng tương lai của các Tác nhân AI với Claude. Cùng tham gia với tôi là các đồng nghiệp của tôi. Tôi là Brad. Tôi điều hành nhóm PM trên Nền tảng nhà phát triển Claude. Tôi là Caitlin. Tôi dẫn dắt nhóm kỹ thuật cho Nền tảng nhà phát triển Claude. Chúng ta hãy nói về Nền tảng nhà phát triển Claude. Vâng, hãy bắt đầu với điều đó. Hãy bắt đầu với điều đó. Bạn nói về API của Anthropic. Vâng, chúng tôi vừa trải qua một sự thay đổi tên lớn. Vâng. Bạn có thể giải thích lý do chúng tôi thực hiện thay đổi đó và nền tảng mới này là gì, nó bao gồm những gì không? Vâng, hoàn toàn có thể. Nền tảng nhà phát triển Claude thực sự bao gồm các API, SDK, tài liệu của chúng tôi, tất cả các trải nghiệm của chúng tôi trong bảng điều khiển, và thực sự là mọi thứ mà một nhà phát triển cần để xây dựng trên Claude. Chúng tôi thực sự khiêm tốn và tự hào được phục vụ những khách hàng tuyệt vời trên khắp thế giới đang cố gắng, như chúng tôi muốn nói, nâng cao trần trí tuệ bằng cách sử dụng Claude, và nền tảng này thực sự cho phép họ làm điều đó. Và tôi muốn nói rằng một trong những phần yêu thích của tôi về nó là nền tảng không chỉ phục vụ khách hàng bên ngoài. Nền tảng thực sự phục vụ sản phẩm nội bộ của chúng tôi. Vì vậy, chúng tôi rất thích nói với mọi người rằng Claude Code, chẳng hạn, thực sự được xây dựng trực tiếp trên nền tảng public của chúng tôi. Tôi hiểu rồi. Vâng, ý tôi là, tôi nghĩ khi chúng tôi bắt đầu, chúng tôi chỉ là API của Anthropic. Đó là quyền truy cập rất đơn giản vào mô hình AI. Nhưng trong năm vừa qua, chúng tôi đã thêm rất nhiều tính năng vào đó. Chúng tôi đã thêm caching prompt. Chúng tôi đã thêm một loạt API hàng loạt riêng biệt. Chúng tôi đã thêm web search, web fetch, hỗ trợ quản lý ngữ cảnh, thực thi mã. Vì vậy, tất cả những công cụ này, bây giờ điều này, chúng tôi cảm thấy, vâng, đó là một khát vọng, nó là một nền tảng bây giờ. Tôi hiểu rồi. Vì vậy, bây giờ có nhiều thứ hơn trong đó. Nó đã phát triển một cách khá mạnh mẽ trong năm qua. Vâng, vâng, tốt hơn bất cứ thứ gì. Vâng. Và tôi nghĩ đó là điều mà các nhà phát triển dù sao cũng đã gọi nó. Vâng. Vì vậy, việc đi theo những gì các nhà phát triển đang nói là điều tự nhiên. Đúng vậy. Chúng tôi hơi chậm chân trong việc đó. Vì vậy, không sao cả. Nó đã đúng. Không sao cả. Không sao cả. Chúng tôi đã sửa đổi. Một trong những điều thú vị bạn có thể làm bây giờ, khi chúng tôi đang chuyển từ mô hình trò chuyện sang có lẽ là tương lai tác nhân đích thực hơn, là xây dựng các Tác nhân AI như một phần của nền tảng nhà phát triển này. Trước khi chúng ta đi sâu vào cách chúng tôi thực sự làm điều đó trên nền tảng, chúng ta có thể nói về Tác nhân AI là gì ngay từ đầu không? Vâng. Ý tôi là, các Tác nhân AI, nó gần giống như một từ thông dụng, phải không? Vâng. Mọi người bạn nói chuyện bây giờ đều đang xây dựng các Tác nhân AI. Và bất cứ khi nào một thuật ngữ công nghệ trong ngành đạt đến cấp độ đó, định nghĩa sẽ trở nên rất mơ hồ. Bởi vì mọi thứ mọi người xây dựng đều là một Tác nhân AI. Nhưng tại Anthropic, điều chúng tôi thực sự nghĩ về Tác nhân AI là nơi mô hình AI đang tự chủ để có thể chọn công cụ nào để gọi, để gọi các công cụ đó, để xử lý các kết quả và chọn bước tiếp theo. Vì vậy, với tư cách là một phòng thí nghiệm nghiên cứu nền tảng, dựa vào mô hình AI và lý luận của nó, cách nó quyết định phải làm gì, chúng tôi nghĩ đó là một yếu tố thực sự quan trọng của Tác nhân AI là gì. Vì vậy, nó giống như khía cạnh của việc nó tự chủ theo một nghĩa nào đó. Vâng. Vâng. Vâng. Hoàn toàn đúng. Ý tôi là, tôi nghĩ cũng có, ý tôi là, chúng tôi có khách hàng đang thực hiện các quy trình làm việc thực sự hữu ích, nơi họ đang xác định trước con đường mà Claude nên đi, và đó là một điều cực kỳ hữu ích để làm. Nhưng điều hay về khả năng tác nhân là khi mô hình AI ngày càng tốt hơn, cứ vài tháng một lần, chúng tôi phát hành một mô hình AI mới. Và với một mẫu tác nhân thực sự, các dịch vụ đó sẽ ngày càng tốt hơn. Trong khi đó, nếu bạn xây dựng một quy trình làm việc với nhiều scaffolding trong đó, bạn sẽ đặt giới hạn cho mô hình AI, điều này có thể ổn trong một số trường hợp sử dụng. Nhưng điều đó có nghĩa là bạn có thể không tận dụng được cấp độ trí tuệ tiếp theo mà một bản phát hành mô hình AI tiếp theo mang lại.

Xu hướng Tác nhân AI và Giảm Khung sườn hỗ trợ

Vâng. Vì vậy, dường như có một xu hướng thú vị với các Tác nhân AI, ít nhất là trong sáu đến mười hai tháng qua, nơi, như bạn đã nói, scaffolding đã gây trở ngại một chút, và có lẽ chúng ta đang loại bỏ một số điều đó. Bạn có thể giải thích những trực giác đằng sau điều đó, liệu đây có thực sự là tương lai không? Giống như chúng ta càng ngày càng ít đưa mọi thứ cho mô hình AI hơn? Vâng. Ý tôi là, tôi nghĩ theo thời gian, điều chúng ta đang thấy là scaffolding mà mô hình AI cần để hoàn thành các tác vụ. Nó đang cần ít hơn khi cấp độ trí tuệ của mô hình AI tăng lên. Và chúng tôi tin rằng nó sẽ tiếp tục tăng lên, về cơ bản mô hình AI có sự hiểu biết theo ngữ cảnh tốt hơn về tác vụ cấp cao mà nó đang cố gắng hoàn thành. Do đó, nó không cần nhiều guardrails (rào chắn) nữa. Và trên thực tế, những guardrails đó, trong một số trường hợp, trở thành một trách nhiệm phải có. Chúng tôi đã có những khách hàng thử nghiệm các mô hình AI mới và nói, ồ, thực ra nó chỉ tốt hơn một chút. Và sau đó chúng tôi cùng họ tìm hiểu xem điều gì đang xảy ra. Và hóa ra, vâng, họ đã hạn chế nó theo những cách khiến họ khó nhìn thấy trí tuệ của mô hình AI hơn. Điều này có phù hợp với những gì chúng ta thấy trong thực tế với khách hàng của chúng ta, nơi họ cũng đang tuân theo những xu hướng tương tự không? Tôi biết ở mức giới hạn, chúng tôi có khách hàng đang khám phá đủ loại kỹ thuật sáng tạo để quản lý Claude. Vâng, hoàn toàn. Và thực sự có rất nhiều cuộc thảo luận về điều này ngay bây giờ, phải không? Tác nhân AI là gì và nó cần gì? Bạn cần xây dựng gì? Và có những người nói, "nó chỉ là một while loop (vòng lặp while). Chúng ta không cần phải cố gắng quá nhiều." Và tôi nghĩ cuối cùng, đã có rất nhiều sự phát triển của các framework mà mọi người đang đặt xung quanh mô hình AI để giúp họ điều phối các Tác nhân AI của mình, cố gắng tận dụng tối đa mô hình AI. Và tôi nghĩ điều mà ngành công nghiệp có lẽ đang xoay quanh là nhiều điều đó đã trở nên quá nặng nề và có lẽ quá thiên vị. Đó là lý do tại sao bạn nhận được những người quay lại với bạn như, "nó chỉ là một while loop và đó là tất cả những gì bạn cần." Và tôi nghĩ điều chúng tôi đang cố gắng làm ở đó là nói rằng có lẽ trong nhiều cách nó là một while loop nhưng những điều chúng tôi có thể làm độc đáo hơn để giúp mọi người tận dụng tối đa mô hình AI là rất nhiều công cụ, tính năng và những thứ khác đó. Và vì vậy điều chúng tôi muốn làm là đưa ra các framework, công cụ và nền tảng có tính thiên vị ở một mức độ nào đó về cách mọi người nên sử dụng những công cụ đó. Nhưng nó không phải là một framework quá nặng nề mà thực sự, theo quan điểm của Brad, cản trở những gì mô hình AI cuối cùng đang cố gắng làm. Vì vậy, đó là tìm đúng sự cân bằng. Nó giống như, chúng tôi đã thấy những gì nhiều người đã cố gắng làm nên chúng tôi biết chúng tôi có thể có thiên vị ở đó nhưng chúng tôi muốn nhẹ nhàng trong cách chúng tôi làm điều đó và đảm bảo rằng điều thực sự chúng tôi đang làm là giúp bạn tận dụng tối đa mô hình AI mà không làm bạn bị mắc kẹt trong một framework quá nặng nề. Đúng vậy, vậy bạn có mô tả một phần chiến lược ở đây là cung cấp những công cụ phụ trợ và những thứ mà chúng ta có thể cung cấp cho mô hình AI nhưng chúng ta không nhất thiết phải đặt giới hạn trên chính mô hình AI hay gì đó không? Vâng, chúng tôi nghĩ về nó như, làm thế nào để bạn giải phóng mô hình AI? Mô hình AI đã có rất nhiều khả năng. Và trên thực tế, tôi tin rằng ngay cả khi bạn lấy thế hệ mô hình AI hiện tại của mình, có nhiều trí tuệ hơn trong đó mà chúng ta chưa thể khai thác. Nhưng dù sao, trực giác đó là nếu bạn chỉ cung cấp cho mô hình AI các công cụ nó cần và giải phóng nó, cho phép nó sử dụng những công cụ đó một cách đúng đắn, bạn sẽ nhận được kết quả tuyệt vời. Và tôi nghĩ một ví dụ điển hình về điều đó là chúng tôi đã ra mắt công cụ web search phía máy chủ và công cụ web fetch. Và thật thú vị khi xem khách hàng sử dụng chúng và tất cả những gì chúng tôi đã làm, ý tôi là, đó là một câu lệnh rất tối thiểu mà chúng tôi có, chúng tôi chỉ cung cấp cho nó công cụ web search. Và giống như đột nhiên, các tác vụ nghiên cứu sâu gần như được hoàn thành hoàn toàn chỉ bằng cách bật công tắc đó trên API bởi vì mô hình AI sẽ gọi công cụ đó, nó sẽ xem xét kết quả của nó, nó sẽ cân nhắc và nói, "được rồi, có lẽ tôi cần gọi, thực hiện các tìm kiếm khác và sau đó tất cả liên kết thứ tư bạn trả về, đó là cái tuyệt vời nhất." Nó sẽ thực hiện web fetch trên liên kết đó và đưa dữ liệu đó trở lại. Và thực sự tất cả điều đó rất tự chủ theo cách riêng của nó, tự quyết định. Đúng vậy, tôi nghĩ nó gần giống như một sự thay đổi thú vị trong việc trí tuệ của một hệ thống đang được áp dụng ở đâu. Từ việc nhà phát triển phải áp dụng trí tuệ của họ để hướng dẫn mô hình AI, giờ đây mô hình AI tự mình làm điều đó. Và thật thú vị khi mô hình AI làm được điều đó bởi vì với tư cách là một nhà phát triển, khả năng sáng tạo của tôi kết thúc ở một điểm nào đó. Tôi chỉ có thể nghĩ ra rất nhiều trường hợp sử dụng. Nhưng mô hình AI, giống như bất cứ thứ gì, bất cứ điều gì ai đó đưa ra, mô hình AI sẽ tìm ra cách để thực hiện điều đó. Vì vậy, thật tuyệt, thật tuyệt khi giải phóng mô hình AI.

Bắt đầu với Nền tảng Nhà phát triển Claude và Giá trị Kinh doanh

Vâng, vậy nếu tôi là một nhà phát triển ngày nay và tôi đang bắt đầu xây dựng với Nền tảng nhà phát triển, bạn đề xuất gì? Một số best practice (thực hành tốt nhất) hoặc cách để tôi bắt đầu là gì? Vâng, về mặt kỹ thuật, thực ra, điều số một mà chúng tôi đề xuất ngay bây giờ là SDK Claude Code. Và điều thực sự, thực sự thú vị về SDK Claude Code là chúng tôi về cơ bản đã xây dựng một harness tác nhân, một harness tác nhân xung quanh mô hình AI để chạy vòng lặp tác nhân đó, phải không, và tự động hóa rất nhiều tool calling (gọi công cụ) và sử dụng tính năng khác. Và rõ ràng, ban đầu, nó được xây dựng cho mục đích lập trình. Và điều mà nhóm đã nhanh chóng nhận ra là thực ra đây là một harness tác nhân đa năng tuyệt vời. Và vì vậy, SDK làm gì là nó cung cấp cho mọi người một giải pháp hoàn hảo, sẵn có để thực sự bắt đầu prototyping Tác nhân AI mà không cần phải đi xây dựng vòng lặp tác nhân với tất cả tool calling và những thứ khác. Nó được xây dựng dựa trên API tin nhắn và tất cả những công cụ tương tự mà chúng tôi đang đề cập. Nhưng nó cung cấp cho bạn một điểm khởi đầu thực sự tuyệt vời ngay lập tức. Đúng vậy, tôi cảm thấy đây là một quan niệm sai lầm khá phổ biến ít nhất là khi tôi nói chuyện với các nhà phát triển về SDK Claude Code. Vì vậy, tôi không xây dựng một ứng dụng lập trình, tại sao tôi lại muốn sử dụng cái này? Nhưng bạn có thể loại bỏ các phần cụ thể về lập trình. Ý tôi là, tôi nghĩ đó là một ví dụ tuyệt vời về những gì chúng ta đang nói về việc loại bỏ scaffolding trên mô hình AI. Giống như khi chúng tôi hoàn thành việc loại bỏ mọi thứ khỏi Claude Code để thực sự giải phóng mô hình AI, hóa ra không còn gì liên quan đến lập trình nữa. Khi bạn loại bỏ mọi thứ khác, thì nó chỉ là một vòng lặp tác nhân. Và bạn thực sự là một thứ tối giản để cung cấp cho Claude quyền truy cập vào một hệ thống tệp, vào một bộ công cụ dòng lệnh Linux, vào khả năng viết mã và thực thi mã đó. Vì vậy, đó là tất cả những khả năng rất chung chung mà hóa ra có thể giải quyết nhiều loại vấn đề. Đúng vậy, vâng, tôi cảm thấy có điều gì đó tôi đã gặp phải trong các dự án cá nhân của mình và cũng thấy với các dự án trong Anthropic là trước SDK Claude Code, mọi người đều triển khai một số hình thức quản lý bộ nhớ đệm lời nhắc hoặc một số hình thức quản lý tool calling của họ và vòng lặp đó. Đúng vậy, đúng vậy. Và bây giờ thì, ồ, chỉ bắt đầu từ điểm này. Sau đó tôi xây dựng từ đó. Bạn bắt đầu ở một cấp độ cao hơn một chút. Vâng, vâng, vâng. Vì vậy, nó giống như một mức độ trừu tượng cao hơn. Tôi nghĩ điều đó cực kỳ thú vị. Tôi nghĩ điều thực sự thú vị khác cần suy nghĩ, đặc biệt đối với các doanh nghiệp đang xem xét các tác nhân, như trường hợp sử dụng nào để nhắm mục tiêu. Vì vậy, nghĩ xa hơn về công nghệ, vấn đề thực sự cần giải quyết là gì? Và tôi nghĩ chúng tôi thấy rất nhiều khách hàng và đang làm rất nhiều điều, chúng tôi yêu tất cả. Nhưng nơi có tác động lớn nhất là nơi khách hàng đã suy nghĩ kỹ về giá trị kinh doanh của điều này là gì. Liệu nó có thực sự tiết kiệm được bấy nhiêu giờ kỹ thuật hay nó sẽ giúp chúng ta loại bỏ bấy nhiêu công việc thủ công hay gì đó không? Và việc có thể trình bày rõ ràng những gì bạn mong đợi kết quả của dự án tác nhân sẽ như thế nào, tôi nghĩ điều đó thực sự hữu ích trong việc xác định phạm vi của Tác nhân AI. Đúng vậy. Và quay lại một lần nữa với SDK.

Khả năng ứng dụng của `SDK` và Định hướng phát triển tương lai

Người nói: Vậy có vẻ như nó thực sự, thực sự hữu ích cho các nhà phát triển cá nhân, như tôi, những người mới bắt đầu và chỉ muốn nhanh chóng bắt tay vào một điều gì đó cho những khách hàng này. Đối với các doanh nghiệp đang thực sự cố gắng tạo ra giá trị kinh doanh thực từ những thứ này, liệu họ có nên sử dụng SDK không? Nó đã sẵn sàng cho họ chưa? Đã sẵn sàng cho các trường hợp sử dụng chuyên nghiệp như vậy chưa?

Phản hồi: Vâng, tôi nghĩ theo nhiều cách thì nó đã sẵn sàng. Nếu bạn đang ở vị trí có thể triển khai runtime đó – về cơ bản, đó là những gì bạn nhận được từ SDK: một runtime của vòng lặp tác nhân (agentic loop). Bạn có thể triển khai runtime đó ở bất cứ đâu bạn muốn khi bạn sẵn sàng làm như vậy. Nhưng tôi nghĩ điều chúng tôi thực sự đang cố gắng làm là nắm bắt tinh thần của những gì SDK mở khóa cho mọi người. Tức là đi lên cấp độ trừu tượng hóa (abstraction) cao hơn, nơi chúng tôi cung cấp cho bạn vòng lặp tác nhân, chúng tôi cung cấp cho bạn nhiều khả năng gọi công cụ (tool calling) một cách tự động và đặt câu hỏi: làm thế nào chúng ta có thể học hỏi từ đó và cung cấp cho mọi người các giải pháp sẵn có mà ở quy mô lớn thực sự có thể giải quyết các trường hợp sử dụng (use cases) của họ. Và tôi nghĩ đó là phần lớn định hướng của lộ trình phát triển (roadmap) của chúng tôi trong phần còn lại của năm.

Và một điểm thực sự quan trọng khi chúng ta nghĩ về điều đó là nếu toàn bộ mục tiêu ở đây là giúp người dùng thực sự nâng cao giới hạn trí thông minh (intelligence), đạt được kết quả tốt nhất tuyệt đối từ các mô hình AI, thì các trừu tượng hóa bậc cao không chỉ làm cho mọi thứ dễ dàng hơn vì bạn không phải tự viết tất cả mã (code) đó. Thực ra, đó là cách chúng tôi có thể thực sự giúp bạn đạt được kết quả tốt nhất, bởi vì chúng tôi đã làm việc cùng với nhóm nghiên cứu, cùng với nhóm suy luận (inference), chúng tôi biết cách đảm bảo rằng các trừu tượng hóa của chúng tôi, vòng lặp tác nhân của chúng tôi sẽ cực kỳ mạnh mẽ và cực kỳ hiệu quả khi làm việc với Claude.

Khả năng quan sát (Observability) trong các tác vụ dài hạn

Phản hồi: Và điều cuối cùng tôi muốn thêm vào là, đặc biệt khi những tác vụ này chạy lâu hơn và khi chúng tôi cung cấp ngày càng nhiều công cụ để giúp mọi người thực hiện các tác vụ chạy lâu hơn đó, một vấn đề lớn khác mà chúng tôi biết người dùng của mình sẽ tiếp tục cố gắng giải quyết là khả năng quan sát (observability) trong các tác vụ chạy lâu hơn đó. Và đó là một trong những điều phổ biến nhất mà mọi người gặp phải là: "Tôi có những tác vụ chạy lâu này, tôi đang cố gắng đạt được những kết quả tuyệt vời này, nhưng tôi có thể cần điều chỉnh một chút, nơi tôi có thể cần tinh chỉnh câu lệnh (prompt) của mình hoặc tôi có thể cần suy nghĩ về gọi công cụ một cách khác." Và đó là điều mà chúng tôi biết có thể cung cấp cho mọi người khả năng quan sát đó thông qua nền tảng theo thời gian, và đó là một lĩnh vực trọng tâm lớn khác đối với chúng tôi.

Người nói: Được rồi, điều đó thực sự thú vị. Ý tôi là, đây là một vấn đề lớn đang bắt đầu trở nên cấp bách với các tác nhân AI. Tôi nghĩ vậy, đặc biệt là khi bạn tin tưởng chúng sẽ hoạt động trong một số ứng dụng khác ở chế độ nền. Làm thế nào để bạn đảm bảo chúng thực sự làm đúng việc và sau đó nếu bạn đang triển khai chúng? Vâng, làm thế nào để bạn kiểm toán nó? Giống như nếu chúng ta sẽ cung cấp một mức độ tính tự chủ (autonomy) nào đó cho hệ thống, thì cần phải có một cách để kiểm toán nó và đảm bảo những điều đúng đắn đang xảy ra để bạn có thể điều chỉnh mọi thứ, v.v. Vì vậy, tôi nghĩ khả năng quan sát thực sự là một phần cốt lõi của điều này. Và ghi nhớ điều đó, tôi muốn đặt một câu hỏi về tương lai của cách chúng ta sẽ giải quyết vấn đề đó.

Công cụ quản lý ngữ cảnh và bộ nhớ cho nhà phát triển

Người nói: Trước khi tôi làm điều đó, có những công cụ nào khác hiện có mà mọi người nên biết khi bắt đầu với nền tảng dành cho nhà phát triển (developer platform) không? Những điều bạn đã thấy hữu ích hoặc có giá trị?

Phản hồi: Vâng, ý tôi là, tôi nghĩ có một... chúng tôi đã đề cập đến tìm kiếm web (web search) và lấy dữ liệu web (web fetch). Tôi nghĩ một điều lớn khác mà chúng tôi đang thấy là khách hàng phải làm, hiện tại phải làm rất nhiều việc để quản lý cửa sổ ngữ cảnh (context window). Theo mặc định, Claude có 200K mã thông báo (tokens) ngữ cảnh. Chúng tôi hiện có một triệu mã thông báo có sẵn ở phiên bản beta trên SANA, điều đó thật tuyệt, nhưng ngay cả một triệu cũng có giới hạn. Và điều mà nhiều khách hàng đã nói với chúng tôi là họ nhận được đầu ra (outputs) tốt hơn, trí thông minh cao hơn nếu họ thậm chí sử dụng một phần nhỏ hơn của ngữ cảnh. Vì vậy, chúng tôi đã thực hiện, chúng tôi có một vài tính năng thú vị sắp ra mắt để giúp các nhà phát triển quản lý ngữ cảnh đó.

Vì vậy, trong các vòng lặp tác nhân này, rất nhiều lần bạn đang thực hiện 10, 15, 100 lệnh gọi công cụ (tool calls), chỉnh sửa tệp này hoặc tra cứu dữ liệu trong cơ sở dữ liệu này hoặc gửi email này. Và mỗi lệnh gọi công cụ đó chiếm 100, 200, 1000 mã thông báo. Và vì vậy, chúng tôi có tính năng thú vị này cho phép bạn, cho phép mô hình AI thực sự loại bỏ một số lệnh gọi công cụ cũ hơn không còn cần thiết nữa. Thật thú vị. Và điều đó giống như việc bạn dọn dẹp (declutter) bàn làm việc và dọn dẹp sổ tay của mình, bạn có thể tập trung tốt hơn một chút. Vì vậy, nếu bạn dọn dẹp câu lệnh, thực ra, mô hình AI có thể tập trung tốt hơn một chút.

Người nói: Thú vị. Vậy, được rồi, chúng ta đang loại bỏ ngữ cảnh không cần thiết. Có rủi ro nào là chúng ta loại bỏ ngữ cảnh cần thiết không?

Phản hồi: Vâng, vâng, vâng. Vì vậy, chúng tôi có một số rào chắn an toàn (guard rails) và một số giới hạn (bounds) xung quanh nó. Vì vậy bạn không... nhưng quy tắc chung là nếu bạn loại bỏ, chúng tôi cố gắng loại bỏ các công cụ đã được sử dụng từ nhiều lượt (turns) trước. Được rồi. Mô hình AI đã đưa ra quyết định dựa trên các công cụ đó. Nhưng nếu bạn, vâng, tôi đã thử nghiệm nó gần đây và tôi đã loại bỏ các công cụ mà nó vừa gọi. Và nó nói, "Ồ, kết quả công cụ của tôi đã biến mất. Tôi không biết phải làm gì." Và sau đó, nhưng mô hình AI đang chạy nó không bỏ cuộc. Nó nói, "Tôi sẽ gọi công cụ này lần nữa." Vâng, vâng, vâng. Nhưng vâng, nói chung chúng tôi đã đặt một số giới hạn cho điều đó vì kinh nghiệm đó. Vì vậy, chúng tôi giữ lại tập hợp các công cụ gần đây nhất. Tôi hiểu rồi.

Và sau đó điều thú vị khác chúng tôi làm là, đánh dấu kết thúc (tombstone) nó. Với điều đó, chúng tôi muốn nói rằng, khi chúng tôi loại bỏ các lệnh gọi công cụ, chúng tôi đặt một ghi chú vào đó cho mô hình AI. Tôi nói, "Ồ, kết quả công cụ cho lệnh tìm kiếm (search call) này là những gì chúng ta có ở đây. Ồ, được rồi. Chúng đã bị loại bỏ." Mô hình AI không hoàn toàn giống như xóa bộ nhớ (memory wipes) hoàn toàn. Chính xác. Tôi nghĩ chúng tôi thấy mô hình AI hoạt động tốt hơn nếu chúng ta chỉ cung cấp cho nó thêm một chút ngữ cảnh về những gì đang xảy ra. Đúng vậy. Và đó là một tính năng then chốt. Đúng vậy.

Tính năng Bộ nhớ Tác nhân (Agentic Memory)

Phản hồi: Và một tính năng khác là một loại tính năng bộ nhớ tác nhân (agentic memory) mà chúng tôi đã thêm vào. Và ở đó chúng tôi đã thấy rằng mô hình AI hoạt động... giống như hiện tại nếu bạn giao một tác vụ cho mô hình AI, ví dụ như một tác vụ nghiên cứu chuyên sâu hoặc chơi Pokemon hoặc bất cứ điều gì, mô hình AI hoạt động gần như giống nhau mỗi khi nó chạy. Nhưng nếu bạn giao một tác vụ cho một người, thì lần thứ năm người đó thực hiện tác vụ đó, họ làm tốt hơn nhiều. Bởi vì họ đã học được, được rồi, nếu tôi định thực hiện tìm kiếm này, có lẽ trang Wikipedia tốt hơn trang web khác hoặc bất cứ điều gì. Giống như họ học được điều gì đó để họ trở nên tốt hơn theo thời gian. Vì vậy, chúng tôi đã cung cấp công cụ bộ nhớ này cho mô hình AI bây giờ để mô hình AI thực sự có thể ghi chú trong khi nó đang hoạt động và nói, "Ồ, tôi nhận ra rằng trang web này có thể không phải là trang đúng hoặc nếu tôi đang thực hiện một tìm kiếm, nó nên giống như thế này hoặc nếu tôi đang tra cứu, tôi nên sử dụng cơ sở dữ liệu này, không phải cơ sở dữ liệu đó hoặc bất cứ điều gì." Và nó tạo ra những ghi chú đó. Và sau đó khi nó bế tắc, nó thực sự có thể quay lại và xem lại ghi chú của mình và nói, "Được rồi, như, ồ, tôi đang bắt đầu tác vụ này, hãy để tôi đọc ghi chú để tôi có thể tìm ra." Tuyệt vời. Vậy chúng ta đang xử lý tất cả những điều đó cho nhà phát triển.

Phản hồi: Vâng, vâng, chúng tôi đang cung cấp cho mô hình AI khả năng cốt lõi này để thực hiện bộ nhớ. Và hiện tại chúng tôi đang để nhà phát triển quản lý bộ nhớ vì các nhà phát triển khác nhau có thể muốn lưu trữ nó trong một số lưu trữ đám mây (cloud storage) hoặc họ có thể muốn lưu trữ nó ở một nơi nào đó khác. Vì vậy, chúng tôi đang để các nhà phát triển tìm ra chính xác nơi để lưu trữ bộ nhớ để họ có nhiều quyền kiểm soát hơn đối với điều đó. Nhưng vẫn lộ rõ công cụ (exposing the tool). Vâng, vẫn lộ rõ công cụ, tôi muốn nói.

Tầm nhìn Tương lai và `Claude` với "Máy tính"

Người nói: Vậy quay lại câu hỏi về lộ trình phát triển (roadmap) ở đây. Có vẻ như có rất nhiều tính năng mới mà chúng tôi đã ra mắt gần đây. Có rất nhiều động lực và bây giờ cũng có các dịch vụ khác như SDK Claude Code và những thứ sắp ra mắt. Caitlin, điều gì khiến bạn hào hứng nhất? Tương lai sẽ như thế nào trong 6, 12 tháng tới?

Phản hồi: Vâng. Chúng tôi đã nói một chút về các cấp độ trừu tượng hóa cao hơn này, nơi chúng tôi thực sự có thể làm cho nó đơn giản nhất có thể để bạn có được kết quả tốt nhất tuyệt đối từ Claude. Và chúng tôi muốn kết hợp điều đó với khả năng quan sát mà chúng tôi đã nói để bạn thực sự có thể xem dữ liệu và lấy những thông tin chi tiết (insights) đó từ các tác vụ chạy lâu hơn. Và nếu bạn kết hợp những điều này lại với nhau và bắt đầu suy nghĩ về một số khả năng như bộ nhớ mà Brad vừa nói, bạn thực sự có thể bắt đầu thấy hiệu ứng bánh đà (flywheel) này, nơi theo thời gian chúng tôi không chỉ có thể giúp bạn đạt được kết quả tốt nhất từ Claude, mà chúng tôi có thể giúp bạn đạt được kết quả tự cải thiện (self-improving) và liên tục cải thiện (continuously improving) từ Claude. Và đối với tôi, đó là loại phép thuật "bộ não thiên hà" của lộ trình phát triển là đạt đến một điểm mà chúng tôi có những người đến với chúng tôi, họ đang xây dựng trên Claude, họ có các tác vụ của họ, họ biết họ đang cố gắng làm gì. Và họ nhận được những khoảnh khắc "à-ha" thực sự này, nơi theo thời gian, nó ngày càng tốt hơn và tốt hơn. Và đó là điều lớn nhất mà trong mọi thứ chúng tôi đang làm, chúng tôi đang cố gắng đảm bảo mình đang theo đuổi.

Phản hồi: Thật tuyệt vời. Vâng, tôi đoán tôi phải nói rằng, tôi luôn hào hứng về các ra mắt mô hình (model launches). Nó giống như Giáng sinh vậy, những gì sẽ có thể thực hiện được bây giờ? Vì vậy, tôi thích thử nghiệm với các ra mắt mô hình khi chúng xuất hiện, nó chỉ mở khóa nhiều trường hợp sử dụng hơn. Một số trường hợp sử dụng mà chúng tôi đã nỗ lực cải thiện, điều đó thật hài lòng khi thấy. Nhưng cũng có một số điều mà tôi không thể tưởng tượng rằng mô hình AI có thể làm được điều này. Bây giờ, nó cũng yêu cầu hình ảnh tốt hơn nhiều hoặc bất cứ điều gì. Bạn có thể là những điều rất quan trọng.

Nhưng ngoài ra, điều khác mà tôi thực sự hào hứng là chúng tôi đang ở giai đoạn đầu của việc cung cấp cho Claude một máy tính. Tôi nghĩ về việc nếu chúng ta thuê một nhân viên ở đây tại Anthropic và chúng ta chào đón họ trong ngày đầu tiên của họ, nhưng chúng ta không cung cấp cho họ một máy tính, họ sẽ không thành công lắm tại Anthropic. Vì vậy, bây giờ, về cơ bản mọi người đang sử dụng Claude và nó không có một máy tính. Vì vậy, tôi thực sự hào hứng về việc cung cấp cho Claude một máy tính. Và bạn thấy những bước khởi đầu rất nhỏ của điều đó với công cụ thực thi mã (code execution tool), nơi mô hình AI có thể viết mã được thực thi trên máy ảo (VM) và nhận lại kết quả. Vì vậy, nó có thể phóng to hình ảnh hoặc lấy một bảng tính Excel và tạo ra phân tích dữ liệu tuyệt vời với biểu đồ và đồ thị. Và đó chỉ là bước khởi đầu. Điều gì sẽ xảy ra nếu tôi có một máy tính bền vững (persistent computer) luôn ở đó và nó có thể tổ chức các tệp (files) trong đó theo cách nó cần và thiết lập các công cụ theo cách nó muốn. Và tôi chỉ nghĩ rằng có rất nhiều không gian để phát triển (headroom) trong kịch bản đó.

Người nói: Vâng, và tôi đoán tất cả điều đó đều gắn liền với việc giải phóng giới hạn (unhobbling) này. Nó đến đó. Chính xác. Tất cả là về mô hình AI. Đó chính xác là. Chỉ cần cấp, cấp cho Claude các công cụ. Vâng. Chà, tôi rất hào hứng với tương lai đó. Cảm ơn rất nhiều vì cuộc trò chuyện này. Được rồi, tuyệt vời. Cảm ơn bạn.

TL;DR

Nền tảng nhà phát triển Claude đã phát triển từ một API đơn thuần thành một hệ sinh thái toàn diện, cung cấp các công cụ và SDK nâng cao để xây dựng các Tác nhân AI tự chủ, bao gồm các tính năng như caching prompt, web search và thực thi mã.
Anthropic định nghĩa Tác nhân AI là mô hình AI có khả năng tự chủ trong việc lựa chọn, gọi công cụ, xử lý kết quả và quyết định bước đi tiếp theo, khuyến khích xu hướng giảm thiểu "khung sườn hỗ trợ" (scaffolding) để "giải phóng" trí tuệ của mô hình.
SDK Claude Code được khuyến nghị làm điểm khởi đầu cho việc xây dựng Tác nhân AI, hoạt động như một "khung tác nhân" (agent harness) đa năng giúp tự động hóa các vòng lặp tác nhân và việc gọi công cụ, đồng thời nhấn mạnh tầm quan trọng của việc xác định giá trị kinh doanh và khả năng quan sát cho các tác vụ dài hạn.

Điểm chính

Tận dụng Nền tảng nhà phát triển Claude: Khám phá và sử dụng toàn bộ các API, SDK, tài liệu và trải nghiệm bảng điều khiển vì nền tảng này đã mở rộng đáng kể để hỗ trợ việc xây dựng các ứng dụng AI phức tạp.
Thiết kế cho khả năng tự chủ của Tác nhân AI: Tập trung vào việc cho phép mô hình AI tự quyết định các bước tiếp theo, chọn và sử dụng công cụ một cách độc lập thay vì định tuyến cứng nhắc, để khai thác tối đa trí tuệ của mô hình.
Giảm thiểu "khung sườn hỗ trợ" (Scaffolding): Tránh các framework quá nặng nề hoặc các "guardrails" hạn chế, vì các mô hình AI hiện đại có khả năng hiểu ngữ cảnh và lý luận tốt hơn, có thể bị cản trở bởi quá nhiều hướng dẫn.
Bắt đầu với SDK Claude Code: Sử dụng SDK Claude Code để nhanh chóng tạo prototype Tác nhân AI, vì nó cung cấp một "khung tác nhân" đa năng giúp tự động hóa vòng lặp tác nhân và việc gọi công cụ cơ bản.
Khai thác các công cụ tích hợp: Sử dụng các tính năng nền tảng như web search và web fetch để mở rộng khả năng của tác nhân, cho phép chúng thực hiện các tác vụ nghiên cứu sâu một cách hiệu quả.
Xác định rõ ràng Giá trị Kinh doanh: Trước khi triển khai các dự án Tác nhân AI, hãy xác định rõ ràng giá trị kinh doanh mà nó sẽ mang lại (ví dụ: tiết kiệm giờ kỹ thuật, tự động hóa công việc thủ công) để định hướng phạm vi và mục tiêu.
Đầu tư vào Khả năng Quan sát (Observability): Chuẩn bị cho việc giám sát và kiểm toán các Tác nhân AI, đặc biệt là các tác vụ chạy lâu, để hiểu cách chúng hoạt động, điều chỉnh prompt và tinh chỉnh việc gọi công cụ khi cần thiết.
Tận dụng Trừu tượng hóa bậc cao: Chú ý đến các giải pháp và trừu tượng hóa bậc cao hơn từ Anthropic trong tương lai, vì chúng được thiết kế để tối ưu hóa hiệu suất và đơn giản hóa quá trình phát triển Tác nhân AI.

Từ vựng

nhà phát triển — Developer
mô hình AI — AI Model
Tác nhân AI — AI Agent
Nền tảng nhà phát triển Claude — Claude Developer Platform
API — Application Programming Interface
SDK — Software Development Kit
tự chủ — Autonomous / Autonomy
gọi công cụ — Tool Calling
khung sườn hỗ trợ — Scaffolding
khả năng quan sát — Observability
vòng lặp tác nhân — Agentic Loop
trường hợp sử dụng — Use Case

Nội dung chi tiết

Giới thiệu Nền tảng và Định nghĩa Tác nhân AI

Xu hướng Tác nhân AI và Giảm Khung sườn hỗ trợ

Bắt đầu với Nền tảng Nhà phát triển Claude và Giá trị Kinh doanh

Khả năng ứng dụng của `SDK` và Định hướng phát triển tương lai

Khả năng quan sát (Observability) trong các tác vụ dài hạn

Công cụ quản lý ngữ cảnh và bộ nhớ cho nhà phát triển

Người nói: Thú vị. Vậy, được rồi, chúng ta đang loại bỏ ngữ cảnh không cần thiết. Có rủi ro nào là chúng ta loại bỏ ngữ cảnh cần thiết không?

Tính năng Bộ nhớ Tác nhân (Agentic Memory)

Tầm nhìn Tương lai và `Claude` với "Máy tính"

Góp ý / Báo lỗiPhát hiện sai sót hoặc có ý tưởng cải thiện?

Giới thiệu Nền tảng và Định nghĩa Tác nhân AI

Xu hướng Tác nhân AI và Giảm Khung sườn hỗ trợ

Bắt đầu với Nền tảng Nhà phát triển Claude và Giá trị Kinh doanh

Khả năng ứng dụng của SDK và Định hướng phát triển tương lai

Khả năng quan sát (Observability) trong các tác vụ dài hạn

Công cụ quản lý ngữ cảnh và bộ nhớ cho nhà phát triển

Tính năng Bộ nhớ Tác nhân (Agentic Memory)

Tầm nhìn Tương lai và Claude với "Máy tính"

TL;DR

Điểm chính

Từ vựng

Nội dung chi tiết

Giới thiệu Nền tảng và Định nghĩa Tác nhân AI

Xu hướng Tác nhân AI và Giảm Khung sườn hỗ trợ

Bắt đầu với Nền tảng Nhà phát triển Claude và Giá trị Kinh doanh

Khả năng ứng dụng của SDK và Định hướng phát triển tương lai

Khả năng quan sát (Observability) trong các tác vụ dài hạn

Công cụ quản lý ngữ cảnh và bộ nhớ cho nhà phát triển

Tính năng Bộ nhớ Tác nhân (Agentic Memory)

Tầm nhìn Tương lai và Claude với "Máy tính"

Khả năng ứng dụng của `SDK` và Định hướng phát triển tương lai

Tầm nhìn Tương lai và `Claude` với "Máy tính"

Khả năng ứng dụng của `SDK` và Định hướng phát triển tương lai

Tầm nhìn Tương lai và `Claude` với "Máy tính"