Building more effective AI agents

Claude được huấn luyện đặc biệt để trở thành một tác nhân AI hiệu quả, có khả năng giải quyết các vấn đề mở, thực hiện nhiều bước và sử dụng công cụ để đạt được kết quả tốt hơn.
Kỹ năng mã hóa đóng vai trò nền tảng cho tác nhân AI, cho phép Claude không chỉ viết mã mà còn tạo ra các tạo phẩm phức tạp (như bảng tính, sơ đồ SVG) một cách hiệu quả và nhanh chóng thông qua các vòng lặp tính toán.
Sự phát triển của kiến trúc tác nhân bao gồm "quy trình làm việc của các tác nhân AI" (chuỗi các tác nhân vòng lặp đóng) và hệ thống đa tác nhân (tác nhân cha điều phối các tác nhân phụ song song), được hỗ trợ bởi các công cụ như Claude Code SDK và Claude Skills, giúp cải thiện hiệu suất và quản lý ngữ cảnh.

Thiết kế Tác nhân AI từ đầu: Huấn luyện mô hình AI trên các tác vụ mở, đa bước và khả năng sử dụng công cụ để xây dựng một tác nhân tự chủ và hiệu quả.
Tận dụng Mã làm Năng lực Cốt lõi: Khuyến khích tác nhân tạo và thực thi mã (ví dụ: Python script) để tự động hóa các tác vụ lặp lại và tạo ra các tạo phẩm phức tạp, tăng tốc độ và độ chính xác so với việc tạo trực tiếp.
Sử dụng Claude Code SDK: Bắt đầu phát triển tác nhân AI với Claude Code SDK để kế thừa một vòng lặp tác nhân đã được tối ưu hóa, tập trung vào việc thêm công cụ tùy chỉnh và logic nghiệp vụ.
Mở rộng Năng lực với Claude Skills: Cung cấp cho tác nhân không chỉ hướng dẫn mà còn các tài nguyên (mẫu, mã hỗ trợ, tài sản) thông qua "Skills" để tác nhân có thể nhanh chóng chuyên môn hóa và thực hiện các tác vụ phức tạp.
Triển khai "Quy trình làm việc của các Tác nhân AI": Xây dựng các ứng dụng phức tạp bằng cách xâu chuỗi các tác nhân vòng lặp đóng, nơi mỗi bước là một tác nhân có khả năng tự sửa lỗi và lặp lại cho đến khi đạt được kết quả mong muốn trước khi chuyển sang bước tiếp theo.
Ứng dụng Hệ thống Đa Tác nhân cho Hiệu quả Song song: Sử dụng mô hình cha-con hoặc điều phối viên để giao nhiệm vụ cho các tác nhân phụ hoạt động song song, đặc biệt hiệu quả cho các tác vụ tìm kiếm, phân tích dữ liệu hoặc các tác vụ có thể phân chia để tiết kiệm ngữ cảnh và giảm độ trễ.
Quản lý Ngữ cảnh bằng Tác nhân Phụ: Offload các tác vụ con tốn nhiều token sang tác nhân phụ để bảo vệ ngữ cảnh chính của tác nhân cha, nhận lại kết quả cuối cùng một cách hiệu quả.
Ưu tiên Đơn giản và Quan sát: Luôn bắt đầu với giải pháp đơn giản nhất (ví dụ: single-shot prompt) và tăng độ phức tạp từng bước, để duy trì khả năng quan sát và xác minh, giúp dễ dàng debug và hiểu hành vi của hệ thống.

multi-agent — hệ thống đa tác nhân
AI agent — tác nhân AI
tool calling — gọi công cụ
Claude Code SDK — Bộ công cụ phát triển phần mềm Claude Code
Claude Skills — Kỹ năng Claude
workflows of agents — quy trình làm việc của các tác nhân AI
sub-agent — tác nhân phụ
observability — khả năng quan sát
context — ngữ cảnh
reinforcement learning (RL) — học tăng cường (RL)

Khám phá Hệ thống Đa Tác nhân và Claude

Tôi nghĩ cũng có rất nhiều điều thú vị để khám phá về multi-agent như một dạng test-time compute. Về cơ bản, nhiều mô hình AI Claude cùng giải quyết một vấn đề có thể, bạn biết đấy, đem lại cho bạn một câu trả lời cuối cùng tốt hơn chỉ một mô hình AI đơn lẻ. Xin chào, tôi là Alex. Tôi phụ trách quan hệ với Claude tại Anthropic. Hôm nay, chúng ta sẽ nói về việc xây dựng các Tác nhân AI hiệu quả hơn, và tôi có đồng nghiệp của mình ở đây. Tôi là Eric. Tôi làm việc trong lĩnh vực nghiên cứu multi-agent tại Anthropic. Eric, xin mời anh bắt đầu. Anh có thể giải thích tại sao Claude lại giỏi các tác vụ agent đến vậy không? Chắc chắn rồi. Trong quá trình huấn luyện, chúng tôi đã cho Claude luyện tập để trở thành một Tác nhân AI. Chúng tôi cung cấp cho nó các vấn đề mở để nó giải quyết, nơi nó có thể thực hiện nhiều bước và sử dụng công cụ, khám phá những gì đang diễn ra và những gì nó đang làm trước khi đưa ra câu trả lời cuối cùng. Và bằng cách luyện tập nhiều trong vai trò một Tác nhân AI, Claude trở nên thực sự giỏi điều này.

Vậy, đó là những tác vụ kéo dài trong nhiều lĩnh vực khác nhau, về cơ bản. Và thông qua quá trình RL (học tăng cường) và các cơ chế huấn luyện khác, Claude đang học mục tiêu về cách thực hiện các tác vụ này với sự hướng dẫn hoặc phản hồi hạn chế. Chính xác. Chúng tôi thực hiện rất nhiều RL trên các tác vụ mã hóa, trên các tác vụ tìm kiếm, rất nhiều thứ để Claude luyện tập trở thành một Tác nhân AI trong các môi trường khác nhau. Tôi nghĩ có một quan niệm về các mô hình AI của Claude rằng chúng thực sự rất giỏi về mã hóa. Nhưng điều đó có thể không phải lúc nào cũng chuyển giao sang các lĩnh vực khác, hoặc mã hóa là một thứ riêng biệt. Anh có quan điểm gì về điều đó nói chung không? Mã hóa là tác vụ đầu tiên mà chúng tôi thực sự tập trung vào. Nhưng một khi bạn có một Tác nhân AI mã hóa tuyệt vời, một Tác nhân AI mã hóa có thể thực hiện bất kỳ loại công việc nào khác. Nếu bạn cần thực hiện tìm kiếm, bạn có thể thực hiện tìm kiếm web thông qua API. Bạn có thể lên kế hoạch cho cuối tuần bằng cách tạo một lịch trình. Vì vậy, chúng tôi thực sự coi mã hóa là một kỹ năng rất cơ bản cho một Tác nhân AI sẽ có nhiều hiệu ứng lan tỏa để có thể giúp Claude giỏi tất cả các loại việc. Và kiểu như, huấn luyện những thứ khó nhất trước, sau đó mọi thứ khác sẽ trở nên dễ dàng.

Sức mạnh của mã trong Tác nhân AI

Một điều thú vị tôi thấy gần đây với một tính năng mà chúng tôi đã phát hành trên Claude.ai trên web là khả năng của Claude tạo ra các tệp thực tế thông qua việc viết mã. Giống như việc viết một script Python. Và sau đó script Python chạy, và đột nhiên bạn có một bảng tính Excel được tạo ra từ đó. Đó có phải là hướng đi tương lai mà chúng ta đang hướng tới không? Liệu Claude có viết các script và thực hiện các hành động trên máy tính để bàn để tạo tệp hoặc làm những việc mà theo truyền thống không liên quan đến mã không? Tôi nghĩ đó là một trong những cách hiệu quả thực sự mà Claude sẽ có thể thực hiện những tác vụ này. Thực tế, chỉ vài ngày trước, Claude đã giúp tôi tạo một số sơ đồ cho một bài thuyết trình. Và nó có thể tạo tệp chỉ bằng cách viết ra các SVG. Nhưng sau đó tôi muốn nó tạo một sơ đồ chi tiết hơn nhiều, sẽ cần rất nhiều sự lặp lại. Và Claude thực sự có thể làm điều này bằng cách viết một số mã để tạo ra SVG, chạy nhanh hơn rất, rất nhiều so với việc Claude tự viết. Bạn biết đấy, đó là một tệp hình ảnh rất, rất lặp đi lặp lại với rất nhiều mẫu chi tiết trong đó. Vì vậy, vâng, tôi nghĩ rằng trong nhiều trường hợp, việc viết mã để tạo ra một tạo phẩm nào đó sẽ tốt hơn nhiều so với việc chỉ cố gắng tạo tạo phẩm đó trực tiếp. Vì vậy, đó là một cách để làm điều đó cho những trường hợp khó hơn.

Được rồi, đúng vậy. Vâng, mã cho phép tăng tốc độ này. Điều đó thậm chí không thể thực hiện được với con người khi nhấp và kéo và sử dụng chuột trên máy tính cho các hành động lặp lại. Chính xác. Claude có một vòng lặp for. Vâng, nếu bạn là một nhà phát triển và bạn đang xây dựng một Tác nhân AI với Claude, một điều mà chúng tôi đã bắt đầu thấy trở nên thực sự phổ biến là Bộ công cụ phát triển phần mềm Claude Code (Claude Code SDK). Anh có thể giải thích đó là gì và anh thấy các nhà phát triển bắt đầu sử dụng nó như thế nào không?

Bộ công cụ phát triển phần mềm Claude Code (`Claude Code SDK`)

Vâng, chúng tôi thực sự rất hào hứng khi các nhà phát triển sử dụng Bộ công cụ phát triển phần mềm Claude Code. Đây là một thứ mà trước đây nếu bạn muốn xây dựng một Tác nhân AI mã hóa hoặc bất kỳ Tác nhân AI nào, bạn thực sự phải bắt đầu từ con số không, chỉ đơn thuần là gọi đến một điểm cuối API, tự xây dựng các vòng lặp, xây dựng tất cả các công cụ, xây dựng việc thực thi các công cụ này, tương tác với các tệp, tương tác với Giao thức Ngữ cảnh Mô hình (MCP). Về cơ bản, chúng tôi đã xây dựng tất cả những điều đó vào Claude Code. Và mặc dù tên của nó là Claude Code, nhưng thực sự, Claude Code chỉ là một Tác nhân AI đa năng. Nó thường được sử dụng nhất cho mã. Vâng, chúng tôi đang khuyến khích rất nhiều nhà phát triển sử dụng SDK này làm cốt lõi cho vòng lặp tác nhân của họ. Và bằng cách đó, họ không phải mất nhiều thời gian để "phát minh lại bánh xe" mà chúng tôi đã bỏ rất nhiều thời gian để trau chuốt và hoàn thiện vòng lặp tác nhân cốt lõi đó. Thay vào đó, họ có thể sử dụng nó và sau đó chỉ cần thêm các công cụ của riêng mình cho logic nghiệp vụ tùy chỉnh hoặc tính năng hỗ trợ vào đó thông qua MCP.

Đúng vậy, vì vậy nó cung cấp loại khả năng tùy chỉnh đó, nơi bạn có thể loại bỏ các phần cụ thể liên quan đến mã hóa và đưa vào bất kỳ câu lệnh hoặc công cụ nào bạn cần, nó chỉ đơn giản là khớp hoàn hảo vào khung sườn. Vâng, tôi nghĩ mọi người cũng đã sử dụng Claude Code cho tất cả các loại việc. Tôi nghĩ việc sử dụng Claude Code lạ lùng nhất của tôi là tôi đã từng nhờ nó lên kế hoạch cho một cuộc hẹn hò cho tôi, nơi nó thực hiện một loạt tìm kiếm web, tìm thấy các hoạt động và nhà hàng thú vị trong khu vực. Và như vậy, hoàn toàn không liên quan đến mã, nhưng nó có tất cả các công cụ. Cuộc hẹn hò thế nào? Khá tốt. Vâng, tuyệt vời. Vâng, nó đã làm rất tốt. Vâng, Vườn Flolly và sau đó là một nhà hàng Trung Quốc gần đó. Chà, được rồi. Claude đã làm rất tốt. Tôi rất ấn tượng. Vâng.

Claude Skills

Một điều khác trong Claude Code đã trở thành một tính năng phổ biến khác mà tôi thấy nhiều kỹ sư phần mềm sử dụng gần đây là tệp Claude MD. Đây là những tệp mà bạn định nghĩa trong một dự án và cung cấp cho Claude thông tin liên quan về phong cách lập trình của bạn hoặc bố cục của các thư mục, những thứ tương tự. Chúng tôi hiện đã ra mắt một khái niệm nội bộ tương tự có thể tiến thêm một bước nữa gọi là Kỹ năng. Anh có thể giải thích Kỹ năng là gì và chúng ta đang bắt đầu thấy các nhà phát triển sử dụng chúng như thế nào và chúng có ý nghĩa gì đối với các Tác nhân AI không?

Vâng, Kỹ năng của Claude là một tiện ích mở rộng rất thú vị của tệp Claude MD, nơi thay vì chỉ cung cấp cho nó các tệp ghi chú, bạn có thể cung cấp cho nó bất kỳ loại tệp nào. Đó có thể là tệp mẫu PowerPoint. Đó có thể là mã và script hỗ trợ mà bạn muốn nó sử dụng. Đó có thể là hình ảnh hoặc tài sản. Và tôi nghĩ tiện ích mở rộng này không chỉ là hướng dẫn mà còn là tài nguyên để Tác nhân AI sử dụng là một công cụ thực sự, thực sự mạnh mẽ, nơi bạn có thể nói không chỉ những hướng dẫn này để tạo bài thuyết trình PowerPoint, mà đây là ảnh chân dung của tất cả các lãnh đạo công ty của chúng tôi mà bạn có thể cần tái sử dụng trong nhiều bài thuyết trình. Chỉ cần cung cấp tất cả cho Claude theo cách có thể tái sử dụng. Vì vậy, nó có mọi thứ cần thiết ngay tại đó. Một phép ẩn dụ mà tôi đã nghe được sử dụng nội bộ mà tôi thực sự, thực sự thích là nó giống như trong Ma Trận khi Neo lần đầu học kung fu và họ tiêm thông tin kung fu vào anh ấy và đột nhiên anh ấy là một bậc thầy kung fu. Điều đó rất giống với khi tôi đưa cho Claude một Kỹ năng nào đó. Đây là cách bạn tạo bảng tính, và đột nhiên Claude giống như một nhân viên ngân hàng và có thể tạo mô hình tài chính cho tôi. Điều đó, và nơi họ tải tất cả các giá đỡ thiết bị và công cụ và những thứ khác để họ lấy. Vâng, bạn có thể bắt đầu với những thứ này chứ không chỉ là hướng dẫn. Vâng, tôi thích điều đó.

Sự phát triển của `Agent Workflows`

Thay đổi chủ đề một chút. Lần cuối chúng ta trò chuyện trước máy quay ở đây, vài tháng trước và chúng ta đang nói về các Tác nhân AI, và vào thời điểm đó chúng ta đang trong quá trình chuyển đổi từ có thể là quy trình làm việc (workflows) – là những cách thức rất rõ ràng về việc bạn xâu chuỗi các câu lệnh (prompts) lại với nhau – sang thứ mà là một hệ thống tác nhân AI đơn lẻ nơi bạn đang chạy một mô hình AI trong vòng lặp. Kể từ đó, sự tiến hóa trong lĩnh vực này là gì?

Vâng. Vì vậy, chúng tôi thực sự đã thấy các Tác nhân AI tiếp quản từ quy trình làm việc (workflows) khi Claude đã trở nên rất giỏi trong việc phản hồi phản hồi và tự sửa lỗi công việc của mình đến mức bây giờ vòng lặp tác nhân thực sự vượt trội đáng kể so với quy trình làm việc (workflows) đối với hầu hết các tác vụ mà bạn quan tâm nhất về chất lượng tuyệt đối. Quy trình làm việc (workflows) vẫn tuyệt vời khi bạn cần độ trễ rất thấp và bạn muốn Claude chỉ đưa ra câu trả lời tốt nhất. Tác nhân AI đơn lẻ (single-shot agents) hiện có hiệu suất thực sự, thực sự cao. Tôi nghĩ một trong những điều mà tôi đã thấy phát triển kể từ đó là điều mà tôi gọi là quy trình làm việc của các tác nhân AI (workflows of agents), trong khi trước đây một ứng dụng có thể có một quy trình làm việc (workflow) có Claude ở chế độ một lần chạy (single-shot) – viết một lệnh SQL (SQL command) để tải dữ liệu. Sau đó, nó sẽ chuyển sang một bước khác trong quy trình làm việc (workflow) nơi nó sẽ viết một biểu đồ (chart) để hiển thị dữ liệu đó. Và nếu lệnh SQL (SQL command) thất bại, nó không biết rằng nó không trả về bất kỳ dữ liệu nào, và sau đó bước thứ hai của quy trình làm việc (workflow) hoàn toàn thất bại. Nhưng bây giờ tôi đã thấy mọi người nơi mỗi bước đó trong quy trình làm việc (workflow) thực sự là một vòng lặp đóng (closed loop) nơi, thay vì chỉ viết một lần thử truy vấn SQL (SQL query), nó sau đó chạy. Claude thấy đầu ra, và sau đó nó có thể tiếp tục lặp lại cho đến khi nó biết rằng nó đã nhận được giá trị đúng, và sau đó nó chuyển sang bước tiếp theo trong quy trình làm việc (workflow). Được rồi, thú vị.

Tính quan sát và sự phức tạp

Vậy thì, sự tiến hóa này, tôi đoán, từ việc xâu chuỗi các câu lệnh (prompts) đến bây giờ là xâu chuỗi các Tác nhân AI trong chính các vòng lặp này. Chúng ta sẽ xem điều đó sẽ đi đến đâu. Một chủ đề lớn khác được thảo luận mà tôi cảm thấy gần đây đang nhận được nhiều sự trò chuyện hơn là câu hỏi xung quanh khả năng quan sát (observability) và xác minh (verification). Anh có thể giải thích thử thách đó là gì và mọi người đang bắt đầu nghĩ về nó như thế nào không?

Vâng, khả năng quan sát (observability) rất khó đối với các Tác nhân AI, đặc biệt khi các hệ thống ngày càng phức tạp hơn. Và tôi nghĩ đó là một trong những lý do tại sao tôi vẫn thực sự tin rằng mặc dù các mô hình AI ngày nay có khả năng hơn nhiều so với một năm trước và chúng có thể hoạt động tốt hơn trong một Tác nhân AI hoặc thậm chí các thiết lập phức tạp hơn, tôi nghĩ rằng sự đơn giản vẫn là một điều thực sự quan trọng và rằng mặc dù bạn có thể xây dựng một quy trình làm việc của các tác nhân AI (workflow of agents) lớn, bạn vẫn nên bắt đầu từ điều đơn giản nhất có thể và sau đó phát triển lên một giải pháp phức tạp hơn. Và đó là trước tiên thử chạy một lần (single-shotting) các tác vụ hoặc thử một câu lệnh một lần chạy (single-shot prompt) với Bộ công cụ phát triển phần mềm Claude Code, hiện chỉ là một thứ đơn giản, dễ sử dụng. Và sau đó tôi nghĩ chỉ khi cần thiết, hãy thêm các lớp phức tạp, bởi vì điều đó sẽ làm cho khả năng quan sát (observability) khó hơn.

Hệ thống `Multi-Agent` và `Tác nhân phụ`

Một thuật ngữ khác ở đây, có thể song song với quy trình làm việc của các tác nhân AI (workflows of agents), là multi-agent. Đó có phải là cùng một thứ hay đó là một thứ khác không? Vâng, multi-agent là lĩnh vực nghiên cứu chính của tôi hiện nay. Tôi muốn nói rằng nó khá khác so với tác nhân quy trình làm việc (workflow agent). Quy trình làm việc của các tác nhân AI (Workflows of agents) là nơi một Tác nhân AI hoàn thành, và sau đó nó chuyển đổi hoặc đầu ra của nó được gửi đến Tác nhân AI tiếp theo để làm việc. Multi-agent là nơi về cơ bản bạn có nhiều Tác nhân AI hoặc nhiều Claude làm việc cùng một lúc, nơi có thể một tác nhân cha (parent agent) giao tác vụ cho năm tác nhân phụ (sub-agents) mà mỗi tác nhân phụ đó sau đó có thể làm việc song song. Đây là cách sản phẩm tìm kiếm nghiên cứu chuyên sâu của chúng tôi hoạt động. Tác nhân điều phối (orchestrator agent) chính sẽ quyết định và tạo ra một số tác nhân phụ (sub-agents) có thể thực hiện nhiều tìm kiếm song song. Và điều đó tốt hơn nhiều cho người dùng vì tất cả điều này diễn ra song song, và bạn nhận được câu trả lời của mình sớm hơn nhiều.

Chúng tôi cũng thấy những thứ như trong Claude Code. Mô hình AI sẽ sử dụng một tác nhân phụ (sub-agent). Vì vậy, nếu một tác vụ phụ (sub-task) nào đó sẽ mất hàng chục nghìn token, ví dụ như tìm một triển khai cụ thể của một lớp, nhưng câu trả lời thực sự chỉ là một cái gì đó rất nhỏ, nó có thể thực hiện tác vụ đó trong một tác nhân phụ (sub-agent) để bảo vệ ngữ cảnh (context) chính khỏi tất cả những token không cần thiết cho công việc chính. Vì vậy, vâng, về cơ bản, bạn có thể chuyển giao (offload) phần công việc này và chỉ nhận lại câu trả lời cuối cùng. Vậy, chúng ta đang phơi bày tác nhân phụ (sub-agent) này trong trường hợp này như một công cụ mà Claude có thể gọi đến? Chính xác. Nó sẽ truyền câu lệnh (prompt) vào như một tham số (parameter) hoặc một cái gì đó. Chính xác.

Vì vậy, đối với Claude, các tác nhân phụ (sub-agents) trông giống như một công cụ nơi nó có thể truyền các câu lệnh (prompts) cho các tác nhân phụ (sub-agents) mà sau đó sẽ đi và thực hiện công việc. Và một phần nghiên cứu của tôi là huấn luyện Claude để trở thành một người quản lý tốt hơn và biết cách đưa ra các hướng dẫn rõ ràng cho các tác nhân phụ (sub-agents) của nó và đảm bảo rằng nó nhận được những thứ đúng đắn mà nó cần từ chúng.

Mối liên hệ với `Tool Calling`

Điều này khác biệt như thế nào, hay đây có phải là một phần chuyên biệt của tool calling nói chung, hay nó khác biệt ở một số khía cạnh? Tôi sẽ nói rằng điều này sử dụng framework của tool calling cho giao thức giao tiếp đó. Và nó tình cờ là một công cụ mà bản thân nó được hỗ trợ bởi một Claude khác.

Thử thách và Học hỏi của `Claude` với `Tác nhân phụ`

Claude có sự hiểu biết trực quan về Tác nhân phụ không, hay chúng ta phải dạy nó kiểu như, "Bạn thực sự đang nói chuyện với một phiên bản khác của chính mình, Claude. Đừng hoảng sợ,"? Tôi sẽ nói rằng Claude mắc nhiều lỗi tương tự như những người quản lý lần đầu, nơi nó sẽ đưa ra hướng dẫn không đầy đủ hoặc không rõ ràng cho một Tác nhân phụ và, bạn biết đấy, kỳ vọng Tác nhân phụ có ngữ cảnh phù hợp trong khi thực tế thì không. Và tôi nghĩ điều chúng tôi đã thấy trong quá trình huấn luyện mô hình về Tác nhân phụ là Claude bắt đầu trở nên dài dòng và chi tiết hơn nhiều, cung cấp cho các Tác nhân phụ ngữ cảnh tổng thể về những gì đang diễn ra, để chúng có thể thực hiện công việc tốt hơn, đóng góp vào tổng thể. Vì vậy, tôi sẽ nói rằng, Claude chắc chắn còn nhiều điều phải học và đang học cách để làm tốt hơn.

Các `Use Case` của Hệ thống Đa `Tác nhân AI`

Tuyệt vời. Một số use case ở đây là gì? Có tìm kiếm, ví dụ như bảo toàn ngữ cảnh. Có những thứ khác mà mọi người đang sử dụng Tác nhân AI đa tác nhân cho bây giờ không? Vâng, tôi nghĩ mã hóa có rất nhiều Tác nhân phụ được sử dụng. Bất cứ thứ gì có thể được xử lý song song hoặc map reduced. Nếu bạn có thứ gì đó cần tạo ra nhiều đầu ra hoặc có thể có 10 phần của một đầu ra nào đó bạn đang tạo. Nếu bạn có thể chia nhỏ điều đó cho 10 Tác nhân phụ, điều đó có thể thực sự, thực sự hiệu quả để tiết kiệm ngữ cảnh và nhận được kết quả nhanh hơn. Tôi nghĩ cũng có nhiều điều thú vị để khám phá về Tác nhân AI đa tác nhân như một hình thức test time compute. Về cơ bản, việc để nhiều Claude làm việc trên một vấn đề có thể, bạn biết đấy, mang lại cho bạn một câu trả lời cuối cùng tốt hơn chỉ một. Giống như với con người, bạn biết đấy, nhiều người cùng suy nghĩ có thể đạt được kết quả tốt hơn.

Chuyên biệt hóa `Tác nhân AI` và Quản lý `Công cụ`

Trong trường hợp đó, chúng ta có chuyên biệt hóa các Tác nhân AI này theo cách nào không? Chúng ta có định hướng chúng theo một loại persona này hay loại khác, hay chỉ để chúng tự do đảm nhận bất kỳ hình thức nào? Tôi nghĩ bạn có thể làm cả hai. Bạn biết đấy, đôi khi rất hữu ích khi giao cho một nhóm người cùng một tác vụ chính xác và xem họ đưa ra những câu trả lời khác nhau như thế nào. Đôi khi tốt hơn là có nhiều người hoặc nhiều Tác nhân AI làm việc theo các cách tiếp cận khác nhau cho cùng một vấn đề hoặc chia nhỏ nó. Một điều tôi đã thấy nhiều là những khách hàng có rất nhiều công cụ, có thể là hàng trăm hoặc 200 công cụ mà họ muốn một Tác nhân AI sử dụng. Họ nhận thấy rằng việc chia nhỏ các công cụ đó giữa các Tác nhân phụ là rất tốt. Vì vậy, Tác nhân AI chính chỉ cần biết, "Này, tôi muốn sử dụng nhóm công cụ này," và sau đó có một Tác nhân phụ sẽ thực hiện công việc thực tế ở đó, để mỗi Tác nhân phụ chỉ cần hiểu và sử dụng khoảng 20 công cụ.

Thử nghiệm Quy mô `Tác nhân AI`

Chúng ta đã thử mở rộng quy mô Tác nhân AI đến mức tối đa chưa? Điều gì sẽ xảy ra nếu bạn có khoảng một nghìn phiên bản Claude cùng làm việc trên một vấn đề? Nó có biến thành hỗn loạn không? Tôi chưa thử điều đó. Được rồi, tôi sẽ trả lời bạn sau. Đó là một ý tưởng nghiên cứu hay đấy.

`Failure Mode` và `Chi phí Phát sinh` của Hệ thống Đa `Tác nhân AI`

Một số failure mode khác mà chúng ta đang thấy hiện nay với các Tác nhân AI hoặc Tác nhân AI đa tác nhân là gì? Vâng, tôi nghĩ giống như bất kỳ hệ thống phức tạp nào, rất dễ xây dựng quá mức một thứ gì đó và mất đi rất nhiều hiệu quả, và chỉ tạo ra rất nhiều tải trọng chết. Và vì vậy, tôi đã thấy các hệ thống Tác nhân AI đa tác nhân được xây dựng quá mức dành quá nhiều thời gian chỉ để nói chuyện qua lại với nhau và không thực sự đạt được tiến bộ trong tác vụ chính. Tác nhân con người hoặc các tổ chức con người cũng chịu đựng điều này. Khi các công ty lớn hơn, bạn có nhiều chi phí giao tiếp hơn và ngày càng ít công việc thực sự được thực hiện bởi những người trực tiếp làm việc. Và vì vậy, tôi nghĩ đó là một điều thú vị khác để nghiên cứu là làm thế nào chúng ta có thể làm cho các tổ chức Claude rất hiệu quả trong khi vẫn giữ chi phí phát sinh ít hơn?

Lời khuyên cho `Nhà phát triển`: Xây dựng `Tác nhân AI` hiệu quả

Nếu tôi là một nhà phát triển và muốn bắt đầu với Tác nhân AI, cho dù tôi đang xây dựng trên Claude Code SDK hay chỉ cố gắng tự tạo, bạn có lời khuyên hoặc best practice nào dành cho họ không? Vâng, tôi nghĩ best practice thực sự vẫn là: bắt đầu đơn giản và đảm bảo bạn chỉ thêm những phức tạp cần thiết. Tôi nghĩ một điều thực sự quan trọng khác là hãy suy nghĩ từ góc độ của các Tác nhân AI của bạn. Nếu bạn đang cung cấp cho Claude các công cụ hoặc câu lệnh hoặc bất kỳ affordance nào, hãy đặt mình vào vị trí của Claude và đọc xem nó thực sự nhận được gì, nó nhìn thấy gì với tư cách là mô hình AI, và đảm bảo rằng thực sự có đủ thông tin ở đó để nó giải quyết vấn đề. Rất dễ quên rằng chúng ta nhìn thấy mọi thứ và mô hình AI chỉ nhìn thấy những gì chúng ta cho nó xem.

Quan điểm `UI-centric` cho `Công cụ` và `MCP`

Vâng, tôi cảm thấy điều quan trọng là luôn quay lại transcript thô của các lệnh gọi công cụ và log của bạn và xem xét điều đó. Chính xác. Và tôi nghĩ một điều khác là khi mọi người đang xây dựng nhiều thứ hơn như MCP và cố gắng kết nối Claude với nhiều thứ hơn, tôi nghĩ một bản năng đầu tiên rất tự nhiên mà mọi người có nhưng rất sai lầm là MCP hoặc các công cụ nên tương ứng một-một với API của bạn. Và tôi nghĩ thực ra các công cụ cho mô hình AI hoặc MCP nên tương ứng một-một với UI của bạn, chứ không phải API của bạn. Bởi vì cuối cùng, mô hình AI là một người dùng của những thứ này. Nó không hoạt động như một chương trình truyền thống. Vì vậy, nếu API của bạn có ba endpoint riêng biệt, chẳng hạn, để tải một cuộc trò chuyện Slack, và chuyển user ID thành username, và chuyển channel ID thành channel name, nếu đó là những công cụ bạn cung cấp cho mô hình AI để hiểu Slack, để nó hiểu bất cứ điều gì, nó sẽ phải thực hiện ba lệnh gọi công cụ. Đối với một người dùng, bạn biết đấy, chúng ta chỉ thấy mọi thứ được hiển thị đẹp mắt. Và vì vậy bạn muốn tạo một công cụ hoặc một MCP cho mô hình AI mà nó trình bày mọi thứ cùng một lúc với ít tương tác nhất có thể. Giống như đối với một người dùng, sẽ rất tệ. Mỗi khi bạn thêm Slack, bạn phải nhấp vào user ID để xem tên là gì, v.v. Tôi thích điều đó. Nó giống như làm việc ngược từ trạng thái cuối gần như thay vì chỉ cố gắng ánh xạ các thông số kỹ thuật một-một. Chính xác. Và bao quanh bất kỳ ngữ cảnh nào bạn cần.

Tương lai của `Tác nhân AI` và Khả năng `Computer Use`

Bạn nghĩ tương lai của Tác nhân AI sẽ có gì cho chúng ta? Bất kỳ dự đoán nào trong 6 đến 12 tháng tới không? Tôi nghĩ Tác nhân AI sẽ trở nên phổ biến hơn nhiều, bắt đầu từ những lĩnh vực có thể kiểm chứng được như kỹ thuật phần mềm, bạn biết đấy, các Tác nhân AI lập trình đã thay đổi cách tôi và rất nhiều người tại Anthropic làm việc. Và tôi nghĩ vẫn còn rất nhiều điều để đạt được ở đó. Tôi nghĩ một trong những điều thực sự thú vị là nếu Tác nhân AI có thể bắt đầu tự kiểm chứng công việc của mình tốt hơn với những thứ như computer use. Chúng có thể viết một web app nhưng liệu chúng có thể thực sự mở nó lên, kiểm tra và sau đó tự tìm lỗi thay vì bạn phải làm điều đó không? Tôi nghĩ đó là một trong những điều thú vị nhất. Đó là việc đóng vòng lặp kiểm thử để tôi không phải là kỹ sư QA của Claude. Đúng vậy. Đó là sự kết hợp của tất cả những điều này từ khả năng kỹ thuật phần mềm đến khả năng computer use khi chúng ta ghép tất cả các mảnh này lại với nhau. Vâng. Và tôi nghĩ computer use cũng sẽ thực sự mở ra rất nhiều con đường và lĩnh vực khác mà Tác nhân AI đã bị loại trừ cho đến nay. Một ví dụ về điều đó là gì? Tôi nghĩ rằng nếu bạn muốn Claude làm việc cho bạn trong một Google Doc, hiện tại, Claude có thể viết cho bạn nhưng bạn đang copy và paste qua lại. Đúng vậy. Nhưng nếu bạn có computer use và bạn nói, "Này, Claude, bạn có thể dọn dẹp Google Doc này không?" Nó có thể làm điều đó ngay tại đó cho bạn, cuộn, nhấp, chỉnh sửa văn bản. Và đó là một trải nghiệm tuyệt vời hơn rất nhiều so với việc phải copy và paste qua lại. Vâng. Vì vậy, bất cứ nơi nào bạn ở, Claude có thể ở đó cùng bạn nếu nó có computer use. Chà, tôi rất hào hứng khi có Claude viết các Google Doc của tôi và trả lời tất cả các bình luận của tôi. Chính xác. Đó sẽ là một tương lai rất tốt đẹp. Eric, điều này thật tuyệt vời. Cảm ơn bạn rất nhiều vì cuộc trò chuyện. Chắc chắn rồi. Cảm ơn.

TL;DR

Claude được huấn luyện đặc biệt để trở thành một tác nhân AI hiệu quả, có khả năng giải quyết các vấn đề mở, thực hiện nhiều bước và sử dụng công cụ để đạt được kết quả tốt hơn.
Kỹ năng mã hóa đóng vai trò nền tảng cho tác nhân AI, cho phép Claude không chỉ viết mã mà còn tạo ra các tạo phẩm phức tạp (như bảng tính, sơ đồ SVG) một cách hiệu quả và nhanh chóng thông qua các vòng lặp tính toán.
Sự phát triển của kiến trúc tác nhân bao gồm "quy trình làm việc của các tác nhân AI" (chuỗi các tác nhân vòng lặp đóng) và hệ thống đa tác nhân (tác nhân cha điều phối các tác nhân phụ song song), được hỗ trợ bởi các công cụ như Claude Code SDK và Claude Skills, giúp cải thiện hiệu suất và quản lý ngữ cảnh.

Điểm chính

Thiết kế Tác nhân AI từ đầu: Huấn luyện mô hình AI trên các tác vụ mở, đa bước và khả năng sử dụng công cụ để xây dựng một tác nhân tự chủ và hiệu quả.
Tận dụng Mã làm Năng lực Cốt lõi: Khuyến khích tác nhân tạo và thực thi mã (ví dụ: Python script) để tự động hóa các tác vụ lặp lại và tạo ra các tạo phẩm phức tạp, tăng tốc độ và độ chính xác so với việc tạo trực tiếp.
Sử dụng Claude Code SDK: Bắt đầu phát triển tác nhân AI với Claude Code SDK để kế thừa một vòng lặp tác nhân đã được tối ưu hóa, tập trung vào việc thêm công cụ tùy chỉnh và logic nghiệp vụ.
Mở rộng Năng lực với Claude Skills: Cung cấp cho tác nhân không chỉ hướng dẫn mà còn các tài nguyên (mẫu, mã hỗ trợ, tài sản) thông qua "Skills" để tác nhân có thể nhanh chóng chuyên môn hóa và thực hiện các tác vụ phức tạp.
Triển khai "Quy trình làm việc của các Tác nhân AI": Xây dựng các ứng dụng phức tạp bằng cách xâu chuỗi các tác nhân vòng lặp đóng, nơi mỗi bước là một tác nhân có khả năng tự sửa lỗi và lặp lại cho đến khi đạt được kết quả mong muốn trước khi chuyển sang bước tiếp theo.
Ứng dụng Hệ thống Đa Tác nhân cho Hiệu quả Song song: Sử dụng mô hình cha-con hoặc điều phối viên để giao nhiệm vụ cho các tác nhân phụ hoạt động song song, đặc biệt hiệu quả cho các tác vụ tìm kiếm, phân tích dữ liệu hoặc các tác vụ có thể phân chia để tiết kiệm ngữ cảnh và giảm độ trễ.
Quản lý Ngữ cảnh bằng Tác nhân Phụ: Offload các tác vụ con tốn nhiều token sang tác nhân phụ để bảo vệ ngữ cảnh chính của tác nhân cha, nhận lại kết quả cuối cùng một cách hiệu quả.
Ưu tiên Đơn giản và Quan sát: Luôn bắt đầu với giải pháp đơn giản nhất (ví dụ: single-shot prompt) và tăng độ phức tạp từng bước, để duy trì khả năng quan sát và xác minh, giúp dễ dàng debug và hiểu hành vi của hệ thống.

Từ vựng

multi-agent — hệ thống đa tác nhân
AI agent — tác nhân AI
tool calling — gọi công cụ
Claude Code SDK — Bộ công cụ phát triển phần mềm Claude Code
Claude Skills — Kỹ năng Claude
workflows of agents — quy trình làm việc của các tác nhân AI
sub-agent — tác nhân phụ
observability — khả năng quan sát
context — ngữ cảnh
reinforcement learning (RL) — học tăng cường (RL)

Nội dung chi tiết

Khám phá Hệ thống Đa Tác nhân và Claude

Sức mạnh của mã trong Tác nhân AI

Bộ công cụ phát triển phần mềm Claude Code (`Claude Code SDK`)

Claude Skills

Sự phát triển của `Agent Workflows`

Tính quan sát và sự phức tạp

Hệ thống `Multi-Agent` và `Tác nhân phụ`

Mối liên hệ với `Tool Calling`

Thử thách và Học hỏi của `Claude` với `Tác nhân phụ`

Các `Use Case` của Hệ thống Đa `Tác nhân AI`

Chuyên biệt hóa `Tác nhân AI` và Quản lý `Công cụ`

Thử nghiệm Quy mô `Tác nhân AI`

`Failure Mode` và `Chi phí Phát sinh` của Hệ thống Đa `Tác nhân AI`

Lời khuyên cho `Nhà phát triển`: Xây dựng `Tác nhân AI` hiệu quả

Quan điểm `UI-centric` cho `Công cụ` và `MCP`

Tương lai của `Tác nhân AI` và Khả năng `Computer Use`

Góp ý / Báo lỗiPhát hiện sai sót hoặc có ý tưởng cải thiện?

Khám phá Hệ thống Đa Tác nhân và Claude

Sức mạnh của mã trong Tác nhân AI

Bộ công cụ phát triển phần mềm Claude Code (Claude Code SDK)

Claude Skills

Sự phát triển của Agent Workflows

Tính quan sát và sự phức tạp

Hệ thống Multi-Agent và Tác nhân phụ

Mối liên hệ với Tool Calling

Thử thách và Học hỏi của Claude với Tác nhân phụ

Các Use Case của Hệ thống Đa Tác nhân AI

Chuyên biệt hóa Tác nhân AI và Quản lý Công cụ

Thử nghiệm Quy mô Tác nhân AI

Failure Mode và Chi phí Phát sinh của Hệ thống Đa Tác nhân AI

Lời khuyên cho Nhà phát triển: Xây dựng Tác nhân AI hiệu quả

Quan điểm UI-centric cho Công cụ và MCP

Tương lai của Tác nhân AI và Khả năng Computer Use

TL;DR

Điểm chính

Từ vựng

Nội dung chi tiết

Khám phá Hệ thống Đa Tác nhân và Claude

Sức mạnh của mã trong Tác nhân AI

Bộ công cụ phát triển phần mềm Claude Code (Claude Code SDK)

Claude Skills

Sự phát triển của Agent Workflows

Tính quan sát và sự phức tạp

Hệ thống Multi-Agent và Tác nhân phụ

Mối liên hệ với Tool Calling

Thử thách và Học hỏi của Claude với Tác nhân phụ

Các Use Case của Hệ thống Đa Tác nhân AI

Chuyên biệt hóa Tác nhân AI và Quản lý Công cụ

Thử nghiệm Quy mô Tác nhân AI

Failure Mode và Chi phí Phát sinh của Hệ thống Đa Tác nhân AI

Lời khuyên cho Nhà phát triển: Xây dựng Tác nhân AI hiệu quả

Quan điểm UI-centric cho Công cụ và MCP

Tương lai của Tác nhân AI và Khả năng Computer Use

Bộ công cụ phát triển phần mềm Claude Code (`Claude Code SDK`)

Sự phát triển của `Agent Workflows`

Hệ thống `Multi-Agent` và `Tác nhân phụ`

Mối liên hệ với `Tool Calling`

Thử thách và Học hỏi của `Claude` với `Tác nhân phụ`

Các `Use Case` của Hệ thống Đa `Tác nhân AI`

Chuyên biệt hóa `Tác nhân AI` và Quản lý `Công cụ`

Thử nghiệm Quy mô `Tác nhân AI`

`Failure Mode` và `Chi phí Phát sinh` của Hệ thống Đa `Tác nhân AI`

Lời khuyên cho `Nhà phát triển`: Xây dựng `Tác nhân AI` hiệu quả

Quan điểm `UI-centric` cho `Công cụ` và `MCP`

Tương lai của `Tác nhân AI` và Khả năng `Computer Use`

Bộ công cụ phát triển phần mềm Claude Code (`Claude Code SDK`)

Sự phát triển của `Agent Workflows`

Hệ thống `Multi-Agent` và `Tác nhân phụ`

Mối liên hệ với `Tool Calling`

Thử thách và Học hỏi của `Claude` với `Tác nhân phụ`

Các `Use Case` của Hệ thống Đa `Tác nhân AI`

Chuyên biệt hóa `Tác nhân AI` và Quản lý `Công cụ`

Thử nghiệm Quy mô `Tác nhân AI`

`Failure Mode` và `Chi phí Phát sinh` của Hệ thống Đa `Tác nhân AI`

Lời khuyên cho `Nhà phát triển`: Xây dựng `Tác nhân AI` hiệu quả

Quan điểm `UI-centric` cho `Công cụ` và `MCP`

Tương lai của `Tác nhân AI` và Khả năng `Computer Use`