- Claude Managed Agents là một bộ API mạnh mẽ cho phép các nhà phát triển xây dựng, triển khai và quản lý các tác nhân AI trên quy mô lớn, với khả năng tùy chỉnh persona, công cụ và môi trường hoạt động.
- Các tác nhân AI hoạt động trong các container cô lập, được cấu hình sẵn môi trường sandbox với quyền truy cập hệ thống tệp đầy đủ, khả năng thực thi bash, tìm kiếm web và tích hợp các gói phần mềm, cho phép thực hiện nhiều tác vụ phức tạp.
- Hệ thống hỗ trợ tự động hóa các quy trình từ tối ưu hóa hiệu suất web, theo dõi dữ liệu SaaS, đến xử lý cảnh báo và điều phối đa tác nhân, sử dụng bộ nhớ để học hỏi và cải thiện theo thời gian, với các tiêu chí hoàn thành được định nghĩa rõ ràng.
What is Claude Managed Agents?
- Xây dựng và triển khai tác nhân AI quy mô lớn: Claude Managed Agents cung cấp API để định nghĩa tác nhân với các công cụ, persona và khả năng cụ thể, dễ dàng triển khai và mở rộng.
- Môi trường sandbox cô lập và cấu hình được: Mỗi phiên làm việc của tác nhân chạy trong một container cô lập, với môi trường sandbox có thể tùy chỉnh (gói phần mềm, kiểm soát mạng), quyền truy cập hệ thống tệp, thực thi bash và tìm kiếm web.
- Tự động hóa tác vụ phức tạp với công cụ: Tác nhân có thể được trang bị nhiều công cụ (Lighthouse, Puppeteer, Python, Excel) và tích hợp với các hệ thống bên ngoài (GitHub, Slack, Asana) để thực hiện các tác vụ tự động hóa như tối ưu hóa web, theo dõi giá SaaS.
- Tiêu chí đánh giá và lặp lại tự động: Có thể định nghĩa các tiêu chí hoàn thành rõ ràng (ví dụ: Lighthouse score trên 90), và tác nhân sẽ lặp lại các hành động, sử dụng các công cụ để đạt được mục tiêu cho đến khi đáp ứng các tiêu chí đó.
- Thực thi song song và điều phối đa tác nhân: Hệ thống hỗ trợ nhiều phiên làm việc chạy song song trong các container riêng biệt. Đồng thời, cho phép điều phối nhiều tác nhân chuyên gia trên cùng một hệ thống tệp chia sẻ để xử lý các vấn đề phức tạp.
- Bộ nhớ để học hỏi và ngữ cảnh hóa: Tác nhân có thể đọc và ghi vào kho lưu trữ bộ nhớ để duy trì trạng thái, học hỏi từ các sự cố trong quá khứ và sử dụng ngữ cảnh đó cho các tác vụ tương lai, giúp chẩn đoán hiệu quả hơn.
- Phản hồi theo thời gian thực và kiểm soát quyền hạn: Các lệnh gọi công cụ và tiến độ được truyền về theo thời gian thực thông qua luồng sự kiện. Chính sách quyền hạn cho phép xem xét và phê duyệt các hành động quan trọng trước khi thực hiện.
Claude Managed Agents— Claude Managed Agentstác nhân AI— AI agentAPI— APImôi trường sandbox— sandbox environmentcontainer cô lập— isolated containerphiên làm việc— sessioncông cụ— toolkho lưu trữ bộ nhớ— memory repositoryđiều phối đa tác nhân— multi-agent orchestrationtiêu chí đánh giá— evaluation criteria
Giới thiệu Claude Managed Agents
Claude Managed Agents là một bộ API cho phép xây dựng và triển khai các tác nhân AI trên quy mô lớn. Bạn có thể định nghĩa các tác nhân AI với các công cụ, persona và khả năng cụ thể. Bạn cấu hình môi trường sandbox với các gói phần mềm và kiểm soát mạng phù hợp. Bạn kích hoạt các phiên làm việc từ ứng dụng của riêng mình, sau đó Claude thực hiện công việc bên trong một container cô lập với quyền truy cập hệ thống tệp đầy đủ, khả năng thực thi bash và tìm kiếm web.
Tối ưu hóa hiệu suất trang web tự động
Tôi có một bảng Kanban đang hiển thị trên Managed Agents. Tôi kéo một phiếu tác vụ sang cột "đang thực hiện", và sau đó tự động kích hoạt một phiên làm việc. Phiếu tác vụ ghi tối ưu hóa hiệu suất trang web. Hệ thống backend của tôi tạo một phiên làm việc, point đến một môi trường mà tôi đã cấu hình với Lighthouse và Puppeteer được cài đặt sẵn, đồng thời gắn kho lưu trữ GitHub của tôi vào container đó. Claude có cơ sở mã, các công cụ và tiêu chí đánh giá: Lighthouse score trên 90, không có tài nguyên gây chặn hiển thị, tất cả hình ảnh đều được tải trì hoãn (lazy loaded). Và sau đó chúng ta có thể thấy rằng Claude chạy kiểm tra. Nó bắt đầu nén ảnh, nhúng nội tuyến CSS, hoãn tải script. Mỗi lệnh gọi công cụ được truyền về bảng Kanban theo thời gian thực thông qua luồng sự kiện. Sau đó, tiêu chí đánh giá được áp dụng. Một công cụ chấm điểm riêng biệt chạy trong cửa sổ ngữ cảnh của nó để đánh giá kết quả theo tiêu chí của tôi. Claude đọc phản hồi đó, quay lại, khắc phục những gì còn thiếu, và sau đó gửi lại. Tốt. Chúng ta đã đạt 96 điểm. Và lưu ý rằng tôi có thể kéo một phiếu tác vụ thứ hai trong khi phiếu đầu tiên vẫn đang chạy. Hai phiên làm việc, hai container, hai tác vụ riêng biệt chạy song song.
Theo dõi giá công cụ SaaS và lập báo cáo
Tôi có một tác nhân AI khác có nhiệm vụ theo dõi giá cả và thay đổi gói dịch vụ trên mọi công cụ SaaS mà công ty chúng tôi chi trả, và chuẩn bị báo cáo trước buổi họp giao ban. Claude tìm kiếm web các trang giá hiện tại, kiểm tra thay đổi cấp gói dịch vụ, đánh dấu các tính năng mới có thể ảnh hưởng đến hợp đồng của bạn. Sau đó, nó chạy phân tích chi phí bằng Python bên trong môi trường sandbox đó. Và sau đó nó cũng sử dụng kỹ năng bảng tính Excel và viết một bản tóm tắt điều hành. Và khi báo cáo sẵn sàng, Claude đăng một liên kết lên Slack và tạo một tác vụ đánh giá trong Asana, cả hai đều thông qua máy chủ MCP. Tác nhân AI cũng đọc và ghi vào một kho lưu trữ bộ nhớ. Trước khi bắt đầu, nó kiểm tra những gì đã tìm thấy vào tuần trước. Sau khi hoàn thành, nó lưu trữ những gì đã thay đổi. Vì vậy, báo cáo vào thứ Hai tuần tới sẽ ghi rằng: "Điện toán đám mây giảm 15% so với tuần trước," thay vì liệt kê cùng dữ liệu giá tĩnh.
Xử lý cảnh báo và Điều phối Đa tác nhân
Tôi có một cảnh báo ở đây được kích hoạt từ hệ thống giám sát của tôi. Một công cụ tùy chỉnh trong hệ thống backend của tôi nhận tải trọng cảnh báo và gửi nó vào một phiên làm việc mới dưới dạng kết quả công cụ. Phiên làm việc này sử dụng điều phối đa tác nhân. Một tác nhân điều phối nhận cảnh báo và phân công cho ba chuyên gia, mỗi chuyên gia chạy trong cửa sổ ngữ cảnh của riêng mình trên cùng một hệ thống tệp chia sẻ. Các chuyên gia báo cáo lại. Tác nhân điều phối tổng hợp các phát hiện của họ thành một tóm tắt sự cố duy nhất. Và trước khi nó đăng thông tin cập nhật lên Slack, chính sách quyền hạn được kích hoạt. Vì vậy, tôi thấy bản nháp trên màn hình, phê duyệt nó, và thông báo được gửi đi. Bộ nhớ kết nối tất cả những điều này lại với nhau. Tác nhân điều phối kiểm tra sự cố trong quá khứ trong kho lưu trữ bộ nhớ và đánh dấu một mẫu. Điều này trông giống như sự cố phân giải DNS từ 2 tuần trước do TTL bị cấu hình sai. Vì vậy, điều đó có nghĩa là lần tới khi một cảnh báo tương tự được kích hoạt, tác nhân AI sẽ bắt đầu với ngữ cảnh đó thay vì chẩn đoán từ đầu.
Tóm tắt và Lợi ích
Managed Agents cung cấp cho các nhà phát triển các công cụ để mang lại trải nghiệm tác nhân có trạng thái được quản lý hoàn toàn, bao gồm tác nhân AI, phiên làm việc, môi trường, công cụ, MCP, bộ nhớ, kết quả và điều phối đa tác nhân. Bạn định nghĩa thế nào là hoàn thành. Claude sẽ làm việc cho đến khi đạt được điều đó.
TL;DR
- Claude Managed Agents là một bộ API mạnh mẽ cho phép các nhà phát triển xây dựng, triển khai và quản lý các tác nhân AI trên quy mô lớn, với khả năng tùy chỉnh persona, công cụ và môi trường hoạt động.
- Các tác nhân AI hoạt động trong các container cô lập, được cấu hình sẵn môi trường sandbox với quyền truy cập hệ thống tệp đầy đủ, khả năng thực thi bash, tìm kiếm web và tích hợp các gói phần mềm, cho phép thực hiện nhiều tác vụ phức tạp.
- Hệ thống hỗ trợ tự động hóa các quy trình từ tối ưu hóa hiệu suất web, theo dõi dữ liệu SaaS, đến xử lý cảnh báo và điều phối đa tác nhân, sử dụng bộ nhớ để học hỏi và cải thiện theo thời gian, với các tiêu chí hoàn thành được định nghĩa rõ ràng.
Điểm chính
- Xây dựng và triển khai tác nhân AI quy mô lớn: Claude Managed Agents cung cấp API để định nghĩa tác nhân với các công cụ, persona và khả năng cụ thể, dễ dàng triển khai và mở rộng.
- Môi trường sandbox cô lập và cấu hình được: Mỗi phiên làm việc của tác nhân chạy trong một container cô lập, với môi trường sandbox có thể tùy chỉnh (gói phần mềm, kiểm soát mạng), quyền truy cập hệ thống tệp, thực thi bash và tìm kiếm web.
- Tự động hóa tác vụ phức tạp với công cụ: Tác nhân có thể được trang bị nhiều công cụ (Lighthouse, Puppeteer, Python, Excel) và tích hợp với các hệ thống bên ngoài (GitHub, Slack, Asana) để thực hiện các tác vụ tự động hóa như tối ưu hóa web, theo dõi giá SaaS.
- Tiêu chí đánh giá và lặp lại tự động: Có thể định nghĩa các tiêu chí hoàn thành rõ ràng (ví dụ: Lighthouse score trên 90), và tác nhân sẽ lặp lại các hành động, sử dụng các công cụ để đạt được mục tiêu cho đến khi đáp ứng các tiêu chí đó.
- Thực thi song song và điều phối đa tác nhân: Hệ thống hỗ trợ nhiều phiên làm việc chạy song song trong các container riêng biệt. Đồng thời, cho phép điều phối nhiều tác nhân chuyên gia trên cùng một hệ thống tệp chia sẻ để xử lý các vấn đề phức tạp.
- Bộ nhớ để học hỏi và ngữ cảnh hóa: Tác nhân có thể đọc và ghi vào kho lưu trữ bộ nhớ để duy trì trạng thái, học hỏi từ các sự cố trong quá khứ và sử dụng ngữ cảnh đó cho các tác vụ tương lai, giúp chẩn đoán hiệu quả hơn.
- Phản hồi theo thời gian thực và kiểm soát quyền hạn: Các lệnh gọi công cụ và tiến độ được truyền về theo thời gian thực thông qua luồng sự kiện. Chính sách quyền hạn cho phép xem xét và phê duyệt các hành động quan trọng trước khi thực hiện.
Từ vựng
Claude Managed Agents— Claude Managed Agentstác nhân AI— AI agentAPI— APImôi trường sandbox— sandbox environmentcontainer cô lập— isolated containerphiên làm việc— sessioncông cụ— toolkho lưu trữ bộ nhớ— memory repositoryđiều phối đa tác nhân— multi-agent orchestrationtiêu chí đánh giá— evaluation criteria
Nội dung chi tiết
Giới thiệu Claude Managed Agents
Claude Managed Agents là một bộ API cho phép xây dựng và triển khai các tác nhân AI trên quy mô lớn. Bạn có thể định nghĩa các tác nhân AI với các công cụ, persona và khả năng cụ thể. Bạn cấu hình môi trường sandbox với các gói phần mềm và kiểm soát mạng phù hợp. Bạn kích hoạt các phiên làm việc từ ứng dụng của riêng mình, sau đó Claude thực hiện công việc bên trong một container cô lập với quyền truy cập hệ thống tệp đầy đủ, khả năng thực thi bash và tìm kiếm web.
Tối ưu hóa hiệu suất trang web tự động
Tôi có một bảng Kanban đang hiển thị trên Managed Agents. Tôi kéo một phiếu tác vụ sang cột "đang thực hiện", và sau đó tự động kích hoạt một phiên làm việc. Phiếu tác vụ ghi tối ưu hóa hiệu suất trang web. Hệ thống backend của tôi tạo một phiên làm việc, point đến một môi trường mà tôi đã cấu hình với Lighthouse và Puppeteer được cài đặt sẵn, đồng thời gắn kho lưu trữ GitHub của tôi vào container đó. Claude có cơ sở mã, các công cụ và tiêu chí đánh giá: Lighthouse score trên 90, không có tài nguyên gây chặn hiển thị, tất cả hình ảnh đều được tải trì hoãn (lazy loaded). Và sau đó chúng ta có thể thấy rằng Claude chạy kiểm tra. Nó bắt đầu nén ảnh, nhúng nội tuyến CSS, hoãn tải script. Mỗi lệnh gọi công cụ được truyền về bảng Kanban theo thời gian thực thông qua luồng sự kiện. Sau đó, tiêu chí đánh giá được áp dụng. Một công cụ chấm điểm riêng biệt chạy trong cửa sổ ngữ cảnh của nó để đánh giá kết quả theo tiêu chí của tôi. Claude đọc phản hồi đó, quay lại, khắc phục những gì còn thiếu, và sau đó gửi lại. Tốt. Chúng ta đã đạt 96 điểm. Và lưu ý rằng tôi có thể kéo một phiếu tác vụ thứ hai trong khi phiếu đầu tiên vẫn đang chạy. Hai phiên làm việc, hai container, hai tác vụ riêng biệt chạy song song.
Theo dõi giá công cụ SaaS và lập báo cáo
Tôi có một tác nhân AI khác có nhiệm vụ theo dõi giá cả và thay đổi gói dịch vụ trên mọi công cụ SaaS mà công ty chúng tôi chi trả, và chuẩn bị báo cáo trước buổi họp giao ban. Claude tìm kiếm web các trang giá hiện tại, kiểm tra thay đổi cấp gói dịch vụ, đánh dấu các tính năng mới có thể ảnh hưởng đến hợp đồng của bạn. Sau đó, nó chạy phân tích chi phí bằng Python bên trong môi trường sandbox đó. Và sau đó nó cũng sử dụng kỹ năng bảng tính Excel và viết một bản tóm tắt điều hành. Và khi báo cáo sẵn sàng, Claude đăng một liên kết lên Slack và tạo một tác vụ đánh giá trong Asana, cả hai đều thông qua máy chủ MCP. Tác nhân AI cũng đọc và ghi vào một kho lưu trữ bộ nhớ. Trước khi bắt đầu, nó kiểm tra những gì đã tìm thấy vào tuần trước. Sau khi hoàn thành, nó lưu trữ những gì đã thay đổi. Vì vậy, báo cáo vào thứ Hai tuần tới sẽ ghi rằng: "Điện toán đám mây giảm 15% so với tuần trước," thay vì liệt kê cùng dữ liệu giá tĩnh.
Xử lý cảnh báo và Điều phối Đa tác nhân
Tôi có một cảnh báo ở đây được kích hoạt từ hệ thống giám sát của tôi. Một công cụ tùy chỉnh trong hệ thống backend của tôi nhận tải trọng cảnh báo và gửi nó vào một phiên làm việc mới dưới dạng kết quả công cụ. Phiên làm việc này sử dụng điều phối đa tác nhân. Một tác nhân điều phối nhận cảnh báo và phân công cho ba chuyên gia, mỗi chuyên gia chạy trong cửa sổ ngữ cảnh của riêng mình trên cùng một hệ thống tệp chia sẻ. Các chuyên gia báo cáo lại. Tác nhân điều phối tổng hợp các phát hiện của họ thành một tóm tắt sự cố duy nhất. Và trước khi nó đăng thông tin cập nhật lên Slack, chính sách quyền hạn được kích hoạt. Vì vậy, tôi thấy bản nháp trên màn hình, phê duyệt nó, và thông báo được gửi đi. Bộ nhớ kết nối tất cả những điều này lại với nhau. Tác nhân điều phối kiểm tra sự cố trong quá khứ trong kho lưu trữ bộ nhớ và đánh dấu một mẫu. Điều này trông giống như sự cố phân giải DNS từ 2 tuần trước do TTL bị cấu hình sai. Vì vậy, điều đó có nghĩa là lần tới khi một cảnh báo tương tự được kích hoạt, tác nhân AI sẽ bắt đầu với ngữ cảnh đó thay vì chẩn đoán từ đầu.
Tóm tắt và Lợi ích
Managed Agents cung cấp cho các nhà phát triển các công cụ để mang lại trải nghiệm tác nhân có trạng thái được quản lý hoàn toàn, bao gồm tác nhân AI, phiên làm việc, môi trường, công cụ, MCP, bộ nhớ, kết quả và điều phối đa tác nhân. Bạn định nghĩa thế nào là hoàn thành. Claude sẽ làm việc cho đến khi đạt được điều đó.