- Amplifun, một công ty toàn cầu với hoạt động phân tán, phải đối mặt với sự hỗn loạn khi các nhóm AI nội bộ phát triển
tác nhân AImột cách độc lập, dẫn đến trùng lặp công việc và thiếu quy chuẩn về bảo mật, cơ sở hạ tầng. - Để giải quyết vấn đề này, Amplifun đã khởi động chương trình Amplify, tập trung vào ba trụ cột chính: quản trị (
governance), nền tảng (platform), và khối sản xuất (factory), nhằm thiết lập các quy tắc và cơ sở hạ tầng tập trung cho việc triển khai AI. - Giải pháp kỹ thuật bao gồm một
cổng API AIthống nhất và bahệ thống đăng ký(choMCP,Tác nhân AIvàTrường hợp sử dụng), cùng với các bản thiết kế (blueprints) và tích hợp CI/CD, đảm bảo quản trị, khả năng mở rộng, kiểm soát chi phí vàdòng dõi thông tintoàn diện ở cấp doanh nghiệp.
One Registry to Rule them All - Sonny Merla, Mauro Luchetti, & Mattia Redaelli, Quantyca
- Thiết lập Cổng API AI tập trung: Tạo một điểm truy cập hợp nhất cho tất cả các
mô hình AI, cung cấpxác thực, quản lý ngân sách (budgeting), vàcông cụ kiểm toán, giám sát và phân tíchtập trung để kiểm soát và theo dõi việc sử dụng AI. - Xây dựng Hệ thống Đăng ký toàn diện: Triển khai ba
hệ thống đăng kýchính –MCP,Tác nhân AI, vàTrường hợp sử dụng– để lập danh mục cáccông cụ AI,tác nhânđã triển khai và mối liên hệ của chúng với các trường hợp kinh doanh cụ thể, tạo ra một nguồn thông tin duy nhất. - Phân loại Siêu dữ liệu cấp Doanh nghiệp: Làm phong phú các mục đăng ký bằng
siêu dữ liệunhư quyền sở hữu,môi trườngchạy, mô hìnhxác thực, chi phí và liên kết trường hợp sử dụng để cho phép phân tích tác động,quản trịvàkhả năng kiểm toánđầy đủ. - Phát triển Chu trình với Bản thiết kế và Tự động hóa: Cung cấp các
kho lưu trữ mẫu(blueprints) cho nhà phát triển, bao gồmmã mẫu(boilerplate code),hạ tầng(FastAPI servers,Docker files) vàcông cụ hỗ trợđã cấu hình sẵn để tiêu chuẩn hóa quy trình phát triển và tự động xuất bảnsiêu dữ liệuthông quaCI/CD. - Đảm bảo
Dòng dõi Thông tin: Sử dụnghệ thống đăng ký trường hợp sử dụngvà chế độ xemdòng dõi đối tượng(object lineage) để ánh xạ cáctác nhânvàcông cụđược sử dụng trong mỗitrường hợp sử dụng, cung cấp khả năng hiển thị toàn diện về các mối quan hệ và tác động tiềm tàng. - Thiết kế
Tác nhân AIlinh hoạt: Xây dựngbản thiết kế tác nhân AIkhông phụ thuộc(agnostic) vàokhung làm việccụ thể (ví dụ:LangChain), chỉ tập trung vào cácgiao diệnvàcổngchuẩn hóa để các nhóm có thể sử dụngkhung làm việcyêu thích của họ. - Tích hợp
Khả năng Quan sát: Kết hợp cáccông cụ khả năng quan sátnhư Infuse vàonền tảngđể cho phép các nhóm phát triển theo dõi,đánh giá(evaluations) và kiểm tra hiệu suất của cáctác nhân AIcủa họ.
AI agent— Tác nhân AIenterprise-grade— Cấp doanh nghiệpControl Tower— Tháp kiểm soátgovernance— Quản trịplatform— Nền tảngLLM model— Mô hình LLMAI API Gateway— Cổng API AIregistry system— Hệ thống đăng kýmetadata— Siêu dữ liệulineage of information / lineage functionality— Dòng dõi thông tin / Chức năng dòng dõiblueprint— Bản thiết kếobservability— Khả năng quan sátframework— Khung làm việc
Giới thiệu và Vấn đề
Điều gì sẽ xảy ra khi bạn có các nhóm nội bộ làm việc trên ba lục địa, tất cả đều xây dựng các tác nhân AI, mỗi nhóm tự thiết lập các kết nối, tự phát minh mô hình bảo mật và tự triển khai cơ sở hạ tầng của riêng mình? Bạn sẽ nhận được 'cows' (ý nói sự hỗn loạn).
Xin chào, tôi là Sonny Merla, Giám đốc Khoa học Dữ liệu Toàn cầu và AI tại Amplifun. Hôm nay tôi ở đây cùng với Mauro Lucati, Giám đốc Trung tâm Xuất sắc về AI và Mathieu Rida, Kỹ sư AI tại Quantica, đội ngũ đã thiết kế và xây dựng giải pháp kỹ thuật mà chúng ta sắp mô tả. Hôm nay, chúng tôi sẽ trình bày cách Amplifun giải quyết vấn đề này bằng việc triển khai chương trình Amplify của riêng họ, và đặc biệt là cách chúng tôi thiết kế một hệ thống đăng ký cấp doanh nghiệp cho MCP và các tác nhân AI.
Giới thiệu về Amplifun
Amplifun là công ty hàng đầu thế giới về giải pháp thính giác. Chúng tôi hoạt động tại 26 quốc gia trên toàn cầu, với hơn 20.000 nhân viên và hơn 10.000 cửa hàng trên toàn thế giới. Chúng tôi đang trong quá trình chuyển đổi AI. Hiện tại, chúng tôi đang thử nghiệm các giải pháp và công nghệ AI, vì vậy chúng tôi đang đối mặt với những thách thức như xây dựng các giải pháp ổn định theo thời gian và tìm cách mở rộng chúng một cách có trách nhiệm, tuân thủ các hướng dẫn được định nghĩa tập trung.
Chương trình Amplify: Áp dụng AI theo quy mô
Vậy Amplifun đã quyết định áp dụng AI theo quy mô như thế nào? Chúng tôi đã ra mắt chương trình Amplify vào tháng 1 năm 2025. Đây là một chương trình toàn cầu và đa chức năng được thiết kế để đặt ra các quy tắc cho việc áp dụng AI, và về cơ bản, nó bao gồm một mô hình hoạt động và một kế hoạch thực thi.
Mô hình hoạt động và Các trọng tâm chính
Mô hình hoạt động dựa trên hai trụ cột chính: Control Tower (Tháp kiểm soát) và committee (Ủy ban). Control Tower là một nhóm nhỏ người, bao gồm cả các Giám đốc cấp cao, quyết định các hướng dẫn về bảo mật, pháp lý và công nghệ, cũng như các chiến lược, trọng tâm chiến lược và do đó là các trường hợp sử dụng cần phát triển đầu tiên. Sau đó là committee chịu trách nhiệm điều hành chiến lược ở các quốc gia cũng như ở cấp công ty. Committee cũng ưu tiên các trường hợp sử dụng một cách chi tiết hơn, và giải phóng giá trị cho tổ chức.
Các trọng tâm chính của chương trình Amplify là gì? Chúng tôi có ba trọng tâm: governance (quản trị), platform (nền tảng) và factory (khối sản xuất).
- Quản trị (
Governance): Chúng tôi muốn đảm bảo sự phù hợp với các quy địnhAI, cũng như chiến lược và các hướng dẫn mà chúng tôi đã định nghĩa tập trung. Đây cũng là vấn đề giúp mọi người nhận thức được sự tồn tại của chương trình, các quy tắc trò chơi, và sau đó thông báo cho mọi người về cách chúng tôi cung cấp và triển khai giá trị. - Nền tảng (
Platform): Chúng tôi phải thiết lập cơ sở hạ tầng mà trên đó các nhà phát triển và nhóm triển khai hoạt động. Điều này bao gồm chứng nhận cơ sở hạ tầng và cách thức làm việc để cung cấp quy trình và dịch vụ cho ứng dụngAI. - Khối Sản xuất (
Factory): Đây là phần thực tế nhất của câu chuyện. Chúng tôi có các nhóm phát triển cần tập trung vào việc triển khai các giải pháp ra thị trường, đồng thời quan tâm đến việc triển khai trên các quốc gia, điều này rất quan trọng đối với Amplifun. Vì vậy, cần suy nghĩ về giải pháp như có khả năng mở rộng (scalable) và có thể tái sử dụng (reusable) trên các lĩnh vực khác nhau.
Thách thức khi triển khai AI diện rộng
Vậy, những vấn đề chính mà chúng tôi nhận thấy khi một tổ chức cố gắng triển khai AI theo quy mô một cách rộng rãi là gì? Chắc chắn chúng tôi dự đoán các vấn đề về bảo trì và vận hành, các vấn đề về quản trị và tuân thủ, nhưng cũng có cả các vấn đề về mở rộng quy mô doanh nghiệp. Vậy, các nhà phát triển cần phát triển như thế nào để đảm bảo các giải pháp ổn định theo thời gian?
Bắt đầu từ khía cạnh bảo trì và vận hành, ngay cả với vòng đời ngắn của các mô hình LLM là cốt lõi của ứng dụng AI và các tác nhân AI mà chúng tôi phát triển và triển khai, chúng tôi muốn đảm bảo rằng chúng tôi có thể giải quyết việc sử dụng loại LLM này trên các trường hợp sử dụng mà chúng tôi triển khai. Vì vậy, chúng tôi muốn sẵn sàng và chuẩn bị hành động kịp thời mỗi khi chúng tôi thấy sự gián đoạn trong mô hình mà chúng tôi sử dụng cho trường hợp sử dụng đó.
Mặt khác, với góc nhìn về quản trị và tuân thủ, chúng tôi cần đảm bảo biết được chúng tôi sử dụng AI ở đâu trong tổ chức, đâu là các trường hợp sử dụng chính, cả từ góc độ quy định lẫn việc sử dụng trong toàn tổ chức. Vì vậy, chúng tôi muốn có một danh mục, một cách để hiểu các tài sản được sử dụng bởi từng trường hợp sử dụng, những gì chúng đã triển khai, những gì chúng đã sử dụng để tạo ra một loại dòng dõi thông tin (lineage of the information).
Mặt khác, còn có một điểm liên quan đến cách chúng tôi phát triển giải pháp AI trong tổ chức qua nhiều nhóm hoạt động trên các cơ sở hạ tầng khác nhau. Vì vậy, chúng tôi muốn việc phát triển, ít nhất về mặt quản trị, phải được tập trung hóa, với các hướng dẫn rõ ràng, có thể tái sử dụng trên các cơ sở hạ tầng và nhóm khác nhau. Đây là mục tiêu: chúng tôi muốn làm cho cuộc sống của các nhà phát triển dễ dàng hơn để họ tập trung vào logic nghiệp vụ bên trong các trường hợp sử dụng, tránh việc phải "tái tạo lại bánh xe" mỗi khi cần quan tâm đến bảo mật, cũng như việc triển khai và bảo trì các trường hợp sử dụng.
Bây giờ, tôi xin mời Mauro giới thiệu cách chúng tôi giải quyết các chủ đề này tại Amplifun.
Cổng API AI (AI Gateway)
Cảm ơn Sony, và hãy cùng xem xét vấn đề này từ góc độ kỹ thuật hơn. Thành phần đầu tiên mà chúng tôi xây dựng để giải quyết những vấn đề đó là cổng API AI. Trước hết, nó mang lại cho chúng tôi một quyền truy cập hợp nhất, vì vậy tất cả các nhà phát triển muốn sử dụng một mô hình đều có thể sử dụng cổng API này và họ có thể trỏ đến điểm cuối hợp nhất và sử dụng tất cả các mô hình mà Amplifun có trong danh mục của mình.
Sau đó là khía cạnh bảo mật. Nếu bạn muốn sử dụng mô hình, bạn phải kết nối với cổng API, bạn phải xác thực bản thân, và chúng tôi đã thực hiện điều này với tích hợp nội bộ. Tiếp theo là khía cạnh ngân sách. Bởi vì Amplifun có rất nhiều trường hợp sử dụng, và nếu một trường hợp sử dụng yêu cầu ngân sách để sử dụng các mô hình đó, bạn có thể đặt ngân sách hàng tháng trong cổng API AI này, hoặc bạn có thể đặt theo tháng, tuần, v.v. Trong khi các nhà phát triển đang sử dụng ngân sách đó, nó sẽ bị giảm dần và cổng API có thể thông báo cho các nhà phát triển về phần ngân sách còn lại, để họ có thể kiểm soát nó. Cuối cùng là khía cạnh kiểm soát. Tất cả các yêu cầu được thực hiện thông qua mô hình LLM hoặc phản hồi, tất cả các phân tích mà chúng tôi cần triển khai trên tất cả các yêu cầu đều được thực hiện bằng cách sử dụng các công cụ kiểm toán, giám sát và phân tích tập trung, rõ ràng là được kết nối với cổng API AI này.
Tổng quan về Các hệ thống đăng ký
Đối với phần quản trị, đây là điểm vào, tôi có thể nói là lớp trên cùng. Và sau đó, chúng tôi có ba hệ thống đăng ký khác nhau.
- Đầu tiên là hệ thống đăng ký
MCP. Như bạn hình dung, tất cả cáccông cụ, tất cả cáctích hợpvới hệ thống Amplifun, tất cả các chức năng mà chúng tôi muốn cung cấp cho cácmô hình LLMđều được hiển thị thông quahệ thống đăng ký MCPnày, đây là danh mục trung tâm của tất cả cáccông cụcó sẵn. - Sau đó là hệ thống đăng ký
Tác nhân AI. Nó cung cấp một danh mục đầy đủ cáctác nhânđã được triển khai hoàn chỉnh và có sẵn. Nó sử dụng chuẩnthẻ tác nhân(agent card), hiển thịthẻ tác nhân, và cũng có thể cung cấp cho nhà phát triển khả năng kết nối với cáctác nhânđã được phát triển. - Và cuối cùng là hệ thống đăng ký trường hợp sử dụng (
use case registry), là hệ thống đăng ký kết nối tất cả các thông tin đó lại với nhau, tất cả cácsiêu dữ liệuđó lại với nhau, và mang lại chức năng quản trị thực sự, chức năngdòng dõi thông tin(lineage functionality), và một lần nữa, kết nối tất cả các khía cạnh đó lại với nhau.
Hãy cùng đi vào chi tiết hơn về từng hệ thống đăng ký này.
Hệ thống đăng ký MCP
Tôi không muốn giải thích MCP là gì cho bất kỳ ai tại hội nghị này, nhưng chúng tôi đã bắt đầu từ hệ thống đăng ký MCP chính thức, được duy trì bởi cộng đồng. Đây là danh mục công khai, rộng khắp cộng đồng về tất cả các máy chủ MCP có sẵn. Và chúng tôi về cơ bản đã xây dựng dựa trên đó. Amplifun đã xây dựng hệ thống đăng ký MCP riêng tư của mình như một tiện ích mở rộng về các chức năng, và cũng như trong ngữ cảnh doanh nghiệp mà chúng tôi muốn thêm vào mỗi máy chủ được đăng ký.
Nó chứa hai thứ chính, như bạn có thể hình dung: các máy chủ nội bộ tùy chỉnh mà nhóm Amplifun nội bộ đã xây dựng cho các tích hợp cụ thể, các công cụ cụ thể mà Amplifun muốn cung cấp; và một tập hợp máy chủ công cộng đã được tuyển chọn, đã được phê duyệt, đã được chứng nhận cho các trường hợp sử dụng của Amplifun. Cả hai loại máy chủ này mà chúng tôi muốn đăng ký vào danh mục này đều được làm phong phú với một số siêu dữ liệu doanh nghiệp bổ sung.
Hãy xem những siêu dữ liệu đó là gì:
- Quyền sở hữu (
ownership): Mỗimáy chủcó một chủ sở hữu, đó là nhóm nào, trường hợp sử dụng nào, dự án nào chịu trách nhiệm chomáy chủcụ thể đó. Môi trường(environment):Môi trườngmàmáy chủđang chạy (ví dụ:dev,test,prod, v.v.).- Mô hình
xác thực(authentication models): Cách tôi, với tư cách là một nhà phát triển, có thể sử dụngmáy chủđó; các cơ chế tôi cần triển khai. - Chi phí đóng góp (
cost contributions): Điều này được liên kết với chức năngcổng API AI, khía cạnh ngân sách mà chúng tôi đã mô tả trước đây, và được thực hiện để xemmáy chủnào đang chi tiêu bao nhiêu. - Liên kết trường hợp sử dụng (
use case linkage): Các trường hợp sử dụng nào thực sự đang sử dụngmáy chủcụ thể đó.
Và đây không chỉ đơn thuần là siêu dữ liệu "có thì tốt". Đây là điều thực sự mang lại chức năng phân tích tác động. Đây là nơi chúng tôi thực sự kích hoạt quản trị và khả năng kiểm toán (auditability), và chúng tôi có một dấu vết hoàn chỉnh về những công cụ AI nào tồn tại và chúng đang được các nhà phát triển AMP sử dụng như thế nào.
Hệ thống đăng ký Tác nhân AI
Tiếp theo là hệ thống đăng ký thứ hai, đó là hệ thống đăng ký Tác nhân AI. Nó hoàn toàn dựa trên thẻ tác nhân (agent card) mô tả định danh của tác nhân, điểm cuối, năng lực tác nhân (agent capabilities), các phương thức được hỗ trợ, yêu cầu xác thực, v.v. Chúng tôi đã xây dựng một số bản thiết kế (blueprints), và chúng tôi sẽ nói về những bản thiết kế đó. Nhưng về cơ bản, khi một tác nhân được triển khai, nó sẽ tự động công bố thẻ tác nhân của mình lên hệ thống đăng ký thông qua tích hợp CI-CD. Bằng cách này, bất kỳ tác nhân nào khác, bất kỳ nhà phát triển nào khác đều có thể khám phá tác nhân mới này, và rõ ràng có thể tương tác với nó. Vì vậy, theo một cách nào đó, chúng tôi đang cố gắng làm cho tất cả các hoạt động phát triển tác nhân đó trở nên tự tài liệu hóa.
Hệ thống đăng ký Trường hợp sử dụng
Bây giờ chúng ta sẽ xem hệ thống đăng ký trường hợp sử dụng kết nối hai hệ thống đăng ký kia lại với nhau như thế nào. Làm thế nào chúng ta có thể sử dụng hệ thống đăng ký MCP và hệ thống đăng ký Tác nhân AI từ góc độ kinh doanh? Chúng tôi muốn có một hệ thống đăng ký trường hợp sử dụng để ánh xạ các tác nhân và công cụ trong các trường hợp sử dụng cụ thể được áp dụng trong toàn tổ chức. Và đây là lý do tại sao chúng tôi thiết kế khối xây dựng cụ thể này, nhằm mục đích chứa thông tin về các tài sản được sử dụng bởi từng trường hợp sử dụng, những gì chúng triển khai, những phương thức chúng sử dụng cho cả chủ đề bảo trì mà chúng tôi đã đề cập trước đó, và cũng để hiểu cách thức và nơi chúng tôi phát triển và triển khai các loại trường hợp sử dụng này. Ví dụ, hệ thống nào phục vụ trường hợp sử dụng cụ thể đó, và tất cả các đối tượng khác bị ảnh hưởng bởi các trường hợp sử dụng này là gì. Vì vậy, ví dụ, nếu chúng ta có kết nối giữa nhiều trường hợp sử dụng, chúng ta muốn thấy điều đó rõ ràng trong một giao diện có thể là một danh mục cho mọi người.
Trải nghiệm nền tảng
Bây giờ hãy xem nó hoạt động trong thực tế như thế nào. Hãy cùng xem qua nền tảng đã được phát triển và triển khai tất cả các hệ thống đăng ký này cho tổ chức.
Được rồi, chúng tôi cũng muốn cung cấp cho bạn một cái nhìn tổng quan ngắn gọn về nền tảng của chúng tôi. Ở đây bạn có thể thấy trang chủ. Bạn có thể vào phần danh mục. Vậy, những gì chúng tôi đã mô tả chi tiết trước đây, đó là MCP, HWA (ý nói AI agent), và các trường hợp sử dụng. Chúng tôi cũng có phần cổng API AI (AI gateway) nơi chúng tôi định nghĩa những thành phần nào có sẵn trong doanh nghiệp hiện tại. Tôi sẽ quay lại trang tổng quan (dashboard). Nếu chúng ta chuyển sang danh mục, đây là nền tảng mà chúng ta sẽ sớm triển khai vào môi trường sản xuất. Ở đây chúng ta có dữ liệu demo. Chúng tôi có sáu thực thể được định nghĩa. Cho đến thời điểm này, chúng tôi có các trường hợp sử dụng, MCP, và tác nhân HWA (ý nói AI agent). Khi đi vào phần các trường hợp sử dụng, nếu chúng ta mở một trường hợp sử dụng mẫu, ví dụ, chúng ta có thể định nghĩa trạng thái, phiên bản, mô tả, các tài sản được sử dụng. Ví dụ, một tác nhân và một máy chủ MCP, các mô hình AI mà nó đang sử dụng, và lịch sử vòng đời của trường hợp sử dụng. Nếu chúng ta vào trang tạo trường hợp sử dụng, bạn có thể thấy rằng chúng ta có thể định nghĩa tên, mô tả, trạng thái của trường hợp sử dụng, quyền sở hữu, và cả các tài sản được liên kết với nó.
Công cụ AI và Tác nhân HWA
Nếu chúng ta chuyển sang phần AI tools, cụ thể là MCP servers, bạn có thể thấy chúng tôi có hai MCP servers mẫu. server JSON thực tế được mô tả ở đây. Chúng ta cũng có thể xem xét các tác nhân HWA, tương tự như các thẻ tác nhân. Ví dụ, ở đây chúng ta có thể định nghĩa long chain test agent, các capabilities và mô tả từ thẻ tác nhân. Chúng tôi cũng định nghĩa trang kiểm tra (inspector page) nơi bạn có thể chọn một máy chủ MCP và khởi chạy trình kiểm tra trong một tab khác. Vì vậy, bạn cũng có thể kết nối và kiểm tra những gì MCP đó đang cung cấp cho bạn. Chúng tôi cũng có cùng trình kiểm tra đó chỉ kiểm tra tính tương thích với thẻ tác nhân HWA. Và bạn có thể làm điều tương tự ở đây.
Chúng tôi cũng có các widget để giúp các nhà phát triển dễ dàng hơn, định nghĩa server.json cho MCP và thẻ tác nhân cho HWA bằng một biểu mẫu, sau đó xem trước tại đây thay vì bắt đầu từ JSON thực tế trên kho lưu trữ nếu đó là, giả sử, máy chủ đầu tiên của bạn.
Dòng dõi Đối tượng
Chúng tôi cũng có thể kiểm tra dòng dõi (lineage) vì ví dụ, bạn có thể vào trường hợp sử dụng, mở một trường hợp sử dụng mà bạn muốn kiểm tra, mở dòng dõi đối tượng (object lineage). Trong chế độ xem dòng dõi này, bạn có thể thấy rằng ví dụ, trường hợp sử dụng ở đây là tối ưu hóa vé bằng AI, được kết nối với một tác nhân, được kết nối với một tác nhân khác ở đây và cũng có các mô hình AI được kết nối với nó. Vì vậy, chúng ta có thể có dòng dõi đầy đủ của trường hợp sử dụng và cũng có thể, như MAUR đã nói trước đây, đảm bảo và thực hiện các sửa đổi trong trường hợp một số phần của dòng dõi bị ảnh hưởng bởi sự cố mất dịch vụ (outage) hoặc một vấn đề, và quay lại trường hợp sử dụng bị ảnh hưởng.
Chu trình Phát triển Cấp Doanh nghiệp
Chuyển sang chu trình phát triển cấp doanh nghiệp (enterprise development cycle), chúng ta đã nói nhiều về siêu dữ liệu (metadata) và các kho đăng ký (registries), nhưng làm thế nào để các nhà phát triển thực sự tạo ra máy chủ MCP và máy chủ giao thức tác nhân-tác nhân (agent to agent protocol) để triển khai chúng vào môi trường sản xuất (production).
Chúng tôi đã triển khai và phát triển hai kho lưu trữ (repository), một cho MCP và một cho giao thức tác nhân-tác nhân. Hai kho lưu trữ này là các kho lưu trữ mẫu (template repositories) trên GitHub, để sau đó các nhà phát triển và nhóm có thể bắt đầu từ đó và phát triển theo hướng môi trường sản xuất. Ý tưởng là hai bản thiết kế (blueprint) này thực sự cung cấp mã mẫu (boilerplate) và cả hạ tầng (infrastructure) cùng công cụ hỗ trợ (tooling) đã có sẵn. Ví dụ: tệp Docker (Docker files), trình quản lý gói (package manager), cả hai đều là FastAPI servers, vì vậy chúng được hiển thị theo cùng một cách và cả quá trình xác thực (authentication) và theo dõi chi phí (cost tracking) đều được xử lý bên trong bản thiết kế.
Khả năng Quan sát và Thiết kế Linh hoạt
Chúng tôi cũng có tích hợp với Infuse, một công cụ khả năng quan sát (observability tool) mà chúng tôi đã triển khai ở cấp độ nền tảng (platform level). Vì vậy, các nhóm phát triển cũng có thể theo dõi tác nhân của họ, chạy các đánh giá (evaluations) và kiểm tra cách tác nhân đang hoạt động.
Ngoài ra, bản thiết kế máy chủ HWA là không phụ thuộc (agnostic), vì vậy nó không dựa trên một khung làm việc (framework) cụ thể nào, như LangChain hoặc Agno hoặc bất kỳ khung làm việc nào khác, mà thực sự nó bao gồm các giao diện (interfaces) và cổng (ports) để mỗi nhóm có thể triển khai giải pháp riêng của họ trong khung làm việc mà họ lựa chọn. Điều quan trọng là họ cung cấp cùng giao diện mà chúng tôi đã lưu trong bản thiết kế để quá trình phát triển dễ dàng cho các nhà phát triển và họ có thể tập trung vào giá trị thực sự của tác nhân.
Tích hợp CI/CD và Triển khai
Mauro đã nói về CI/CD đang được áp dụng trong bản thiết kế HWA và cả bản thiết kế MCP. Ý tưởng là khi bạn đã sẵn sàng với quá trình phát triển của mình, bạn có thể gắn thẻ một nhánh nhất định và GitHub Action sẽ khởi động và không chỉ xuất bản ảnh Docker (Docker image) lên kho lưu trữ tạo phẩm (artifact repository) của chúng tôi, mà còn xuất bản siêu dữ liệu của tác nhân, cụ thể là thẻ tác nhân cho giao thức tác nhân-tác nhân và server.json cho MCP, lên, giả sử, proxy của danh mục (catalog) các kho đăng ký.
Trong hình ảnh này, chúng ta cũng có thể thấy rằng trong trường hợp một tác nhân AI cần gọi MCP hoặc proxy HWA, ý tưởng là họ có thể đi qua cổng API (API gateway) mà chúng tôi đã triển khai và hai proxy này, MCP và HWA, sẽ truy vấn danh mục thực tế của các tác nhân và MCP để lấy URL thực tế của phần phụ trợ (backend) mà tác nhân muốn gọi, sau đó các tác nhân sẽ tự xác thực bằng một tiêu đề (header) khác trên máy chủ thực tế.
Kết quả Kinh doanh và Tầm nhìn Tương lai
Để đưa nó trở lại góc nhìn kinh doanh, những gì chúng tôi đã đạt được với nền tảng Amplifier và kho đăng ký mà chúng tôi đã phát triển:
- Chúng tôi hiện có một danh mục để thực hiện quản trị (governance), vì vậy chúng tôi thấy
MCPvàmáy chủHWA mà chúng tôi triển khai trên toàn tổ chức và giữa nhiều nhóm. - Chúng tôi có khả năng truy vết (traceability) đầy đủ các
trường hợp sử dụng,tác nhân,công cụvà cảmô hìnhđược áp dụng trên cáctrường hợp sử dụng. - Sau đó, chúng tôi có các bản thiết kế sẵn sàng cho sản xuất (production ready-blueprints) để các nhà phát triển bắt đầu từ một cái gì đó tiêu chuẩn giữa các nhóm, nhưng sẵn sàng để xây dựng và tập trung vào logic nghiệp vụ (business logic) trong các
trường hợp sử dụng. - Sau đó, chúng tôi có các đường ống
CI/CD(CI/CD pipelines) và các liên kết để triển khai dịch vụ vào môi trường sản xuất, cũng nhưsiêu dữ liệuvào kho đăng ký.
Tất nhiên, công việc trên nền tảng này vẫn đang trong quá trình phát triển, vì vậy chúng tôi đang tiếp tục phát triển các khả năng. Vì vậy, đừng ngần ngại liên hệ với chúng tôi và giữ liên lạc nếu bạn có bất kỳ quan điểm tương tự nào hoặc điều gì đó khác mà bạn muốn thảo luận, chúng tôi rất hoan nghênh. Cảm ơn bạn, đừng ngần ngại liên hệ.
TL;DR
- Amplifun, một công ty toàn cầu với hoạt động phân tán, phải đối mặt với sự hỗn loạn khi các nhóm AI nội bộ phát triển
tác nhân AImột cách độc lập, dẫn đến trùng lặp công việc và thiếu quy chuẩn về bảo mật, cơ sở hạ tầng. - Để giải quyết vấn đề này, Amplifun đã khởi động chương trình Amplify, tập trung vào ba trụ cột chính: quản trị (
governance), nền tảng (platform), và khối sản xuất (factory), nhằm thiết lập các quy tắc và cơ sở hạ tầng tập trung cho việc triển khai AI. - Giải pháp kỹ thuật bao gồm một
cổng API AIthống nhất và bahệ thống đăng ký(choMCP,Tác nhân AIvàTrường hợp sử dụng), cùng với các bản thiết kế (blueprints) và tích hợp CI/CD, đảm bảo quản trị, khả năng mở rộng, kiểm soát chi phí vàdòng dõi thông tintoàn diện ở cấp doanh nghiệp.
Điểm chính
- Thiết lập Cổng API AI tập trung: Tạo một điểm truy cập hợp nhất cho tất cả các
mô hình AI, cung cấpxác thực, quản lý ngân sách (budgeting), vàcông cụ kiểm toán, giám sát và phân tíchtập trung để kiểm soát và theo dõi việc sử dụng AI. - Xây dựng Hệ thống Đăng ký toàn diện: Triển khai ba
hệ thống đăng kýchính –MCP,Tác nhân AI, vàTrường hợp sử dụng– để lập danh mục cáccông cụ AI,tác nhânđã triển khai và mối liên hệ của chúng với các trường hợp kinh doanh cụ thể, tạo ra một nguồn thông tin duy nhất. - Phân loại Siêu dữ liệu cấp Doanh nghiệp: Làm phong phú các mục đăng ký bằng
siêu dữ liệunhư quyền sở hữu,môi trườngchạy, mô hìnhxác thực, chi phí và liên kết trường hợp sử dụng để cho phép phân tích tác động,quản trịvàkhả năng kiểm toánđầy đủ. - Phát triển Chu trình với Bản thiết kế và Tự động hóa: Cung cấp các
kho lưu trữ mẫu(blueprints) cho nhà phát triển, bao gồmmã mẫu(boilerplate code),hạ tầng(FastAPI servers,Docker files) vàcông cụ hỗ trợđã cấu hình sẵn để tiêu chuẩn hóa quy trình phát triển và tự động xuất bảnsiêu dữ liệuthông quaCI/CD. - Đảm bảo
Dòng dõi Thông tin: Sử dụnghệ thống đăng ký trường hợp sử dụngvà chế độ xemdòng dõi đối tượng(object lineage) để ánh xạ cáctác nhânvàcông cụđược sử dụng trong mỗitrường hợp sử dụng, cung cấp khả năng hiển thị toàn diện về các mối quan hệ và tác động tiềm tàng. - Thiết kế
Tác nhân AIlinh hoạt: Xây dựngbản thiết kế tác nhân AIkhông phụ thuộc(agnostic) vàokhung làm việccụ thể (ví dụ:LangChain), chỉ tập trung vào cácgiao diệnvàcổngchuẩn hóa để các nhóm có thể sử dụngkhung làm việcyêu thích của họ. - Tích hợp
Khả năng Quan sát: Kết hợp cáccông cụ khả năng quan sátnhư Infuse vàonền tảngđể cho phép các nhóm phát triển theo dõi,đánh giá(evaluations) và kiểm tra hiệu suất của cáctác nhân AIcủa họ.
Từ vựng
AI agent— Tác nhân AIenterprise-grade— Cấp doanh nghiệpControl Tower— Tháp kiểm soátgovernance— Quản trịplatform— Nền tảngLLM model— Mô hình LLMAI API Gateway— Cổng API AIregistry system— Hệ thống đăng kýmetadata— Siêu dữ liệulineage of information / lineage functionality— Dòng dõi thông tin / Chức năng dòng dõiblueprint— Bản thiết kếobservability— Khả năng quan sátframework— Khung làm việc
Nội dung chi tiết
Giới thiệu và Vấn đề
Điều gì sẽ xảy ra khi bạn có các nhóm nội bộ làm việc trên ba lục địa, tất cả đều xây dựng các tác nhân AI, mỗi nhóm tự thiết lập các kết nối, tự phát minh mô hình bảo mật và tự triển khai cơ sở hạ tầng của riêng mình? Bạn sẽ nhận được 'cows' (ý nói sự hỗn loạn).
Xin chào, tôi là Sonny Merla, Giám đốc Khoa học Dữ liệu Toàn cầu và AI tại Amplifun. Hôm nay tôi ở đây cùng với Mauro Lucati, Giám đốc Trung tâm Xuất sắc về AI và Mathieu Rida, Kỹ sư AI tại Quantica, đội ngũ đã thiết kế và xây dựng giải pháp kỹ thuật mà chúng ta sắp mô tả. Hôm nay, chúng tôi sẽ trình bày cách Amplifun giải quyết vấn đề này bằng việc triển khai chương trình Amplify của riêng họ, và đặc biệt là cách chúng tôi thiết kế một hệ thống đăng ký cấp doanh nghiệp cho MCP và các tác nhân AI.
Giới thiệu về Amplifun
Amplifun là công ty hàng đầu thế giới về giải pháp thính giác. Chúng tôi hoạt động tại 26 quốc gia trên toàn cầu, với hơn 20.000 nhân viên và hơn 10.000 cửa hàng trên toàn thế giới. Chúng tôi đang trong quá trình chuyển đổi AI. Hiện tại, chúng tôi đang thử nghiệm các giải pháp và công nghệ AI, vì vậy chúng tôi đang đối mặt với những thách thức như xây dựng các giải pháp ổn định theo thời gian và tìm cách mở rộng chúng một cách có trách nhiệm, tuân thủ các hướng dẫn được định nghĩa tập trung.
Chương trình Amplify: Áp dụng AI theo quy mô
Vậy Amplifun đã quyết định áp dụng AI theo quy mô như thế nào? Chúng tôi đã ra mắt chương trình Amplify vào tháng 1 năm 2025. Đây là một chương trình toàn cầu và đa chức năng được thiết kế để đặt ra các quy tắc cho việc áp dụng AI, và về cơ bản, nó bao gồm một mô hình hoạt động và một kế hoạch thực thi.
Mô hình hoạt động và Các trọng tâm chính
Mô hình hoạt động dựa trên hai trụ cột chính: Control Tower (Tháp kiểm soát) và committee (Ủy ban). Control Tower là một nhóm nhỏ người, bao gồm cả các Giám đốc cấp cao, quyết định các hướng dẫn về bảo mật, pháp lý và công nghệ, cũng như các chiến lược, trọng tâm chiến lược và do đó là các trường hợp sử dụng cần phát triển đầu tiên. Sau đó là committee chịu trách nhiệm điều hành chiến lược ở các quốc gia cũng như ở cấp công ty. Committee cũng ưu tiên các trường hợp sử dụng một cách chi tiết hơn, và giải phóng giá trị cho tổ chức.
Các trọng tâm chính của chương trình Amplify là gì? Chúng tôi có ba trọng tâm: governance (quản trị), platform (nền tảng) và factory (khối sản xuất).
- Quản trị (
Governance): Chúng tôi muốn đảm bảo sự phù hợp với các quy địnhAI, cũng như chiến lược và các hướng dẫn mà chúng tôi đã định nghĩa tập trung. Đây cũng là vấn đề giúp mọi người nhận thức được sự tồn tại của chương trình, các quy tắc trò chơi, và sau đó thông báo cho mọi người về cách chúng tôi cung cấp và triển khai giá trị. - Nền tảng (
Platform): Chúng tôi phải thiết lập cơ sở hạ tầng mà trên đó các nhà phát triển và nhóm triển khai hoạt động. Điều này bao gồm chứng nhận cơ sở hạ tầng và cách thức làm việc để cung cấp quy trình và dịch vụ cho ứng dụngAI. - Khối Sản xuất (
Factory): Đây là phần thực tế nhất của câu chuyện. Chúng tôi có các nhóm phát triển cần tập trung vào việc triển khai các giải pháp ra thị trường, đồng thời quan tâm đến việc triển khai trên các quốc gia, điều này rất quan trọng đối với Amplifun. Vì vậy, cần suy nghĩ về giải pháp như có khả năng mở rộng (scalable) và có thể tái sử dụng (reusable) trên các lĩnh vực khác nhau.
Thách thức khi triển khai AI diện rộng
Vậy, những vấn đề chính mà chúng tôi nhận thấy khi một tổ chức cố gắng triển khai AI theo quy mô một cách rộng rãi là gì? Chắc chắn chúng tôi dự đoán các vấn đề về bảo trì và vận hành, các vấn đề về quản trị và tuân thủ, nhưng cũng có cả các vấn đề về mở rộng quy mô doanh nghiệp. Vậy, các nhà phát triển cần phát triển như thế nào để đảm bảo các giải pháp ổn định theo thời gian?
Bắt đầu từ khía cạnh bảo trì và vận hành, ngay cả với vòng đời ngắn của các mô hình LLM là cốt lõi của ứng dụng AI và các tác nhân AI mà chúng tôi phát triển và triển khai, chúng tôi muốn đảm bảo rằng chúng tôi có thể giải quyết việc sử dụng loại LLM này trên các trường hợp sử dụng mà chúng tôi triển khai. Vì vậy, chúng tôi muốn sẵn sàng và chuẩn bị hành động kịp thời mỗi khi chúng tôi thấy sự gián đoạn trong mô hình mà chúng tôi sử dụng cho trường hợp sử dụng đó.
Mặt khác, với góc nhìn về quản trị và tuân thủ, chúng tôi cần đảm bảo biết được chúng tôi sử dụng AI ở đâu trong tổ chức, đâu là các trường hợp sử dụng chính, cả từ góc độ quy định lẫn việc sử dụng trong toàn tổ chức. Vì vậy, chúng tôi muốn có một danh mục, một cách để hiểu các tài sản được sử dụng bởi từng trường hợp sử dụng, những gì chúng đã triển khai, những gì chúng đã sử dụng để tạo ra một loại dòng dõi thông tin (lineage of the information).
Mặt khác, còn có một điểm liên quan đến cách chúng tôi phát triển giải pháp AI trong tổ chức qua nhiều nhóm hoạt động trên các cơ sở hạ tầng khác nhau. Vì vậy, chúng tôi muốn việc phát triển, ít nhất về mặt quản trị, phải được tập trung hóa, với các hướng dẫn rõ ràng, có thể tái sử dụng trên các cơ sở hạ tầng và nhóm khác nhau. Đây là mục tiêu: chúng tôi muốn làm cho cuộc sống của các nhà phát triển dễ dàng hơn để họ tập trung vào logic nghiệp vụ bên trong các trường hợp sử dụng, tránh việc phải "tái tạo lại bánh xe" mỗi khi cần quan tâm đến bảo mật, cũng như việc triển khai và bảo trì các trường hợp sử dụng.
Bây giờ, tôi xin mời Mauro giới thiệu cách chúng tôi giải quyết các chủ đề này tại Amplifun.
Cổng API AI (AI Gateway)
Cảm ơn Sony, và hãy cùng xem xét vấn đề này từ góc độ kỹ thuật hơn. Thành phần đầu tiên mà chúng tôi xây dựng để giải quyết những vấn đề đó là cổng API AI. Trước hết, nó mang lại cho chúng tôi một quyền truy cập hợp nhất, vì vậy tất cả các nhà phát triển muốn sử dụng một mô hình đều có thể sử dụng cổng API này và họ có thể trỏ đến điểm cuối hợp nhất và sử dụng tất cả các mô hình mà Amplifun có trong danh mục của mình.
Sau đó là khía cạnh bảo mật. Nếu bạn muốn sử dụng mô hình, bạn phải kết nối với cổng API, bạn phải xác thực bản thân, và chúng tôi đã thực hiện điều này với tích hợp nội bộ. Tiếp theo là khía cạnh ngân sách. Bởi vì Amplifun có rất nhiều trường hợp sử dụng, và nếu một trường hợp sử dụng yêu cầu ngân sách để sử dụng các mô hình đó, bạn có thể đặt ngân sách hàng tháng trong cổng API AI này, hoặc bạn có thể đặt theo tháng, tuần, v.v. Trong khi các nhà phát triển đang sử dụng ngân sách đó, nó sẽ bị giảm dần và cổng API có thể thông báo cho các nhà phát triển về phần ngân sách còn lại, để họ có thể kiểm soát nó. Cuối cùng là khía cạnh kiểm soát. Tất cả các yêu cầu được thực hiện thông qua mô hình LLM hoặc phản hồi, tất cả các phân tích mà chúng tôi cần triển khai trên tất cả các yêu cầu đều được thực hiện bằng cách sử dụng các công cụ kiểm toán, giám sát và phân tích tập trung, rõ ràng là được kết nối với cổng API AI này.
Tổng quan về Các hệ thống đăng ký
Đối với phần quản trị, đây là điểm vào, tôi có thể nói là lớp trên cùng. Và sau đó, chúng tôi có ba hệ thống đăng ký khác nhau.
- Đầu tiên là hệ thống đăng ký
MCP. Như bạn hình dung, tất cả cáccông cụ, tất cả cáctích hợpvới hệ thống Amplifun, tất cả các chức năng mà chúng tôi muốn cung cấp cho cácmô hình LLMđều được hiển thị thông quahệ thống đăng ký MCPnày, đây là danh mục trung tâm của tất cả cáccông cụcó sẵn. - Sau đó là hệ thống đăng ký
Tác nhân AI. Nó cung cấp một danh mục đầy đủ cáctác nhânđã được triển khai hoàn chỉnh và có sẵn. Nó sử dụng chuẩnthẻ tác nhân(agent card), hiển thịthẻ tác nhân, và cũng có thể cung cấp cho nhà phát triển khả năng kết nối với cáctác nhânđã được phát triển. - Và cuối cùng là hệ thống đăng ký trường hợp sử dụng (
use case registry), là hệ thống đăng ký kết nối tất cả các thông tin đó lại với nhau, tất cả cácsiêu dữ liệuđó lại với nhau, và mang lại chức năng quản trị thực sự, chức năngdòng dõi thông tin(lineage functionality), và một lần nữa, kết nối tất cả các khía cạnh đó lại với nhau.
Hãy cùng đi vào chi tiết hơn về từng hệ thống đăng ký này.
Hệ thống đăng ký MCP
Tôi không muốn giải thích MCP là gì cho bất kỳ ai tại hội nghị này, nhưng chúng tôi đã bắt đầu từ hệ thống đăng ký MCP chính thức, được duy trì bởi cộng đồng. Đây là danh mục công khai, rộng khắp cộng đồng về tất cả các máy chủ MCP có sẵn. Và chúng tôi về cơ bản đã xây dựng dựa trên đó. Amplifun đã xây dựng hệ thống đăng ký MCP riêng tư của mình như một tiện ích mở rộng về các chức năng, và cũng như trong ngữ cảnh doanh nghiệp mà chúng tôi muốn thêm vào mỗi máy chủ được đăng ký.
Nó chứa hai thứ chính, như bạn có thể hình dung: các máy chủ nội bộ tùy chỉnh mà nhóm Amplifun nội bộ đã xây dựng cho các tích hợp cụ thể, các công cụ cụ thể mà Amplifun muốn cung cấp; và một tập hợp máy chủ công cộng đã được tuyển chọn, đã được phê duyệt, đã được chứng nhận cho các trường hợp sử dụng của Amplifun. Cả hai loại máy chủ này mà chúng tôi muốn đăng ký vào danh mục này đều được làm phong phú với một số siêu dữ liệu doanh nghiệp bổ sung.
Hãy xem những siêu dữ liệu đó là gì:
- Quyền sở hữu (
ownership): Mỗimáy chủcó một chủ sở hữu, đó là nhóm nào, trường hợp sử dụng nào, dự án nào chịu trách nhiệm chomáy chủcụ thể đó. Môi trường(environment):Môi trườngmàmáy chủđang chạy (ví dụ:dev,test,prod, v.v.).- Mô hình
xác thực(authentication models): Cách tôi, với tư cách là một nhà phát triển, có thể sử dụngmáy chủđó; các cơ chế tôi cần triển khai. - Chi phí đóng góp (
cost contributions): Điều này được liên kết với chức năngcổng API AI, khía cạnh ngân sách mà chúng tôi đã mô tả trước đây, và được thực hiện để xemmáy chủnào đang chi tiêu bao nhiêu. - Liên kết trường hợp sử dụng (
use case linkage): Các trường hợp sử dụng nào thực sự đang sử dụngmáy chủcụ thể đó.
Và đây không chỉ đơn thuần là siêu dữ liệu "có thì tốt". Đây là điều thực sự mang lại chức năng phân tích tác động. Đây là nơi chúng tôi thực sự kích hoạt quản trị và khả năng kiểm toán (auditability), và chúng tôi có một dấu vết hoàn chỉnh về những công cụ AI nào tồn tại và chúng đang được các nhà phát triển AMP sử dụng như thế nào.
Hệ thống đăng ký Tác nhân AI
Tiếp theo là hệ thống đăng ký thứ hai, đó là hệ thống đăng ký Tác nhân AI. Nó hoàn toàn dựa trên thẻ tác nhân (agent card) mô tả định danh của tác nhân, điểm cuối, năng lực tác nhân (agent capabilities), các phương thức được hỗ trợ, yêu cầu xác thực, v.v. Chúng tôi đã xây dựng một số bản thiết kế (blueprints), và chúng tôi sẽ nói về những bản thiết kế đó. Nhưng về cơ bản, khi một tác nhân được triển khai, nó sẽ tự động công bố thẻ tác nhân của mình lên hệ thống đăng ký thông qua tích hợp CI-CD. Bằng cách này, bất kỳ tác nhân nào khác, bất kỳ nhà phát triển nào khác đều có thể khám phá tác nhân mới này, và rõ ràng có thể tương tác với nó. Vì vậy, theo một cách nào đó, chúng tôi đang cố gắng làm cho tất cả các hoạt động phát triển tác nhân đó trở nên tự tài liệu hóa.
Hệ thống đăng ký Trường hợp sử dụng
Bây giờ chúng ta sẽ xem hệ thống đăng ký trường hợp sử dụng kết nối hai hệ thống đăng ký kia lại với nhau như thế nào. Làm thế nào chúng ta có thể sử dụng hệ thống đăng ký MCP và hệ thống đăng ký Tác nhân AI từ góc độ kinh doanh? Chúng tôi muốn có một hệ thống đăng ký trường hợp sử dụng để ánh xạ các tác nhân và công cụ trong các trường hợp sử dụng cụ thể được áp dụng trong toàn tổ chức. Và đây là lý do tại sao chúng tôi thiết kế khối xây dựng cụ thể này, nhằm mục đích chứa thông tin về các tài sản được sử dụng bởi từng trường hợp sử dụng, những gì chúng triển khai, những phương thức chúng sử dụng cho cả chủ đề bảo trì mà chúng tôi đã đề cập trước đó, và cũng để hiểu cách thức và nơi chúng tôi phát triển và triển khai các loại trường hợp sử dụng này. Ví dụ, hệ thống nào phục vụ trường hợp sử dụng cụ thể đó, và tất cả các đối tượng khác bị ảnh hưởng bởi các trường hợp sử dụng này là gì. Vì vậy, ví dụ, nếu chúng ta có kết nối giữa nhiều trường hợp sử dụng, chúng ta muốn thấy điều đó rõ ràng trong một giao diện có thể là một danh mục cho mọi người.
Trải nghiệm nền tảng
Bây giờ hãy xem nó hoạt động trong thực tế như thế nào. Hãy cùng xem qua nền tảng đã được phát triển và triển khai tất cả các hệ thống đăng ký này cho tổ chức.
Được rồi, chúng tôi cũng muốn cung cấp cho bạn một cái nhìn tổng quan ngắn gọn về nền tảng của chúng tôi. Ở đây bạn có thể thấy trang chủ. Bạn có thể vào phần danh mục. Vậy, những gì chúng tôi đã mô tả chi tiết trước đây, đó là MCP, HWA (ý nói AI agent), và các trường hợp sử dụng. Chúng tôi cũng có phần cổng API AI (AI gateway) nơi chúng tôi định nghĩa những thành phần nào có sẵn trong doanh nghiệp hiện tại. Tôi sẽ quay lại trang tổng quan (dashboard). Nếu chúng ta chuyển sang danh mục, đây là nền tảng mà chúng ta sẽ sớm triển khai vào môi trường sản xuất. Ở đây chúng ta có dữ liệu demo. Chúng tôi có sáu thực thể được định nghĩa. Cho đến thời điểm này, chúng tôi có các trường hợp sử dụng, MCP, và tác nhân HWA (ý nói AI agent). Khi đi vào phần các trường hợp sử dụng, nếu chúng ta mở một trường hợp sử dụng mẫu, ví dụ, chúng ta có thể định nghĩa trạng thái, phiên bản, mô tả, các tài sản được sử dụng. Ví dụ, một tác nhân và một máy chủ MCP, các mô hình AI mà nó đang sử dụng, và lịch sử vòng đời của trường hợp sử dụng. Nếu chúng ta vào trang tạo trường hợp sử dụng, bạn có thể thấy rằng chúng ta có thể định nghĩa tên, mô tả, trạng thái của trường hợp sử dụng, quyền sở hữu, và cả các tài sản được liên kết với nó.
Công cụ AI và Tác nhân HWA
Nếu chúng ta chuyển sang phần AI tools, cụ thể là MCP servers, bạn có thể thấy chúng tôi có hai MCP servers mẫu. server JSON thực tế được mô tả ở đây. Chúng ta cũng có thể xem xét các tác nhân HWA, tương tự như các thẻ tác nhân. Ví dụ, ở đây chúng ta có thể định nghĩa long chain test agent, các capabilities và mô tả từ thẻ tác nhân. Chúng tôi cũng định nghĩa trang kiểm tra (inspector page) nơi bạn có thể chọn một máy chủ MCP và khởi chạy trình kiểm tra trong một tab khác. Vì vậy, bạn cũng có thể kết nối và kiểm tra những gì MCP đó đang cung cấp cho bạn. Chúng tôi cũng có cùng trình kiểm tra đó chỉ kiểm tra tính tương thích với thẻ tác nhân HWA. Và bạn có thể làm điều tương tự ở đây.
Chúng tôi cũng có các widget để giúp các nhà phát triển dễ dàng hơn, định nghĩa server.json cho MCP và thẻ tác nhân cho HWA bằng một biểu mẫu, sau đó xem trước tại đây thay vì bắt đầu từ JSON thực tế trên kho lưu trữ nếu đó là, giả sử, máy chủ đầu tiên của bạn.
Dòng dõi Đối tượng
Chúng tôi cũng có thể kiểm tra dòng dõi (lineage) vì ví dụ, bạn có thể vào trường hợp sử dụng, mở một trường hợp sử dụng mà bạn muốn kiểm tra, mở dòng dõi đối tượng (object lineage). Trong chế độ xem dòng dõi này, bạn có thể thấy rằng ví dụ, trường hợp sử dụng ở đây là tối ưu hóa vé bằng AI, được kết nối với một tác nhân, được kết nối với một tác nhân khác ở đây và cũng có các mô hình AI được kết nối với nó. Vì vậy, chúng ta có thể có dòng dõi đầy đủ của trường hợp sử dụng và cũng có thể, như MAUR đã nói trước đây, đảm bảo và thực hiện các sửa đổi trong trường hợp một số phần của dòng dõi bị ảnh hưởng bởi sự cố mất dịch vụ (outage) hoặc một vấn đề, và quay lại trường hợp sử dụng bị ảnh hưởng.
Chu trình Phát triển Cấp Doanh nghiệp
Chuyển sang chu trình phát triển cấp doanh nghiệp (enterprise development cycle), chúng ta đã nói nhiều về siêu dữ liệu (metadata) và các kho đăng ký (registries), nhưng làm thế nào để các nhà phát triển thực sự tạo ra máy chủ MCP và máy chủ giao thức tác nhân-tác nhân (agent to agent protocol) để triển khai chúng vào môi trường sản xuất (production).
Chúng tôi đã triển khai và phát triển hai kho lưu trữ (repository), một cho MCP và một cho giao thức tác nhân-tác nhân. Hai kho lưu trữ này là các kho lưu trữ mẫu (template repositories) trên GitHub, để sau đó các nhà phát triển và nhóm có thể bắt đầu từ đó và phát triển theo hướng môi trường sản xuất. Ý tưởng là hai bản thiết kế (blueprint) này thực sự cung cấp mã mẫu (boilerplate) và cả hạ tầng (infrastructure) cùng công cụ hỗ trợ (tooling) đã có sẵn. Ví dụ: tệp Docker (Docker files), trình quản lý gói (package manager), cả hai đều là FastAPI servers, vì vậy chúng được hiển thị theo cùng một cách và cả quá trình xác thực (authentication) và theo dõi chi phí (cost tracking) đều được xử lý bên trong bản thiết kế.
Khả năng Quan sát và Thiết kế Linh hoạt
Chúng tôi cũng có tích hợp với Infuse, một công cụ khả năng quan sát (observability tool) mà chúng tôi đã triển khai ở cấp độ nền tảng (platform level). Vì vậy, các nhóm phát triển cũng có thể theo dõi tác nhân của họ, chạy các đánh giá (evaluations) và kiểm tra cách tác nhân đang hoạt động.
Ngoài ra, bản thiết kế máy chủ HWA là không phụ thuộc (agnostic), vì vậy nó không dựa trên một khung làm việc (framework) cụ thể nào, như LangChain hoặc Agno hoặc bất kỳ khung làm việc nào khác, mà thực sự nó bao gồm các giao diện (interfaces) và cổng (ports) để mỗi nhóm có thể triển khai giải pháp riêng của họ trong khung làm việc mà họ lựa chọn. Điều quan trọng là họ cung cấp cùng giao diện mà chúng tôi đã lưu trong bản thiết kế để quá trình phát triển dễ dàng cho các nhà phát triển và họ có thể tập trung vào giá trị thực sự của tác nhân.
Tích hợp CI/CD và Triển khai
Mauro đã nói về CI/CD đang được áp dụng trong bản thiết kế HWA và cả bản thiết kế MCP. Ý tưởng là khi bạn đã sẵn sàng với quá trình phát triển của mình, bạn có thể gắn thẻ một nhánh nhất định và GitHub Action sẽ khởi động và không chỉ xuất bản ảnh Docker (Docker image) lên kho lưu trữ tạo phẩm (artifact repository) của chúng tôi, mà còn xuất bản siêu dữ liệu của tác nhân, cụ thể là thẻ tác nhân cho giao thức tác nhân-tác nhân và server.json cho MCP, lên, giả sử, proxy của danh mục (catalog) các kho đăng ký.
Trong hình ảnh này, chúng ta cũng có thể thấy rằng trong trường hợp một tác nhân AI cần gọi MCP hoặc proxy HWA, ý tưởng là họ có thể đi qua cổng API (API gateway) mà chúng tôi đã triển khai và hai proxy này, MCP và HWA, sẽ truy vấn danh mục thực tế của các tác nhân và MCP để lấy URL thực tế của phần phụ trợ (backend) mà tác nhân muốn gọi, sau đó các tác nhân sẽ tự xác thực bằng một tiêu đề (header) khác trên máy chủ thực tế.
Kết quả Kinh doanh và Tầm nhìn Tương lai
Để đưa nó trở lại góc nhìn kinh doanh, những gì chúng tôi đã đạt được với nền tảng Amplifier và kho đăng ký mà chúng tôi đã phát triển:
- Chúng tôi hiện có một danh mục để thực hiện quản trị (governance), vì vậy chúng tôi thấy
MCPvàmáy chủHWA mà chúng tôi triển khai trên toàn tổ chức và giữa nhiều nhóm. - Chúng tôi có khả năng truy vết (traceability) đầy đủ các
trường hợp sử dụng,tác nhân,công cụvà cảmô hìnhđược áp dụng trên cáctrường hợp sử dụng. - Sau đó, chúng tôi có các bản thiết kế sẵn sàng cho sản xuất (production ready-blueprints) để các nhà phát triển bắt đầu từ một cái gì đó tiêu chuẩn giữa các nhóm, nhưng sẵn sàng để xây dựng và tập trung vào logic nghiệp vụ (business logic) trong các
trường hợp sử dụng. - Sau đó, chúng tôi có các đường ống
CI/CD(CI/CD pipelines) và các liên kết để triển khai dịch vụ vào môi trường sản xuất, cũng nhưsiêu dữ liệuvào kho đăng ký.
Tất nhiên, công việc trên nền tảng này vẫn đang trong quá trình phát triển, vì vậy chúng tôi đang tiếp tục phát triển các khả năng. Vì vậy, đừng ngần ngại liên hệ với chúng tôi và giữ liên lạc nếu bạn có bất kỳ quan điểm tương tự nào hoặc điều gì đó khác mà bạn muốn thảo luận, chúng tôi rất hoan nghênh. Cảm ơn bạn, đừng ngần ngại liên hệ.