Bỏ qua đến nội dung chính

Building AI-native: Inside the stacks powering Cognition, Gamma, and Harvey

TL;DR

  • Các công ty AI tiên phong như Harvey, Cognition và Gamma đặt cược vào sự phát triển nhanh chóng của khả năng mô hình, tác nhân tự chủ và tự động hóa truyền thông trực quan để định hình sản phẩm của họ trong các ngành dọc khác nhau.
  • Sự tiến bộ cấp số mũ của AI đòi hỏi các công ty phải liên tục tái cấu trúc, sẵn sàng từ bỏ các kiến trúc cũ và thích nghi với các điểm uốn công nghệ mới nổi để duy trì tính cạnh tranh.
  • Thành công trong môi trường này phụ thuộc vào kế hoạch linh hoạt, tập trung vào khả năng observabilityinternal tooling để hiểu hành vi hệ thống, và ưu tiên chất lượng cùng khả năng lý luận hơn tốc độ tạo nội dung.

Điểm chính

  • Dự đoán và Thích ứng với Tiến bộ Mô hình: Các công ty cần mạnh dạn đặt cược vào sự cải thiện nhanh chóng của khả năng mô hình AI, bao gồm khả năng suy luận, chỉnh sửa mã và tự động hóa quy trình làm việc, vì chúng có thể biến những điều "không thể" thành "có thể".
  • Đầu tư vào Tác nhân Tự chủ và Điều phối Đa Tác nhân: Tập trung xây dựng các tác nhân có khả năng tự chủ, tự giải quyết vấn đề (như viết mã, kiểm thử, khắc phục sự cố), và phát triển hạ tầng để điều phối nhiều tác nhân cho các tác vụ phức tạp, phân cấp.
  • Tái cấu trúc Liên tục là Bắt buộc: Chấp nhận rằng kiến trúc sản phẩm AI sẽ cần được tái cấu trúc định kỳ (thường là sau mỗi 6-12 tháng) do sự phát triển nhanh chóng của các mô hình nền tảng và công cụ; sẵn sàng loại bỏ và xây dựng lại.
  • Ưu tiên Observability và Internal Tooling: Xây dựng hệ thống logging mạnh mẽ, khả năng quan sát (observability) và công cụ nội bộ (internal tooling) để hiểu rõ quyết định của tác nhân, dễ dàng kiểm thử và đánh giá các mô hình mới, và hỗ trợ việc tái cấu trúc nhanh chóng.
  • Kế hoạch Linh hoạt với Phản hồi Nhanh: Duy trì kế hoạch dài hạn (ví dụ, theo quý) nhưng tích hợp các buổi retrospective hàng tuần để nhanh chóng điều chỉnh ưu tiên và hướng đi sản phẩm dựa trên các thay đổi của công nghệ AI.
  • Khai thác LLM Tool Calling và Agent Orchestration: Tận dụng các tính năng như gọi công cụ LLM để mở rộng chức năng sản phẩm và điều phối tác nhân để tạo ra các trải nghiệm người dùng khác biệt và phức tạp hơn.
  • Sử dụng Multi-Context Presence (MCP) cho Phát triển và Thu hút Khách hàng: Tích hợp sản phẩm dưới dạng tác nhân hoặc trình kết nối vào các nền tảng và công cụ B2B mà người dùng đã sử dụng để mở rộng phân phối, thu hút khách hàng mới và loại bỏ gián đoạn quy trình làm việc.
  • Chuyển từ Tốc độ sang Chất lượng và Khả năng Lý luận: Khi AI phát triển, kỳ vọng của người dùng tăng lên; ưu tiên khả năng tự phê bình, huấn luyện người dùng, phản hồi, lý luậnnghiên cứu của AI thay vì chỉ tạo nội dung nhanh chóng.

Từ vựng

  • startup — công ty khởi nghiệp
  • AI model — mô hình AI
  • generative AI platform — nền tảng AI tạo sinh
  • autonomous agent — tác nhân tự chủ
  • exponential growth — tăng trưởng theo cấp số mũ
  • inflection point — điểm uốn
  • LLM tool calling — gọi công cụ LLM
  • agent orchestration — điều phối tác nhân
  • observability — khả năng quan sát hệ thống
  • Multi-Context Presence (MCP) — Sự hiện diện đa ngữ cảnh

Nội dung chi tiết

Giới Thiệu và Các Quyết Định Kiến Trúc AI Tiên Phong

và quan hệ đối tác đầu tư mạo hiểm của Anthropic, Beth Robertson. Xin chào mọi người, tôi là Beth Robertson, tôi dẫn dắt đội ngũ startup tại Anthropic, và tôi rất vui mừng khi có tất cả các bạn ở đây cùng chúng tôi hôm nay. Mọi người trong căn phòng này đều đang đối mặt với những câu hỏi kiến trúc tương tự khi xây dựng các công ty AI tiên phong. Và ba người ở đây, bên cạnh tôi, chắc chắn không còn xa lạ gì với những vấn đề đó. Vì vậy, hôm nay tôi rất vui được cùng các bạn tìm hiểu về những quyết định mà họ đã đưa ra và một số thách thức mà họ phải vượt qua khi xây dựng ở ranh giới tiên phong này. Trước khi bắt đầu, tôi xin mời từng người giới thiệu. Bạn là ai? Xin vui lòng giới thiệu bản thân. Công việc hàng ngày của bạn là gì? Doanh nghiệp của bạn làm gì? Và đâu là một quyết định cốt lõi mà bạn đã đưa ra khi thành lập công ty? Quyết định cốt lõi, được chứ?

Harvey: Đặt Cược vào Khả Năng Phát Triển của Mô hình AI

Trước hết, xin cảm ơn Beth và Anthropic đã tổ chức một sự kiện tuyệt vời như vậy. Tôi là Nico Gruppen, tôi phụ trách mảng nghiên cứu ứng dụng tại Harvey. Harveynền tảng AI tạo sinh dành cho các dịch vụ pháp lý và chuyên nghiệp. Và, vâng, tôi nghĩ rằng Harvey, và tôi dám khẳng định điều này đúng với hầu hết các công ty lớp ứng dụng, thực sự là một quyết định lớn rằng khả năng của mô hình sẽ cải thiện cực kỳ nhanh chóng, và những khả năng đó sẽ khái quát hóa tốt cho ngành dọc pháp lý. Phải không? Nhiều người không biết điều này. Khi tôi gia nhập Harvey, chúng tôi đang sống và làm việc từ một Airbnb. Gabe và Winston đã sử dụng những gì mà tôi nghĩ bây giờ chúng ta sẽ gọi là các mô hình nhỏ để về cơ bản trả lời các câu hỏi pháp lý cá nhân trên Reddit. Đúng vậy. Và vì vậy, chính làn sóng tăng trưởng theo cấp số mũ này ở lớp mô hình đã cho phép chúng tôi nâng cao tham vọng của mình với tư cách là một công ty. Thật tuyệt vời.

Cognition: Đặt Cược vào Tác nhân Tự Chủ và Bùng Nổ Sử Dụng Claude Agent

Vâng. Một lần nữa, cảm ơn vì đã mời tôi. Tôi là Walden, một trong những người đồng sáng lập của Cognition. Chúng tôi xây dựng các sản phẩm viết mã như DevinWindsorf. Và tôi nghĩ rằng quyết định cốt lõi khi nói đến Devin thực sự là đặt cược vào các tác nhân tự chủ. Điều này diễn ra ngay cả trước khi chúng tôi có các tác nhân để bắt đầu. Vì vậy, theo nhiều cách, sản phẩm của chúng tôi không hoạt động khi chúng tôi mới nghĩ ra nó. Nhưng tầm nhìn về việc có một thứ không chỉ viết mã cho bạn, mà còn có máy tính riêng, chạy mã, sau đó mở màn hình desktop, kiểm thử, cho bạn biết khi nào nó không hoạt động, và khắc phục vấn đề của nó, cuối cùng đưa ra một PR hoạt động hoàn chỉnh. Điều đó gần như không thể với các mô hình chúng tôi có cách đây hai năm. Nhưng rất nhiều thứ đã thay đổi và cải thiện dần dần kể từ đó. Tôi nghĩ khoảng thời gian này năm ngoái, bạn đã thấy rất nhiều mô hình tác nhân gốc, như Sonya 3536, ra đời. Điều đó đã giúp ích rất nhiều. Khả năng kiểm thử sử dụng máy tính đang trở nên phổ biến hơn ngày nay. Và tôi nghĩ đặc biệt với các mô hình gần đây mà chúng ta đang thấy, có một khả năng tự chủ tầm nhìn dài hạn lớn đang trở nên gần như khả thi, nơi bạn có thể cho nó chạy liên tục trong nhiều giờ. Và bạn bắt đầu cảm thấy nút thắt cổ chai do cố gắng chạy quá nhiều tác nhân cục bộ. Và vì vậy, chúng tôi thấy một sự bùng nổ trong việc sử dụng tác nhân trên đám mây trong năm nay. Tôi nghĩ một thống kê điên rồ mà chúng tôi đã thấy là kết quả của các khả năng mới là vào tuần tốt nhất của năm 2025, lượng sử dụng tác nhân đã tăng gấp năm đến bảy X ở khách hàng của chúng tôi chỉ riêng trong năm 2026. Vì vậy, có vẻ như đây sẽ là một năm lớn cho các tác nhân trên đám mây. Và các khả năng chỉ sẽ tiếp tục phát triển từ đây. Thật tuyệt vời.

Gamma: Chuyển Đổi Truyền Thông Trực Quan bằng AI

Chúng ta sẽ quay lại với những quyết định hiện tại của bạn trong ít phút nữa. Nhưng bây giờ, xin mời Dini. Rất vui được có mặt ở đây. Đặc biệt là rất vui được ở đây cùng tất cả các bạn. Chúng tôi là những người dùng lớn của Devin, ClaudeGamma. Và Nico, chúng ta sẽ phải tìm cách để có thêm nhiều người dùng Harvey. Tôi sẽ đưa bạn đến với Harvey. Tôi sẽ đưa bạn đến. Xin chào mọi người, tôi là Dini Fatiha, Trưởng phòng sản phẩm AI tại Gamma. Gamma là một nền tảng truyền thông trực quan dành cho các chuyên gia. Chúng tôi có 70 triệu người dùng và đang tiếp tục tăng trưởng. Gamma bắt đầu với một quan sát đơn giản rằng những người như chúng ta, khi truyền đạt những ý tưởng quan trọng nhất, thường làm điều đó thông qua một tài liệu trực quan: các bài thuyết trình cho nhà đầu tư, đề xuất cho khách hàng, trang web tiếp thị, bài đăng trên mạng xã hội để lan tỏa ý tưởng của mình. Và chúng ta làm gì khi phải truyền đạt những ý tưởng đó? Chúng ta dành khoảng 10% thời gian để tư duy về ý tưởng cốt lõi và 90% thời gian còn lại cho thiết kế, định dạng và chăm chút chi tiết. Quyết định lớn của Gamma là với AI, chúng tôi có thể loại bỏ 90% công việc chăm chút chi tiết mà mọi người dành thời gian cho nó. Bạn, với tư cách là một chuyên gia, hãy mang đến ý tưởng cốt lõi mà chỉ bạn mới có khả năng đưa ra. Gamma sẽ tiếp nhận, phát triển ý tưởng, cấu trúc câu chuyện, thiết kế và làm cho nó trở nên đẹp mắt nhất để ý tưởng của bạn có thể được truyền tải một cách tốt nhất có thể. Vâng, và đó là một trải nghiệm tuyệt vời. Tôi cảm ơn tất cả các bạn vì những gì các bạn đã xây dựng. Chúng tôi rất thích nó.

Các Điểm Uốn và Sự Phát Triển Sản Phẩm của Gamma

Tôi muốn quay trở lại câu chuyện khởi nguồn trước khi chúng ta nói về hiện tại. Có lẽ đã có một khoảng thời gian mà bạn chỉ có một ý tưởng và cuối cùng nó đã trở thành hiện thực. Hãy nói cho tôi biết điều gì đã xảy ra trong hệ sinh thái, điều gì đã thay đổi khiến sản phẩm hoặc dịch vụ của bạn lần đầu tiên có thể tồn tại. Có một khoảnh khắc nào đó không? Khoảnh khắc đó là gì? Tôi rất vui được bắt đầu. Thành thật mà nói, tôi nghĩ rằng đã có một khoảnh khắc đầu tiên, nhưng tôi nghĩ với mỗi làn sóng lớn trong tiến trình AI, Gamma đã có những thuận lợi giúp sản phẩm của chúng tôi phát triển. Gamma bắt đầu vào năm 2020 trước khi làn sóng AI gần đây thực sự bùng nổ. Khi các mô hình hình ảnh bắt đầu ra đời và trở nên tốt hơn, và khi điều chỉnh hướng dẫn LLM bắt đầu thay đổi cách chúng ta tương tác với các LLM và những gì chúng ta có thể đạt được từ chúng, đó là lúc Gamma thực sự có một khoảnh khắc aha. Đó là điểm uốn đã khai sinh Gamma như chúng ta biết ngày nay. Theo thời gian, một lần nữa, như tôi đã nói, những tiến bộ của AI đã làm thay đổi cách chúng tôi nhìn nhận và xây dựng sản phẩm của mình. Điều lớn tiếp theo mà tôi nghĩ chúng tôi đã làm là khi gọi công cụ LLM bắt đầu trở nên rất tốt, chúng tôi đã nhanh chóng nắm bắt. Chúng tôi đã xây dựng những trải nghiệm tác nhân đầu tiên của mình. Cho đến ngày nay, việc chỉnh sửa bằng tác nhân của chúng tôi là một trong những điểm khác biệt lớn nhất, và điều đó xảy ra nhờ làn sóng lớn trong gọi công cụ LLMđiều phối tác nhân. Một điều lớn đối với chúng tôi nữa là làn sóng MCP. Một lần nữa, chúng tôi đã sớm nắm bắt và đẩy mạnh nó. Nó cho phép chúng tôi xây dựng các trình kết nối vào một số nền tảng khác. Thực ra, tôi nghĩ chúng tôi đã xây dựng trình kết nối đầu tiên của mình vào Claude. Và nó thực sự đã thay đổi cách chúng tôi tư duy về phân phối, không chỉ sản phẩm của chúng tôi, mà cả GTM của chúng tôi, bởi vì đột nhiên, điều đó cho phép chúng tôi có Gamma như một tác nhân trong các giao diện và công cụ khác mà người dùng mục tiêu của chúng tôi yêu thích và đã sử dụng. Và vì vậy, những gì chúng tôi bắt đầu thấy là không chỉ những người dùng hiện có của chúng tôi giờ đây có thể sử dụng Gamma thường xuyên hơn bởi vì họ không phải phá vỡ quy trình làm việc của mình và đi đến Gamma để tiếp tục công việc. Họ chỉ đang làm điều đó trong Claude. Và chỉ cần nhấn nút như, vâng, làm ơn tạo một bài thuyết trình từ điều này. Không chỉ vậy, mà còn đối với người dùng mới. Đó là một kênh thu hút khách hàng khổng lồ đối với chúng tôi. Người dùng bắt đầu khám phá chúng tôi thông qua các nền tảng như Claude bởi vì đó là nơi họ đã làm việc và sinh hoạt. Vì vậy, đó là một loại tiến hóa khác đã xảy ra nhờ MCP. Và thành thật mà nói, chúng tôi đã đang suy nghĩ về sự tiến hóa tiếp theo của sản phẩm của mình ngay bây giờ với việc truyền thông được tác nhân trung gian. Chúng tôi đang tự hỏi Gamma sẽ trông như thế nào trong lần tiến hóa tiếp theo này? Và đó sẽ là điều mà tôi nghĩ, chúng tôi đã dành thời gian cho năm nay. Vậy kênh thu hút khách hàng MCP có phải là cách chính mà bạn đang có được khách hàng ngày nay không? Xin lỗi. Kênh thu hút khách hàng MCP có phải là động lực tăng trưởng theo sản phẩm chính của bạn ngày nay không? Ồ, đó là một kênh lớn. Tôi không biết liệu nó có phải là chính không. Và chúng tôi cũng có, vì MCP, chúng tôi có các trình kết nối không chỉ trong Claude, mà còn trong một số công cụ B2B khác. Vì vậy, nó đang trở thành một kênh thu hút khách hàng thực sự tốt. Vâng. Thật hấp dẫn.

Các Điểm Uốn và Sự Phát Triển Sản Phẩm của Cognition

Còn bạn thì sao, Walden, đối với Cognition? Vâng. Một trong những điều bạn học được khi xây dựng các tác nhân bắt đầu vào khoảng năm 2024, là bạn xây dựng rất nhiều thứ rồi lại xóa bỏ. Một trong những ví dụ hài hước nhất về điều này là các mô hình trước đây không biết cách chỉnh sửa mã. Chúng chỉ có thể xuất ra toàn bộ tệp mã mới. Và vì vậy, bạn phải dùng đến các biện pháp rất sáng tạo để khiến những thứ này chỉnh sửa mã. Và nếu bạn tìm hiểu, thực ra đó là một kỹ thuật rất thú vị mà các công ty như Cognition đã nghiên cứu để thực hiện điều này. Giống như sự kết hợp giữa giải mã suy đoánkỹ thuật suy luận. Nhưng mọi thứ đã thay đổi khi các mô hình thực sự được huấn luyện RL (Học tăng cường) để có thể chỉnh sửa mã, lấy mã một cách tự nhiên. Và đó là một bước nhảy vọt lớn đối với chúng tôi. Tôi nghĩ một điều khác mà mọi người đánh giá thấp là cách các mô hình này sử dụng hệ thống tệp một cách tự nhiên ngày nay. Trước đây, chúng tôi có một hệ thống lập kế hoạch tùy chỉnh hoàn chỉnh, khả năng tạo ra các quỹ đạo tầm nhìn dài hạn và tuân thủ các bước một cách rõ ràng. Và bây giờ bạn có thể chỉ cần bảo tác nhân viết kế hoạch của bạn xuống và làm theo. Và nó sẽ biết cách xem hệ thống tệp, tìm ra mọi thứ. Tương tự với bộ nhớ, tôi nghĩ có lẽ rất nhiều bạn trong khán giả đang nghĩ về cách tạo bộ nhớ cho các tác nhân của mình và đã xây dựng rất nhiều hệ thống tùy chỉnh trước đây. Bây giờ bạn có thể sử dụng hệ thống tệp của mình một cách sâu sắc hơn nhiều. Mọi người đang chuyển từ RAG sang hệ thống tệp. Vì vậy, tôi nghĩ đó có lẽ là một điều khá khả thi mà chúng tôi đã tìm thấy là cách bạn nên xây dựng các mô hìnhtác nhân của mình bây giờ khi khả năng của chúng được cải thiện theo hướng đó. Và điều đó đã mở khóa rất nhiều công việc tầm nhìn dài hạn mà bạn có thể làm với Devin. Bạn sẽ có được điều đó. Vậy, công việc tác nhân tự chủ, phải không? Vâng.

Các Điểm Uốn và Sự Phát Triển Sản Phẩm của Harvey

Bây giờ, xin mời Nico. Chắc chắn rồi. Không, thực ra tôi rất thích cụm từ Walden đã sử dụng trong phần giới thiệu, đó là khả năng của mô hình biến những điều không thể thành có thể. Đối với Harvey, tôi nghĩ thực sự có ba điểm uốn. Đầu tiên là sự xuất hiện của các mô hình nền tảng, quy mô dẫn đến các khả năng suy luận mới nổi đã đưa chúng tôi từ thế giới Hỏi & Đáp pháp lý trên Reddit đến việc giải quyết các công việc pháp lý lớn. Thứ hai, tất nhiên, các mô hình suy luận vào khoảng cuối năm 2024, đầu năm 2025. Đó là lúc chúng tôi bắt đầu làm việc về cái mà tôi gọi là tự động hóa quy trình làm việc. Vì vậy, với đủ nỗ lực, đủ các lượt gọi mô hình được xác định trước, bước truy xuất, bước tìm kiếm, bạn thực sự có thể giải quyết bất kỳ nhiệm vụ cá nhân nào. Và sau đó vào mùa đông vừa qua, tôi nghĩ Opus 4.5 thực sự là mũi nhọn ở đây với các tác nhân viết mã. Bạn chỉ cần giao phó việc lập kế hoạch và điều phối cho các mô hình này. Và tôi nghĩ phần tuyệt vời nhất đối với chúng tôi tại Harvey không chỉ là những gì xảy ra ở cấp độ tác nhân cá nhân, mà còn ở phối hợp đa tác nhân. Vì vậy, công việc trong các công ty luật có tính phân cấp rất cao. Bạn có một đối tác đang làm việc với Dario hoặc Tổng cố vấn pháp lý của bạn trong một dự án kéo dài hàng tháng. Họ sẽ phân rã dự án đó thành một số nhiệm vụ mà họ giao cho các luật sư cấp cao. Họ sẽ hoàn thành các nhiệm vụ đó trong vài tuần. Chúng tôi sẽ chia nhỏ chúng thành các nhiệm vụ mà họ có thể giao cho các luật sư cấp dưới để hoàn thành trong vài ngày. Và bây giờ với các mô hình như Opus 4.7 và ngày càng tăng cường cơ sở hạ tầng để điều phối tác nhân như CMA, tôi không biết liệu Jess và Tim có mặt trong khán phòng ngay bây giờ không, nhưng chúng tôi cũng đã làm việc với họ để triển khai cơ sở hạ tầng quản lý tác nhân này. Bạn có thể mô hình các hệ thống tác nhân theo cùng một kiểu phân cấp, điều này mở khóa tiềm năng lớn cho công việc của chúng tôi. Vì vậy, bạn có thể thuê ngoài một loạt các nhiệm vụ. Vâng, chính xác. Thật tuyệt vời. Cảm ơn vì đã chia sẻ những quyết định ban đầu. Tôi nghĩ bây giờ, nhìn lại những quyết định mà bạn đã đưa ra, dù tốt hay xấu, tôi nghĩ tất cả chúng ta trong quá khứ có lẽ đã thay đổi một số điều. Điều này sẽ là gì đối với những quyết định ban đầu của bạn và bạn đã học được bài học khó khăn nào để điều đó trở thành sự thật đối với bạn ngày nay? Như một lời cảnh báo, bất kỳ ai đang thiết lập điều này.

Tái Cấu Trúc Liên Tục

Tôi rất vui khi bắt đầu ở đây vì tôi vừa nhắc đến ba điểm uốn này. Điều tôi chưa đề cập là với mỗi điểm uốn đó, chúng tôi đều phải tái cấu trúc hoàn toàn rất nhiều thứ. Đúng vậy. Và vì vậy, tôi nghĩ bài học khó khăn rút ra ở đây là bạn không thể đưa ra các quyết định tại một thời điểm rồi cứ bám víu vào chúng. Bạn gần như phải, thậm chí đây là một quy tắc mới trong kỹ thuật, nơi bạn muốn làm một thứ một lần rồi mở rộng nó. Bạn phải có khả năng dự đoán sự tiến bộ phía trước và trong nhiều trường hợp, là sự tăng trưởng theo cấp số mũ. Và tôi nghĩ ví dụ về coding agent là một ví dụ tuyệt vời: sáu tháng trước, nếu bạn hỏi tôi kiến trúc của chúng tôi trông như thế nào, nó khác biệt về cơ bản so với hiện tại. Và nếu chúng tôi không sẵn lòng nói rằng, "Chúng ta cần loại bỏ cái này và chuyển sang agent native," thì chúng tôi sẽ không có những khả năng này trên nền tảng của mình.

Kế Hoạch Linh Hoạt và Tái Kiến Trúc

Thế giới đang thay đổi nhanh chóng. Vậy khung thời gian lập kế hoạch của bạn có bị rút ngắn không? Là theo tháng hay theo tuần? Bạn nghĩ thế nào về điều đó? Chúng tôi vẫn lập kế hoạch theo quý, nhưng chúng tôi đã tích hợp vào quy trình thực hiện hàng tuần, giống như các buổi retrospective. Tôi sẽ nói, "Này, chúng ta có cần loại bỏ hoàn toàn ưu tiên này và ưu tiên cái kia thay thế không?" Đúng vậy. Bạn cần có khả năng làm điều đó hàng tuần. Vâng, tôi hoàn toàn đồng ý. Đó là cách sống khi xây dựng một AI hiện nay: bạn phải chấp nhận rằng thứ bạn xây dựng hôm nay rất có thể sẽ bị loại bỏ trong sáu tháng đến một năm, đặc biệt nếu bạn theo kịp thời đại và làm mọi thứ đúng cách. Và vì vậy, tôi không hối tiếc về bất kỳ điều gì chúng tôi đã làm trước đây và phải loại bỏ chúng. Tôi nghĩ phần quan trọng thực sự cần đầu tư, và lẽ ra chúng tôi nên đầu tư nhiều hơn, nếu có, là xây dựng mọi thứ bạn cần để đảm bảo bạn có thể liên tục thay đổi sản phẩm của mình khi chất lượng của mô hình thay đổi.

Quan Sát và Công Cụ Nội Bộ

Và điều đó thực sự trông giống như việc có logging cơ bản, khả năng observability (quan sát được hệ thống), khả năng để các kỹ sư của bạn có thể đi sâu vào bất kỳ quyết định nào mà tác nhân của bạn đưa ra. Chúng tôi sẽ bật phát lại, tìm ra liệu các mô hình mới có đưa ra quyết định tốt hơn không, có các e-val (đánh giá) cho những điều đó. Bạn càng dễ dàng trả lời những câu hỏi này về hệ thống của mình và lý do tại sao có gì đó sai sót, bạn càng dễ dàng nói, "Được rồi, khả năng của mô hình mới có nghĩa là chúng ta phải làm điều này khác đi bây giờ. Chúng ta phải tái cấu trúc nó." Và tôi đã thấy rất nhiều công ty kiểu như xây dựng trong bóng tối; họ thêm một lời nhắc (prompt) và họ nghĩ, "Ồ, hy vọng điều này sẽ làm mọi thứ tốt hơn." Nhưng bạn thực sự không biết. Và vì vậy, nếu bạn muốn làm việc một cách đáng tin cậy với các bản nâng cấp mô hình mới, các mô hình khác nhau, thì observabilitycông cụ nội bộ (internal tooling) của bạn là cực kỳ, cực kỳ quan trọng. Hiểu rồi, vậy là observability, đừng gắn bó với bất cứ điều gì quá lâu vì mọi thứ đều thay đổi.

Ưu Tiên Chất Lượng Hơn Tốc Độ

Còn bạn thì sao? Tôi nghĩ, nhắc lại nhiều điều mà Nico và Walden đã nói, chúng tôi hiện đang trải qua giai đoạn này khi chúng tôi tái cấu trúc và tái phối hợp toàn bộ kiến trúc tạo nội dung (generation architecture) của mình. Lý do là nếu quay ngược thời gian, khi chúng tôi lần đầu tiên xây dựng hệ thống tạo nội dung (generation system) trong Gamma, đột phá chính là tốc độ, phải không? Bạn đến Gamma, bạn nhập một lời nhắc, chọn một số cài đặt, nhấn tạo (generate), và bạn chuyển từ một trang trống thành một bản trình bày được thiết kế đẹp mắt chỉ trong một phút. Và tôi nhớ lần đầu tiên trải nghiệm điều đó với tư cách là người dùng Gamma và tôi nghĩ nó thật đáng kinh ngạc. Đó chính là đột phá, phải không? Khi AI, bạn biết đấy, một lần nữa, lý do làn sóng AI xuất hiện, tôi cảm thấy tốc độ là thứ mà mọi người đều bị mê hoặc. Nhưng mọi thứ đã thay đổi và phát triển. Không chỉ AI trở nên thông minh hơn rất nhiều về khả năng tự phê bình (self-critique), huấn luyện (coach) người dùng, phản hồi (push back), lý luận (reason) và nghiên cứu (research) và nhiều thứ khác nữa, mà kỳ vọng của người dùng cũng đã phát triển phù hợp với điều đó. Vì vậy, ngày nay, với quy trình làm việc (workflow) hiện tại, rất nhiều lần người dùng sẵn sàng chờ đợi thay vì có khoảnh khắc "Wow, nhanh thật!" họ muốn có khoảnh khắc "Wow, nó thực sự làm được!" Và họ sẵn lòng chờ đợi khoảnh khắc đó. Và vì vậy, bây giờ chúng tôi đang suy nghĩ lại, chúng tôi đang tái cấu trúc hệ thống của mình để có thể: a) tận dụng những khả năng (capabilities) mới nhất của AI, đổi lấy tốc độ trong một số trường hợp. Bởi vì điểm tinh tế ở đây không phải là tốc độ so với chất lượng, mà là luôn luôn tốc độ chất lượng. Vì tôi vừa kể cho bạn nghe về việc mọi người sẵn sàng chờ đợi lâu hơn để tạo nội dung. Chúng tôi nhận thấy khi họ đang chỉnh sửa và thực hiện các điều chỉnh, họ muốn sự nhạy bén (snappy), phản hồi nhanh (responsive), nhanh chóng, đôi khi phải trả chi phí bằng chất lượng. Vì vậy, đó là một trong những hệ thống mà chúng tôi đang lùi lại một bước và tìm hiểu: làm thế nào để chúng tôi xây dựng một hệ thống mà không phải là tốc độ so với chất lượng? Đây đều là những tham số (parameters) mà chúng tôi có thể điều chỉnh (dial up and down) và thường thì, tùy thuộc vào quy trình làm việc, chúng tôi sẽ trao quyền lựa chọn đó cho người dùng. Để họ có thể quyết định hôm nay họ muốn gì và có bao nhiêu thời gian.

Trao Quyền Lựa Chọn Tốc Độ/Chất Lượng Cho Người Dùng

Vì vậy, thiết kế một hệ thống có thể mở rộng (extensible) trên các tham số đó và linh hoạt là bài tập đang diễn ra một lần nữa. Và bạn có đang sử dụng các mô hình khác nhau để bao quát toàn bộ lĩnh vực này không? Hoàn toàn. Chúng tôi luôn sử dụng các mô hình khác nhau, nhưng tôi nghĩ chúng tôi gần như đang tối ưu hóa chúng cho một kết quả nhất định. Và điều chúng tôi đang cố gắng làm là, chúng tôi có cả một lớp mô hình mà chúng tôi đang điều phối (orchestrating), nhưng sau đó bây giờ chúng tôi cũng đang cố gắng trao quyền cho người dùng để họ quyết định, "Bạn biết đấy, hôm nay tôi cần nó nhanh. Tôi không có thời gian. Tôi có khách hàng đang ở trong xe ô tô muốn tôi làm một bản trình bày. Tôi đang trên đường đến gặp khách hàng của mình." Vậy đó là lúc bạn cần tốc độ so với chất lượng. Và chúng tôi muốn trao quyền đó cho người dùng để họ tự quyết định.

Đặt Cược Lớn vào Codebase Tự Lái và Nhà Máy Phần Mềm

Thật hấp dẫn. Tôi thích điều đó. Bạn đã đưa chúng ta đến chủ đề mà tôi dự định chuyển sang tiếp theo, đó là: đặt cược lớn nào mà bạn đang thực hiện hôm nay? Điều bạn đang đặt cược trong ba tháng tới. Chúng ta sẽ có một tầm nhìn thời gian ngắn hơn. Hoặc chúng ta có thể xoay chuyển. Đó là một đặt cược lớn mà bạn đang thực hiện hôm nay mà các nhà sáng lập trong phòng này nên chú ý. Tôi cũng rất vui được trả lời câu hỏi phụ đó. Không, tôi rất hào hứng với năm tới. Có vẻ như các Claude agents đang trở nên rất khả thi trong vài tháng qua. Và tôi nghĩ điều mà mọi người đều có nhu cầu rất cao, dù bạn gọi đó là code base tự lái (self-driving code bases) hay nhà máy phần mềm (software factory), chỉ đơn giản là làm thế nào bạn có thể lấy mọi thứ bạn làm với tư cách là một tổ chức phần mềm (software org) và tự động hóa (automate) càng nhiều càng tốt. Và sau đó, bất cứ điều gì cần con người đánh giá (review), xem xét, hãy để AI đưa lên cho con người. Bạn đang chuyển từ một thế giới mà mặc định con người là người cầm lái (driving wheel) và AI có thể tiếp quản, sang một thế giới mà AI là người điều khiển (driving) các dự án từ đầu đến cuối (end-to-end), thực hiện lập kế hoạch, viết mã, đánh giá (reviewing), và kiểm thử (testing), và tìm ra khi nào thực sự cần nhờ con người can thiệp. Và khi bạn thực hiện sự thay đổi này, đó là điều hoàn toàn điên rồ. Và nó làm tăng đáng kể lượng công việc bạn có thể làm với tư cách là một tổ chức phần mềm. Vì vậy, tôi đã nói với những người tôi gặp hôm nay, như Cognition là một công ty, nơi có khoảng 50 kỹ sư hiện tại. Nhưng mỗi kỹ sư có khoảng 10 Devins mà họ đang sử dụng để làm mọi thứ họ cần làm. Và vai trò của kỹ sư phần mềm (software engineer) phải thay đổi khi code base của bạn trở thành tự lái (self-driving) và bạn có một code base tự duy trì (self-maintaining code base). Có rất nhiều công ty lớn trên thế giới phải thực hiện sự thay đổi này trong ba năm tới. Và rất nhiều điều chúng tôi đang làm là hợp tác với họ để giúp họ tìm ra cách tái cấu trúc cách bạn tư duy về viết mã, bạn tư duy về quản lý dự án để đạt được điểm này. Nhưng có rất nhiều tự động hóa (automations) và cài đặt (setups) thực sự tuyệt vời mà bạn có thể làm để thực sự đưa bạn đến biên giới (frontier) này. Đó là những gì chúng tôi đang nghe từ tất cả khách hàng của mình và đó là những gì chúng tôi đang xây dựng hiện nay.

Từ Trí Tuệ Phản Ứng đến Chủ Động: Nâng Cao Năng Suất Tổ Chức

Vâng, tôi hoàn toàn đồng ý với sự chuyển đổi từ trí tuệ phản ứng (reactive intelligence) sang trí tuệ chủ động (proactive intelligence). Điều tôi tư duy về điều này thực ra là quay trở lại với điều ít hơn và ít hơn. Tôi thấy bạn là một phần của điều này. Đó là: tăng năng suất cá nhân (individual productivity gains) từ AI được phân phối rộng rãi không đồng nghĩa với tăng năng suất tổ chức (organizational productivity gain), phải không? Và đây gần như chính xác là điều Walden vừa mô tả: bản chất vai trò của bạn thay đổi. Nếu bạn di chuyển nhanh gấp 10 lần, điều đó có nghĩa là bạn cũng có thể đi sai hướng nhanh gấp 10 lần hoặc mắc lỗi nhanh gấp 10 lần hoặc phạm vi ảnh hưởng (blast radius) lớn hơn gấp 10 lần. Vậy làm thế nào để bạn thực sự chuyển lên một tầng trừu tượng (abstraction) cao hơn trong quá trình ra quyết định (decision-making process)? Tương đương trong kỹ thuật ở đây sẽ là: liệu kiến trúc này có mở rộng (scalable) được không, có bảo mật không, v.v. Tôi nghĩ chúng ta sẽ thấy điều đó được đưa vào các công việc tri thức (knowledge work) tổng quát hơn. Và sau đó, tôi nghĩ phần mà tôi thực sự hào hứng khi Harvey tham gia vào là hợp tác (collaboration). Giao diện (interface) cho điều đó thậm chí sẽ trông như thế nào? Phải không? Nếu bạn muốn cho phép các luật sư hợp tác trong công ty của họ, bạn muốn cho phép các luật sư hợp tác với khách hàng của họ bên ngoài công ty. Và sau đó, bạn muốn con người có thể hợp tác với các tác nhân trong cùng một không gian làm việc (workspace). Tôi nghĩ đó là một vấn đề thực sự thú vị từ mọi khía cạnh: sản phẩm, AI, cơ sở hạ tầng (infrastructure). Và tôi nghĩ nó sẽ là một phần lớn trong phần còn lại của năm nay và sang năm tới.

Ưu Tiên Hạ Tầng, Tường Đạo Đức và Bộ Nhớ AI

Và biết rằng, như tôi biết bạn đang lập kế hoạch trước ba tháng, bạn đang tư duy thế nào về điều đó cho Harvey? Và điều nổi bật với tôi là năng suất cá nhân so với năng suất tổ chức. Vâng. Vì vậy, đây thực sự là nơi mà tôi biết xu hướng, đặc biệt trên Twitter, là chỉ dựa vào công nghệ tiên tiến (bleeding edge) ở biên giới (frontier) của trí tuệ mô hình (model intelligence) và cố gắng kéo và đẩy nó. Đây thực sự là nơi chúng tôi đang lùi lại một bước và tập trung vào cơ sở hạ tầng trước tiên (infrastructure first). Để đưa ra một ví dụ, nếu bạn có các tác nhân chạy xung quanh trong các không gian làm việc (workspaces) này, có một số loại ràng buộc dữ liệu (data constraints) mà các công ty luật (law firms) có. Đây là dữ liệu cực kỳ nhạy cảm (extremely sensitive data), phải không? Dữ liệu khách hàng. Một điều chúng tôi gặp khá thường xuyên là cái gọi là tường đạo đức (ethical walls). Vậy hãy tưởng tượng Walden và tôi là cộng sự (associates) tại cùng một công ty luật. Bạn có thể đại diện cho Pepsi với tư cách là một khách hàng. Tôi có thể đại diện cho Coca-Cola. Sau đó, chúng tôi được phân công cùng một dự án. Làm thế nào để bạn đảm bảo không có sự lây nhiễm dữ liệu (data contamination), phải không? Của loại thông tin khách hàng rất nhạy cảm này. Đó có thể không phải là điều bạn muốn ngay lập tức chuyển giao (offload) cho một tác nhân để quản lý. Bạn muốn có những ranh giới dữ liệu cứng (hard data boundaries) ở đó. Tương tự với việc chuyển đổi giữa nguồn dữ liệu công khairiêng tư (public and private data sources). Vì vậy, đó là trọng tâm (emphasis) ngay lập tức. Và sau đó tôi nghĩ bạn sẽ lùi lại từ đó vào các khái niệm AI thực sự thú vị như bộ nhớ (memory). Đó là điều. Thật đáng kinh ngạc.

Phạm Vi Thiết Kế Trực Quan và Tác Nhân Toàn Cầu

Bạn có suy nghĩ gì về những đặt cược tương lai sẽ diễn ra tiếp theo không? Ý tôi là, từ những gì Nico đã nói, vâng, tôi nghĩ có khoảng hai loại đặt cược/điều mà các nhà sáng lập nên lưu ý, đó là những điều cực kỳ quan trọng đối với tôi. Và nó cũng lặp lại một số điều đã được nói. Chà, điều đầu tiên hơi khác một chút, đó là tôi nghĩ năm nay chúng tôi thực sự muốn... Ý tôi là, chúng tôi luôn coi "gu thẩm mỹ" (taste) là từ thông dụng mới ở Thung lũng Silicon. Và bạn biết không? Tại Gamma, chúng tôi đã vật lộn với vấn đề gu thẩm mỹ trong nhiều năm. Và vì vậy, chúng tôi sẽ tiếp tục đi theo con đường đó. Chúng tôi thực sự tư duy về cách tăng phạm vi trực quan (visual range) của những gì bạn có thể làm về mặt thiết kế (design) trong Gamma. Chúng tôi đã luôn làm điều đó. Chúng tôi sẽ đẩy mạnh (double down) nó nhiều hơn nữa. Và đó sẽ là điều cực kỳ quan trọng (critical) đối với chúng tôi trong vài tháng tới. Nhưng cũng có điều mà cả Nico và tôi đã đề cập trước đó, đó là chúng ta đang ngày càng sống trong một thế giới mà các tác nhân có mặt ở khắp mọi nơi. Và chúng đang giúp đỡ chúng ta và điều hòa (mediating) thế giới của chúng ta. Và chúng tôi đang tư duy rất sâu sắc về điều này.

Tương Lai Sản Phẩm trong Thế Giới Agent Trung Gian

"Gamma" sẽ trông như thế nào trong một thế giới mà giao tiếp được tác nhân trung gian? Khi các tác nhân có thể sử dụng sản phẩm của bạn giống như con người, làm thế nào để bạn khiến sản phẩm của mình vừa hấp dẫn, vừa hữu ích cho cả con người, tác nhân và sự phối hợp giữa người và tác nhân? Đây thực sự sẽ là một lĩnh vực lớn mà chúng tôi tập trung và dành nhiều thời gian trong năm nay. Tôi nghĩ đây là điều mà ít người đã suy nghĩ đủ sâu: sản phẩm của bạn sẽ trông như thế nào? Liệu sản phẩm của bạn có thể tồn tại ở hình thức hiện tại trong một thế giới hoàn toàn được tác nhân trung gian không? Tôi nghĩ đó là điều mà mọi người đang suy nghĩ. Có rất nhiều điều để cân nhắc.

Vòng Hỏi Nhanh Đáp Gọn: AI trong Đời Sống Cá Nhân

Được rồi, tôi đang nhìn đồng hồ. Và chúng ta sẽ chuyển sang vòng hỏi nhanh đáp gọn. [Người nói hào hứng] Được rồi, một điều mà AI đã giải quyết trong cuộc sống cá nhân của bạn, mang lại bước đột phá lớn. Bắt đầu. (Tiếng nhạc nền, có lẽ là tiếng thúc giục) "Nói nhanh lên!" (Cười) "Được rồi, điều này hơi đáng xấu hổ một chút. Tôi đã giao toàn bộ việc lên kế hoạch bữa ăn hàng tuần và chế độ ăn uống hàng ngày cho Claude Code. Tôi không gặp bất kỳ vấn đề nào. Tôi có một bản ghi trên máy cục bộ của mình." "Và sao? Anh ăn ngon hơn bao giờ hết à?" "Ồ, đúng vậy. Tôi đã loại bỏ mọi hành vi nịnh bợ ra khỏi mô hình bằng Claude. Ồ, một bước đột phá lớn." "Được rồi, đó nhiều hơn năm từ rồi. Vâng, xin lỗi." "Lập kế hoạch du lịch. Mẹ tôi." "Tuyệt vời. Lập kế hoạch du lịch. Đó là gì? Lập kế hoạch du lịch? Vâng. Rất thích." "Tôi sẽ nói nhiều hơn năm từ. Vài tuần trước tôi đã tổ chức một buổi hòa nhạc tại nhà. Và Claude thực sự là người lập kế hoạch sự kiện cho buổi đó. Nó tìm giúp tôi nhà cung cấp dịch vụ ăn uống. Nó lo liệu trang trí. Nó tư vấn cho tôi về cách bố trí. Thật tuyệt vời. Các bạn thật tuyệt. Giống như du lịch, ẩm thực và hòa nhạc. Đó là nhà của bạn. Tôi yêu điều đó."

Dự Đoán AI trong 6-12 Tháng Tới

Được rồi, một dự đoán về AI trong 12 hoặc 6 tháng tới mà bạn dám đặt cược tiền vào. "Các công ty đang thực sự dựa vào rất nhiều công cụ AI. Như tôi đã nói, chúng ta đang sử dụng rất nhiều công cụ khác nhau, ngay cả trong cùng một lĩnh vực. Tôi nghĩ chi phí và sự phức tạp sẽ không cho phép các công ty duy trì nhiều công cụ AI riêng lẻ trong thời gian dài. Vì vậy, tôi nghĩ sẽ bắt đầu có sự hợp nhất công cụ AI trong 12 tháng tới." "Tôi nghĩ rằng sẽ có nhu cầu lớn hơn đối với các công việc kỹ thuật phần mềm trong một năm tới so với hiện tại, ngay cả khi chúng không được gọi là kỹ thuật phần mềm. Một loại vai trò kỹ thuật nào đó. Nhưng tôi nghĩ điều đó có thể là một quan điểm gây tranh cãi (hot take) ở Thung lũng Silicon ngày nay, nhưng tôi thực sự tin vào điều đó." "Tuyệt vời. Tôi thực sự không nghĩ đó là một quan điểm quá gây tranh cãi. Tôi nghĩ Định luật Javon là có thật trong tất cả các công việc tri thức. Và chúng ta sẽ thấy điều đó trong năm nay." "Tôi sẽ tiếp nối quan điểm của Walden trước đó. Tôi nghĩ trí tuệ chủ động và đặc biệt là trí tuệ môi trường (ambient intelligence) – nơi các tác nhân chỉ thực hiện mọi việc thay mặt bạn mà bạn thậm chí không hay biết – sẽ là một bước tiến lớn, đặc biệt là trong các sản phẩm tiêu dùng. Nghe có lý đấy."

Ưu Tiên Compute hay Evaluation?

Được rồi, tài nguyên tính toán nhiều hơn hay đánh giá tốt hơn? "Đánh giá tốt hơn." "Vâng, cả hai. Nhưng đánh giá tốt hơn trong thời gian ngắn." "Được rồi, tôi sẽ là người đưa ra bài học tốt hơn ở đây thay vì nói nhiều tài nguyên tính toán hơn. Và nhiều tài nguyên tính toán hơn sẽ giúp bạn xây dựng các đánh giá tốt hơn. Tuyệt vời."

Tác nhân Tổng Quát hay Chuyên Biệt?

Tổng quát, một tác nhân tổng quát, hay nhiều chuyên gia? "Tôi sẽ nói đây là một ngụy biện lưỡng phân (false dichotomy). Vâng. Vâng. Cảm ơn, Fish. Một tác nhân chuyên biệt chỉ là một tác nhân tổng quát rất tốt với các kỹ năng và công cụ phù hợp. Đây là một điều cốt lõi."

Lời Khuyên Dành Cho Các Nhà Sáng Lập

Được rồi, câu cuối cùng. Các nhà sáng lập trong phòng này, lời khuyên cuối cùng. Lần này chúng ta hãy đi theo hướng này. "Tôi nghĩ hãy phát hành nó trước khi nó sẵn sàng." "Ưu tiên thuê những người tài giỏi. Tuyệt vời." "Đó là một lời khuyên hay." "Tôi muốn nói, hãy tìm kiếm sự không thoải mái." "Tôi rất thích điều đó. Chà, cảm ơn tất cả các bạn đã có mặt ở đây. Chúng tôi rất biết ơn. Cảm ơn các bạn đã tham gia cùng chúng tôi. Chúng tôi biết ơn. Chúc các bạn khỏe. Cảm ơn."

Góp ý / Báo lỗiPhát hiện sai sót hoặc có ý tưởng cải thiện?