Bỏ qua đến nội dung chính

This is AGI: Sequoia AI Ascent 2026 Keynote

TL;DR

  • AI đại diện cho làn sóng công nghệ lớn nhất và nhanh nhất từ trước đến nay, là một "cuộc cách mạng về tính toán" thay vì truyền thông, với tiềm năng thị trường dịch vụ lên tới 10 nghìn tỷ USD trở lên.
  • Sự xuất hiện của các "tác nhân tầm nhìn dài" và khả năng lập luận nâng cao cho thấy AI đang tiến gần đến Trí tuệ nhân tạo tổng quát (AGI) hoặc ít nhất là các ứng dụng mang lại năng suất tăng 10-40 lần ("ô tô").
  • Để thành công trong kỷ nguyên AI này, các nhà xây dựng cần áp dụng chiến lược "MAD" (Moats, Affordance, Diffusion), tập trung vào khách hàng, thiết kế giao diện trực quan và khai thác khoảng cách khuếch tán giữa khả năng AI và sự chấp nhận của thị trường.

Điểm chính

  • AI là cuộc cách mạng về tính toán: Không giống các làn sóng công nghệ trước đây (Internet, Claude, mobile) tập trung vào phân phối thông tin (truyền thông), AI là về xử lý thông tin, thay đổi nền tảng công nghệ hàng ngày.
  • Tiềm năng thị trường dịch vụ khổng lồ: AI mở ra thị trường dịch vụ mới trị giá hàng nghìn tỷ đô la, vượt xa thị trường phần mềm truyền thống, do khả năng tự động hóa và nâng cao hiệu suất các ngành dọc.
  • "Ô tô" đã đến, không còn "ngựa nhanh hơn": AI không chỉ cải thiện năng suất 10-40% mà còn thay đổi hoàn toàn cách thức làm việc, bản chất công việc và cấu trúc tổ chức bằng cách tăng năng suất gấp 10-40 lần.
  • Chiến lược "MAD" cho nhà xây dựng:
    • Moats (Hào chắn): Tập trung vào khách hàng ("customer-back") để xây dựng mối quan hệ bền vững, vì khả năng công nghệ thay đổi nhanh hơn nhu cầu của khách hàng.
    • Affordance (Khả năng cung ứng): Thiết kế sản phẩm để dễ sử dụng, trực quan ("brain-dead simple"), giảm thiểu rào cản cho người dùng đạt được kết quả mong muốn.
    • Diffusion (Sự khuếch tán): Khai thác "khoảng cách khuếch tán" giữa tốc độ phát triển Mô hình nền tảng (Foundation Models) và tốc độ áp dụng của doanh nghiệp, tạo cơ hội cho các ứng dụng tầng trên.
  • Tác nhân AI (Agents) là trọng tâm hiện tại: Các hệ thống AI có khả năng nhận thức, lập kế hoạch, hành động và lặp lại để đạt mục tiêu đang trở thành hiện thực, được dân chủ hóa và ứng dụng rộng rãi.
  • Không có vị trí dẫn đầu nào an toàn: Tốc độ phát triển nhanh chóng của các khả năng AI từ các Mô hình nền tảng tạo ra một môi trường cạnh tranh khốc liệt, nơi "bất cứ ai cũng có thể chiến thắng" nếu thích nghi nhanh chóng.

Từ vựng

  • AI — Trí tuệ nhân tạo
  • Computation Revolution — Cách mạng về tính toán
  • Agent — Tác nhân (AI)
  • Moat — Hào chắn (trong kinh doanh, lợi thế cạnh tranh)
  • Affordance — Khả năng cung ứng (thiết kế, mức độ dễ sử dụng)
  • Diffusion Gap — Khoảng cách khuếch tán (giữa công nghệ và ứng dụng)
  • Customer-back approach — Phương pháp lấy khách hàng làm trọng tâm
  • Foundation Models — Mô hình nền tảng
  • Long Horizon Agents — Tác nhân tầm nhìn dài
  • 10-40x productivity — Năng suất gấp 10-40 lần

Nội dung chi tiết

Lời mở đầu và Tầm quan trọng của thời điểm hiện tại

Chào buổi sáng. Mọi người thế nào rồi? Được rồi. Được rồi. Tốt hơn một chút. Này, cảm ơn tất cả các bạn đã có mặt ở đây. Chúng tôi thực sự rất trân trọng điều đó. Chúng tôi làm điều này như một sự phục vụ cho cộng đồng bởi vì chúng ta đang sống trong những thời điểm quan trọng, và thật vinh dự cho chúng tôi khi có thể đóng vai trò là nơi tụ họp để mọi người cùng đến với nhau. Và đây là chương trình nghị sự tốt nhất mà chúng tôi từng tổng hợp, và cũng là tập hợp những người tham dự tốt nhất. Vì vậy, chúng tôi muốn bắt đầu bằng lời cảm ơn. Chúng tôi biết tất cả các bạn rất bận rộn. Cảm ơn các bạn đã có mặt ở đây hôm nay.

Vì vậy, chúng tôi có một chương trình nghị sự khá đặc biệt. Như thường lệ, Sonia với trang phục hoàn hảo, Constantine và tôi sẽ nói vài lời để bắt đầu. Chúng tôi có vinh dự được tham gia vào rất nhiều cuộc trò chuyện với nhiều người thú vị. Và vì vậy, mỗi năm một lần, chúng tôi muốn cố gắng tổng hợp một chút và chia sẻ lại với các bạn những gì chúng tôi đã nghe được. Và tôi sẽ nói vài lời về tổng thể điều chỉnh, sau đó Sonia sẽ nói một chút về những gì chúng ta thấy hôm nay, và sau đó Constantine sẽ nói một chút về những gì chúng tôi nghĩ có thể sẽ đến vào ngày mai.

Lịch sử và Các làn sóng công nghệ

Để điều chỉnh, chúng ta sẽ bắt đầu bằng cách nhìn rộng hơn, quay lại với các bóng bán dẫn (transistor) dựa trên silicon đã đặt tên cho lĩnh vực này. Chúng được xây dựng thành các hệ thống, kết nối bởi các mạng lưới đã công khai dưới dạng internet, hỗ trợ các ứng dụng như mạng xã hội trên Claude, và cuối cùng xuất hiện trong túi của chúng ta dưới dạng thiết bị di động mà ngày nay có khả năng làm những điều không thể phân biệt được với phép thuật, đó chính là AI. Lý do chúng tôi thích trình chiếu slide này – và những ai đã từng ở đây trước đây đều đã thấy nó rồi – là vì nó nhắc nhở chúng ta rằng tất cả các làn sóng này đều mang tính tích lũy. Và chúng ta đã cần tất cả những thập kỷ tiến hóa này để có được năng lực tính toán (compute), băng thông (bandwidth), dữ liệu và tài năng (talent) để tận dụng tối đa khoảnh khắc này.

AI: Làn sóng lớn nhất và nhanh nhất

Tuy nhiên, làn sóng AI này có ba điểm khác biệt. Thứ nhất, đây là làn sóng lớn nhất từ trước đến nay. Và điều đó nói chung là đúng. Nhưng có một điều cụ thể hơn về làn sóng này, đó là nó là làn sóng đầu tiên bao gồm cả phần mềmdịch vụ. Hàng trên cùng cho thấy 15 năm đầu tiên của quá trình chuyển đổi điện toán đám mây (Claude), nơi TAM (Tổng thị trường khả dụng) cho phần mềm tăng từ khoảng 350 tỷ USD lên 650 tỷ USD, và Claude chiếm khoảng 400 tỷ USD trong số đó. Hàng dưới cùng là điều hoàn toàn mới. Đây là doanh thu từ dịch vụ dường như cũng đã có sẵn. 10 nghìn tỷ USD là một con số tròn tiện lợi. Chúng ta không biết liệu đó là 10 nghìn tỷ, 5 nghìn tỷ hay 50 nghìn tỷ. Chúng ta biết rằng riêng dịch vụ pháp lý ở Hoa Kỳ đã là một thị trường 400 tỷ USD. Đó là một ngành dọc (vertical) và một khu vực địa lý (geo), và nó bằng với toàn bộ phần mềm. Vì vậy, cơ hội này là vô cùng lớn.

Điểm thứ hai, làn sóng nhanh nhất từ trước đến nay. Tôi nghĩ tất cả chúng ta đều có thể cảm nhận được điều này. Điều đó có nghĩa là khoảng trống trắng (white space) này – và tôi hướng sự chú ý của bạn đến phía AI của trang này – khoảng trống trắng này đang được lấp đầy khá nhanh chóng. Những logo này là các công ty đã đạt doanh thu hơn một tỷ USD nhờ những chuyển dịch kiến tạo (tectonic shifts) của Claude, di động, và giờ là AI. Và với tốc độ hiện tại, sẽ có nhiều công ty nữa sắp xuất hiện.

AI: Cuộc cách mạng về tính toán

Điểm thứ ba, có lẽ là điểm thú vị nhất, và tôi mượn ý này từ đối tác Constantine của mình, đó là có hai loại cách mạng cơ bản trong công nghệ. Có những cuộc cách mạng về truyền thông, liên quan đến cách thức thông tin được phân phối. Hầu hết những người trong căn phòng này chỉ từng trải qua các cuộc cách mạng về truyền thông. Internet, Claude, di động – tất cả đều liên quan đến phân phối thông tin. Đó là những cuộc cách mạng về truyền thông. AI thì khác. AI chính là cuộc cách mạng này. AI là một cuộc cách mạng về tính toán (computation). Nó liên quan đến cách thông tin được xử lý. Và điều đó có thể nghe như là ngữ nghĩa học, nhưng đây là những hình dạng làn sóng cơ bản khác nhau. Và có lẽ cách cảm nhận rõ rệt nhất là hãy nghĩ về việc nền tảng công nghệ luôn thay đổi dưới chân chúng ta. Nền tảng công nghệ (technology foundation) mà mọi người xây dựng trên đó thay đổi hàng ngày khi các khả năng (capabilities) mới xuất hiện.

Các điểm uốn chính và AGI

Chúng ta đã có ba điểm uốn (inflection points) lớn trong vài năm qua. Thứ nhất: thời khắc ChatGPT (ChatGPT moment) vào tháng 11 năm 2022, thế giới đã thấy sức mạnh của huấn luyện trước (pre-training). Thứ hai: vài năm sau, lập luận mô hình 01 (01 model reasoning), đột nhiên một quy luật mở rộng (scaling law) thứ hai xuất hiện xung quanh tính toán thời gian suy luận (inference time compute). Thứ ba: mới đây, Claude Code, Opus 45, giờ là Opus 47. Thế giới đã thấy sức mạnh của các tác nhân tầm nhìn dài (long horizon agents). Và mặc dù những điều này trông giống như ba điểm trên một chuỗi liên tục, nhưng thực tế có một sự đứt gãy rõ rệt giữa điểm thứ hai và thứ ba. Đó là một sự thay đổi hơi không liên tục (discontinuous change). Và nếu chúng tôi dám mạnh dạn, chúng tôi sẽ nói rằng đây là AGI (Trí tuệ nhân tạo tổng quát).

Và nhìn này, tôi là một chuyên ngành kinh tế. Chúng tôi là các nhà đầu tư mạo hiểm (venture capitalists). Chúng tôi sẽ không đưa ra một định nghĩa kỹ thuật (technical definition) cho AGI, được chứ? Chúng tôi nghiên cứu các nhà sáng lập và thị trường cũng như sự va chạm giữa chúng, đó là các doanh nghiệp, nhưng chúng tôi nghiên cứu các doanh nghiệp. Và vì vậy, từ quan điểm thương mại (commercial standpoint), từ quan điểm thực tiễn (practical standpoint), từ quan điểm chức năng (functional standpoint), nếu bạn có thể điều động một tác nhân (agent) để làm một công việc và nó có thể phục hồi sau thất bại và kiên trì cho đến khi công việc đó hoàn thành, tôi không biết nữa. Điều đó khá giống AGI. Ngay cả khi bạn không nghĩ đó là AGI, điều đó cũng không sao. Nhân tiện, Sonia sẽ nói nhiều hơn về điều này trong phần của cô ấy. Ngay cả khi bạn không nghĩ đó là AGI, tôi nghĩ tất cả chúng ta đều có thể thấy rằng ô tô (cars) đã đến rồi.

"Ô tô" đã đến (Năng suất 10-40 lần)

Vài năm gần đây, chúng ta đã có rất nhiều ngựa nhanh hơn (faster horses) – những ứng dụng giúp bạn tăng năng suất 10 hoặc 40%, nhưng không thay đổi cơ bản cách bạn làm việc. Giờ đây, chúng ta bắt đầu thấy ô tô (cars) – những ứng dụng giúp bạn tăng năng suất gấp 10 hoặc 40 lần và hoàn toàn thay đổi cách bạn làm việc. Thay đổi bản chất công việc của bạn. Thay đổi bản chất tổ chức của bạn. Ô tô đã đến rồi.

Cuộc đua đã bắt đầu: "Thì sao?"

Đây là Don Valentine, nhà sáng lập Sequoia. Ông nổi tiếng với một câu hỏi: "Thì sao?" Tại sao tất cả những điều này lại quan trọng? Điều quan trọng là bởi vì chỉ trong vài tháng qua, cuộc đua đã bắt đầu, và đó là một loại cuộc đua khác so với những gì chúng ta đã quen. Cách bạn lái ô tô khác với cách bạn cưỡi ngựa. Cách bạn chế tạo ô tô khác với cách bạn chăm sóc ngựa. Vì vậy, đây là một loại cuộc đua rất khác biệt.

Và một trong những lý do chúng tôi muốn tập hợp mọi người ở đây hôm nay là vì không ai có tất cả các câu trả lời. Và càng dành nhiều thời gian bên nhau, chúng ta càng học hỏi được nhiều hơn và hy vọng tìm ra hướng đi cho tất cả những điều này. Và điều quan trọng là chúng ta phải làm điều đó càng sớm càng tốt vì có rất nhiều điều đang bị đe dọa chỉ riêng từ góc độ thương mại (commercial perspective). Có 10 nghìn tỷ đô la đang chờ được nắm bắt. Chúng tôi có các phòng thí nghiệm (labs) tiếp cận theo phương pháp công nghệ dẫn dắt (tech-out approach). Chúng tôi có các startup xây dựng dựa trên nền tảng tiếp cận theo phương pháp lấy khách hàng làm trọng tâm (customer-back approach). Chúng tôi có tất cả các phòng thí nghiệm được đại diện trong căn phòng này, nhưng hầu hết các bạn đang xây dựng dựa trên đó. Và vì vậy, chúng tôi sẽ dành một phút để nói về phương pháp lấy khách hàng làm trọng tâm đó.

Lời khuyên cho những người xây dựng: Chiến lược MAD

Vì vậy, lời khuyên của chúng tôi dành cho những bạn đang xây dựng dựa trên các phòng thí nghiệm (labs) – đây là lời khuyên miễn phí, nên nó đáng giá từng xu bạn bỏ ra. Lời khuyên của chúng tôi là hãy "MAD" – và chúng tôi không thực sự muốn bạn phải tức giận. Bạn có thể tức giận nếu muốn. Nếu đó là điều thúc đẩy bạn, thì rất tốt. Cứ tức giận đi. Nhưng đây chỉ là một từ viết tắt tiện lợi cho Moats (Hào chắn), Affordance (Khả năng cung ứng) và Diffusion (Sự khuếch tán), đây là ba đặc điểm hoặc ba trụ cột của một chiến lược để xây dựng dựa trên các mô hình.

Trước tiên về Moats (chỉ để cho vui). Có ai nhớ slide này từ năm ngoái không? Một người, và đó là đối tác của tôi. Được rồi, tốt thôi. Để nhắc lại, slide này cho thấy chu kỳ thương mại hóa (merchandising cycle), đó là các liên kết trong chuỗi giá trị (links in the value chain) cần thiết để đưa một thứ gì đó từ một ý tưởng đến một khách hàng hài lòng. Chúng tôi sẽ không thực sự đi sâu vào các liên kết trong chuỗi. Điểm tôi muốn nhấn mạnh ở đây là: nếu bạn tiếp cận mọi thứ từ góc nhìn công nghệ dẫn dắt (tech-out point of view), mỗi liên kết trong chuỗi sẽ được tiếp cận hơi khác một chút. Nếu bạn tiếp cận mọi thứ từ góc nhìn lấy khách hàng làm trọng tâm (customer-back point of view), mỗi liên kết trong chuỗi bạn sẽ tiếp cận hơi khác một chút. Bây giờ, đây là một phần hơi phản trực giác (counterintuitive). Trong một cuộc cách mạng về tính toán (revolution of computation), vốn là về xử lý thông tin (information processing), điều bạn muốn làm là nhìn xuống đây vì có những điều mới mẻ thú vị (cool new stuff) xuất hiện liên tục. Điều bạn thực sự nên làm để xây dựng hào chắn (moats) là nhìn lên đây, bởi vì khách hàng của bạn không thay đổi nhanh bằng khả năng (capabilities) đang thay đổi. Những thứ bạn xây dựng có thể trở nên không liên quan (irrelevant) vào ngày mai. Mức độ bạn gắn kết chặt chẽ với khách hàng (wrap yourself around your customers) sẽ bền vững hơn một chút. Điều đó không có nghĩa là sản phẩm và công nghệ không quan trọng. Chúng vô cùng quan trọng (insanely important), và nói chung, sản phẩm tốt nhất sẽ thắng. Nhưng trong một thế giới nơi sản phẩm thay đổi quá nhanh vì khả năng thay đổi quá nhanh khi nghĩ về hào chắn, chúng tôi khuyến khích bạn hãy lấy khách hàng làm trọng tâm (customer-back) hết mức có thể và nghĩ về mọi cách bạn có thể gắn kết chặt chẽ với những khách hàng đó.

OK. Chữ A trong MAD stands for Affordance (Khả năng cung ứng). Đây là một thuật ngữ mà chúng tôi mượn từ thế giới thiết kế. Một cái búa là một vật thểlực tác động. Tôi có một cậu con trai 2 tuổi. Nếu tôi đưa cho nó một cái búa, nó sẽ biết phải làm gì với nó. Nó sẽ cầm và bắt đầu đập phá mọi thứ. Đó là lý do tại sao chúng tôi không đưa búa cho nó. Được chứ? Một vật thểaffordance là một vật không cần phải giải thích. Mọi người chỉ cần biết phải làm gì với nó. Claude Code thì vô cùng mạnh mẽ. Hãy thử mở một terminal cho một nhân viên trung bình của Fortune 500 và xem họ đi được bao xa. Mặc dù mạnh mẽ, nhưng nó không cung cấp nhiều affordance. Đó không phải là một sự chê bai (knock) đối với Anthropic, nhưng đó là một cơ hội cho bất kỳ ai muốn xây dựng dựa trên nền tảng đó và tạo ra những con đường ít trở ngại nhất (paths of least resistance) cho khách hàng cụ thể của bạn và các vấn đề cụ thể của họ để mọi việc trở nên cực kỳ đơn giản (brain-dead simple) để họ tìm ra cách đạt được kết quả (outcome) mà họ cần cho doanh nghiệp của họ. Đó là khái niệm về affordance.

Và cuối cùng, chữ D trong MAD là Diffusion (Sự khuếch tán). Và khoảng cách khuếch tán (diffusion gap) là cơ hội cho các công ty xây dựng ở tầng ứng dụng (application layer). Tốc độ mà khả năng (capabilities) đang khuếch tán (diffusing) ra thị trường kém xa tốc độ mà những khả năng đó đang được tạo ra. Và mỗi ngày mà các Mô hình nền tảng (Foundation Models) di chuyển nhanh hơn các doanh nghiệp (enterprise) Fortune 500 trung bình của bạn, khoảng cách đó càng lớn hơn và cơ hội đó càng lớn hơn. Vì vậy, đối với hào chắn, hãy cố gắng nghĩ theo lấy khách hàng làm trọng tâm. Đối với affordance, hãy cố gắng nghĩ về việc tạo ra những con đường ít trở ngại nhất cho khách hàng của bạn. Và khoảng cách khuếch tán đó đại diện cho cơ hội của bạn.

Không có vị trí dẫn đầu nào an toàn

Trừ khi slide trước đó với khoảng trống trắng (white space) bắt đầu được lấp đầy làm nản lòng bất cứ ai. Chúng tôi xin nhắc nhở các bạn rằng không có vị trí dẫn đầu nào là an toàn (no lead is safe). Có một câu nói trong đua xe (racing): Bạn không thể vượt 15 chiếc xe (cars) dưới nắng, nhưng bạn có thể vượt 15 chiếc xe dưới mưa. Và hiện tại, đang có một cơn mưa xối xả (torrential downpour) các khả năng (capabilities) mới đổ ra từ các Mô hình nền tảng (Foundation Models), điều đó có nghĩa là không có vị trí dẫn đầu nào là an toàn. Nhưng nó cũng có nghĩa là bất cứ ai cũng có thể chiến thắng. Thật là một thời điểm đáng sống!

Với điều đó, tôi xin nhường lời cho Sonia. Cảm ơn Pat. Và tôi chỉ muốn nói rằng thật vui khi thấy rất nhiều khuôn mặt thân thiện trong khán phòng. Có một nhóm người đặc biệt ở đây hôm nay và tôi thực sự rất vui khi được là một phần của hệ sinh thái (ecosystem) này cùng tất cả các bạn.

Sự trở lại của Tác nhân AI

Vậy mục đích của phần tôi là nói về những gì đang xảy ra trong AI ngay bây giờ, mà đối với năm 2026 chính là các tác nhân (agents). Được rồi, quay ngược thời gian (flashback) về năm 2022. Cho tôi hỏi, có ai ở đây nhớ AutoGPT hay Baby AGI không? Được rồi. Được rồi. Những dự án này đã trở thành hiện tượng chỉ sau một đêm (overnight hits) trên GitHub. Và những gì chúng làm là lấy GPT-3, cung cấp cho nó một số công cụ (tools), gói nó trong một vòng lặp (loop), và để nó chạy theo một mục tiêu (goal). Và nó rất hứa hẹn (promising) cho đến khi bạn thấy những tác nhân đó cứ thất bại lặp đi lặp lại (fail over and over and over again). Khá dễ thương (cute), khá đáng yêu (endearing), nhưng hoàn toàn vô dụng (completely useless).

Và tôi đặt slide này ở đây để nhắc nhở chúng ta rằng, bạn biết đấy, tất cả chúng ta đều biết tác nhân sắp ra đời. Chúng ta có thể đã thấy điều đó nhiều năm trước, nhưng vào năm 2022, các mô hình vẫn chưa sẵn sàng. Tiến nhanh (fast forward) đến hôm nay. Một điều gì đó vào khoảng đầu năm đã thực sự thay đổi. Đột nhiên, chúng ta có tác nhân ở khắp mọi nơi xung quanh chúng ta và chúng dường như thực sự hoạt động. Hai tác nhân đặc biệt đã trở thành cú hit lớn (home runs).

Dân Chủ Hóa Agent

Dự án Claude Code dành cho giới kỹ thuật và OpenClaw cùng toàn bộ hệ sinh thái agent tương tự, đã dân chủ hóa khả năng tạo agent cho bất kỳ ai có điện thoại. Vì vậy, dù bạn là một kỹ sư cao cấp hay một người dùng phổ thông, mấu chốt là bất kỳ ai cũng có thể tạo agent ngay bây giờ. Chúng ta đang chứng kiến mọi người xây dựng agent cho mọi thứ. Có những thứ ngớ ngẩn như một agent của OpenClaw có thể tố cáo hàng xóm của bạn vì trốn thuế – làm ơn đừng làm điều này, hoặc thực ra, có lẽ hãy làm đi. Có những ý tưởng kinh doanh, với các agent chạy các chiến dịch truyền thông sáng tạo để bán dịch vụ xây dựng. Và sau đó là cấp độ chuyên nghiệp: tôi có thể nói rằng đang có một cuộc đua lớn nội bộ tại Sequoia để xem ai có thể xây dựng những agent tốt nhất giúp chúng tôi làm việc hiệu quả hơn.

Định Nghĩa và Các Thành Phần Chức Năng của Agent

Vậy, agent có nghĩa là gì? Đây là một định nghĩa khả dĩ: Một agent là một hệ thống nhận thức môi trường của nó, chọn hành động và tự chủ tiến tới mục tiêu. Nhân tiện, tôi đã tự mình tạo ra cái này trong C dance. Tôi rất tự hào về nó. Các mô hình video đã tiến xa một chặng đường dài. Cụ thể hơn, tôi xem agent có ba thành phần chức năng:

  1. Khả năng lập luận và lên kế hoạch: Đây là cấp độ trực giác cơ bản và khả năng suy nghĩ nhanh nhạy.
  2. Khả năng thực hiện hành động: Bao gồm các công cụ, tìm kiếm (search), viết (write), biên dịch (compile).
  3. Khả năng lặp lại để đạt mục tiêu: Đây là tính kiên trì giúp agent có khả năng hoàn thành công việc trong tầm nhìn dài hạn.

Năng lực agent kết hợp ba yếu tố này. Đơn giản đó là khả năng hoàn thành công việc.

Tiến Trình Phát Triển Nhanh Chóng của Các Thành Phần Agent

Nếu chúng ta phân tích các agent thành các thành phần cấu thành – các mô hình, các công cụ, các cơ chế điều khiển (harnesses) – mỗi thành phần đều đã tiến bộ nhanh chóng trong năm qua.

Mô hình – Bộ não

Đầu tiên, các mô hình là bộ não. Đây là điều quan trọng nhất đã xảy ra. Biểu đồ đo lường khả năng một mô hình có thể duy trì tiến độ trên một nhiệm vụ phức tạp mà không bị chệch hướng trong bao lâu. Chúng ta đã đi từ việc chỉ vài chục phút một năm trước lên đến hàng giờ ngày nay. Đây là điều quan trọng nhất đã xảy ra: các mô hình cuối cùng đã đủ năng lực để duy trì hiệu suất trong các nhiệm vụ dài hạn.

Công cụ – Cánh tay và đôi chân

Thứ hai, các công cụ là cánh tay và đôi chân. Chúng cung cấp cho các mô hình quyền truy cập vào những thứ giúp chúng ta làm việc hiệu quả trên máy tính: terminal cho hệ thống tệp và công cụ phát triển, iMessage, Slack, tìm kiếm web (web search), sử dụng máy tính (computer use), v.v. Hai thập kỷ chúng ta dành để xây dựng công cụ cho con người đã trở nên cực kỳ hữu ích khi chuyển giao cho các agent. Và có một nhận định phổ biến cho rằng SaaS đã chết. Tôi lại nghĩ ngược lại, giá trị của những công cụ này sẽ bùng nổ khi số lượng agent sử dụng chúng tăng lên.

Cơ Chế Điều Khiển (Harnesses) – Tính kiên trì

Các mô hìnhcông cụ mang lại khả năng cho các agent. Cơ chế điều khiển là thứ mang lại cho chúng tính kiên trì – khả năng duy trì công việc, thích ứng và tiếp tục. Và vòng lặp phản hồi (feedback loop) đó hiện đang thực sự bắt đầu hoạt động mạnh mẽ, đặc biệt là với học tăng cường. Chúng ta đang đưa các agent này vào "trường dạy lái xe", huấn luyện chúng trong các "phòng tập RL", và thúc đẩy hiệu suất trong nhiều lĩnh vực khác nhau, từ kỹ thuật cơ khí, thiết kế đến tài chính. Chúng ta cũng đang thấy những tia sáng đầu tiên của sự tự cải thiện, hay "máy móc xây dựng máy móc". Ví dụ, một dự án nghiên cứu khác của Andre đã tự động cải thiện nghiên cứu để đạt được một mô hình cấp độ GPT2 chỉ trong hai giờ.

Thế Giới Agent Và Sự Tiến Hóa của Agent-ness

Vậy một thế giới đầy agent sẽ trông như thế nào? Agent tồn tại trên một thang đo về mức độ tự chủ (agentness). Hãy lấy lập trình làm ví dụ. Năm 2023, chúng ta có tab autocomplete. Một AI hỗ trợ con người theo từng dòng mã. Điều này hữu ích một cách tăng dần, nhưng về cơ bản không mang tính chuyển đổi. Giờ đây, chúng ta có phát triển theo hướng agent. Một con người nói chuyện với một agent, chỉ dẫn nó làm gì, có thể quản lý một đội agent.

Nhưng mô hình này đang được thúc đẩy xa hơn. Chúng ta đang chứng kiến các agent chạy nền, các agent bất đồng bộ, các agent sinh ra các sub-agent. Chúng tôi tin rằng các agent bất đồng bộ trong toàn bộ mô hình này có khả năng vượt qua mô hình hiện tại về khối lượng, chỉ vì mức độ đòn bẩy trong hệ thống. Và cuối cùng, đẩy đến biên giới công nghệ, điều mà tôi gọi là "nhà máy tự động hóa hoàn toàn" (dark factories), là loại bỏ hoàn toàn việc xem xét của con người ra khỏi hệ thống. Điều này nghe có vẻ điên rồ, nhưng tôi đã thấy nó xảy ra trong môi trường sản xuất, kể cả với các công ty an ninh mạng. Điều này là khả thi với đủ rào chắn an toàn và kỹ thuật đủ tốt.

Vì vậy, chúng ta đang tiến lên một thang đo về mức độ tự chủ của agent. Các agent đang đi từ những trợ lý nhỏ làm một chút việc bên cạnh bạn, đến những thực tập sinh cần được quản lý, đến những thực tập sinh tự quản lý, và cuối cùng là những thực tập sinh đủ đáng tin cậy để triển khai vào môi trường sản xuất (prod) mà không cần giám sát. Đó là sự tiến hóa đang diễn ra không chỉ trong lập trình mà trên tất cả các loại agent.

"Dịch Vụ Là Phần Mềm Mới" và Tác Động Kinh Tế

Điều quan trọng nhất cần ghi nhớ cho các nhà sáng lập trong phòng này là "dịch vụ là phần mềm mới". Pat đã nói điều này từ rất lâu rồi. Và đối tác của chúng tôi, Julian, cũng có mặt ở đây hôm nay, đã xuất bản một bài viết tuyệt vời về chủ đề này. Chúng ta đã biết điều này từ lâu, nhưng tôi nghĩ nó thực sự đang diễn ra.

  • Trong y học: Bạn có thể thuê một agent để kiểm tra bộ gen của mình, đưa ra khuyến nghị cá nhân hóa, kê đơn thuốc, giới thiệu các thử nghiệm lâm sàng.
  • Trong luật pháp: Bạn có thể thuê các agent để đàm phán hợp đồng thay mặt bạn, thậm chí thực hiện tố tụng và dàn xếp cho bạn.
  • Trong toán học và khoa học: Chúng ta đang chứng kiến các agent có thể giải các bài toán Erdos hoặc khám phá vật liệu siêu dẫn mới. Thật ly kỳ phải không?
  • Trong thế giới tiêu dùng: Các agent cá nhân có thể quản lý hộp thư đến, lịch, tài chính của bạn, nộp thuế cho bạn.

Và chúng tôi kỳ vọng sẽ có agent ở khắp mọi nơi. Một phần là vì việc thuê agent dễ dàng hơn rất nhiều so với việc thuê nhân viên. Con người khó mở rộng quy mô, còn các agent có khả năng mở rộng vô hạn với sức mạnh tính toán. Con người khó giữ cho họ vui vẻ – trừ tôi ra, tôi luôn vui vẻ – còn các agent ít cần bảo trì. Con người thì đắt đỏ, bạn phải trả lương cho họ; bạn trả token cho agent. Nhìn chung, chi phí để hoàn thành một nhiệm vụ với token ít hơn so với mức lương tương đương. Ngày nay, con người nhìn chung vẫn thông minh hơn, nhưng bài học cay đắng vẫn tiếp diễn và chẳng mấy chốc agent sẽ thông minh hơn trong nhiều việc.

Vì vậy, mục đích của slide này không phải là chúng ta – con người – sẽ mất việc. Tôi nghĩ một đặc điểm độc đáo của con người là khả năng thích ứng. Nhưng chúng tôi kỳ vọng việc triển khai agent trên toàn bộ lớp ứng dụng sẽ diễn ra nhanh chóng và với tốc độ, quy mô chưa từng có, bởi vì các yếu tố kinh tế rất rõ ràng và vì khả năng mở rộng nội tại của chúng.

Tương Lai của Agent và Khả Năng Rút Ngắn Thời Gian

Nếu bạn tổng hợp tất cả những điều này, số lượng agent đang tăng lên theo cấp số mũ, có thể là siêu cấp số mũ. Và tôi nghĩ chúng ta sắp đạt đến điểm mà mọi thứ trở nên thực sự kỳ lạ. Điều gì sẽ xảy ra khi thương mại diễn ra giữa các agent? Chúng có thể tự thanh toán cho nhau không? Điều gì sẽ xảy ra khi các agent có thể thực sự đàm phán các điều khoản giao dịch với nhau? Liệu chúng ta sẽ có những đàn agent giám sát chúng ta, ngăn chặn những thứ như an ninh mạng hoặc megadan không? Tất cả những gì chúng ta biết là thế giới đang trở nên kỳ lạ một cách cực kỳ nhanh chóng.

Vì vậy, tôi sẽ kết thúc bằng cách khơi gợi khía cạnh Beneserate bên trong tôi: các agent tầm nhìn dài hạn đã ở đây. Đường cong phát triển của chúng rất rõ ràng. Và đối với các nhà sáng lập, tôi nghĩ mọi người đều có những ví dụ về những người đang hoàn thành các mốc thời gian cực kỳ khó khăn nhờ AI. Nathan từ Zed đã hoàn thành một dự án moonshot ba năm chỉ trong kỳ nghỉ lễ, một mình với Claude Code. Brett Taylor đã xây dựng lại Sierra chỉ trong một cuối tuần. Nhóm Notion đã viết lại 8 triệu dòng mã chỉ trong sáu tuần. Và mọi người đều có những ví dụ về các mốc thời gian được rút gọn này, nhưng tôi nghĩ rất ít người bên ngoài các phòng thí nghiệm AGI đã thấy điều gì sẽ xảy ra khi bạn lấy những mốc thời gian được rút gọn này và xếp chồng chúng lên nhau. Và đó là điều khả thi ngay bây giờ. Vì vậy, bất cứ điều gì bạn có thể tưởng tượng xây dựng trong một trăm năm tới, chúng tôi nghĩ giờ đây đều có thể thực hiện trong một trăm ngày nhờ các agent. Tôi sẽ nhường lời cho Constantine.

Kỷ Nguyên AI: Công Việc Thể Chất và Nhận Thức

Cảm ơn Sonia. Rất cảm ơn Sonia và Pat vì cái nhìn tổng quan và phân tích xuất sắc. Trong phần này, chúng ta sẽ nói một chút về điều gì tiếp theo. Mục tiêu ở đây là chúng ta đều biết mình đang ở trong kỷ nguyên AI. Nó sẽ trông như thế nào? Sẽ cảm thấy ra sao? Nó được đặc trưng bởi điều gì? Đầu buổi thuyết trình, Pat đã phân tách các cuộc cách mạng công nghệ thành tính toán (comput) và truyền thông (communication). Chúng ta sẽ thực hiện một sự phân tách khác ở đây cho các loại công việc.

công việc thể chất. Đây là một gói hàng trên Pony Express. Đây là một vệ tinh trên Falcon 9. Công việc bằng lực nhân quãng đường. Chuyển động vật lý.

Và sau đó là công việc nhận thức. Đây là Pythagoras đưa ra định lý của mình. Đây là DeepMind giải quyết bài toán gấp protein, tư duy có ý thức. Đây là những loại công việc rất khác nhau, nhưng chúng tôi tin rằng chúng sẽ theo một mô hình rất giống nhau trong các cuộc cách mạng.

Cách Mạng Công Nghiệp: Sự Chuyển Đổi Công Việc Thể Chất

Hãy nói về công việc thể chất vì chúng ta đã trải qua cuộc cách mạng này với Cách mạng Công nghiệp. Trong phần lớn lịch sử loài người, tất cả hoặc gần như tất cả công việc phục vụ con người đều được thực hiện bằng một loại cơ bắp nào đó: con người hoặc động vật. Con người di chuyển vật gì đó hoặc một con vật kéo con người đi. Điều này bắt đầu từ năm 1700, nhưng đã có từ hàng thiên niên kỷ trước. Sau đó, mọi thứ bắt đầu thay đổi. Sức nước và sức gió, động cơ hơi nước, và sau đó mọi thứ tăng tốc: động cơ hơi nước, đốt trong, động cơ điện. Ngày nay, năm 2026, bạn có thể ước tính rằng hơn 99% tổng số công việc thể chất được thực hiện trên Trái đất cho con người đều do máy móc thực hiện. Chiếc máy bay đưa bạn đến đây, việc sản xuất tất cả hàng hóa trong căn phòng này, tất cả các phương tiện giao thông chuẩn bị cho đỉnh cao của trải nghiệm nhân loại mà bạn đang có ngay bây giờ.

Cách Mạng Nhận Thức: Tương Lai của Tư Duy

Vâng, chúng tôi nghĩ một mô hình tương tự sẽ xảy ra trong nhận thức. Chúng ta chỉ mới ở giai đoạn đầu. Vì vậy, trong phần lớn lịch sử loài người, tất cả tư duy trên Trái đất cho con người chủ yếu được thực hiện bởi con người, có thể một chút bởi động vật, như chó chăn cừu đuổi cừu, đúng không? Và có một phần nhỏ trên đó là công việc cơ khí, như kính thiên văn cổ (astrolabe) hoặc đồng hồ.

Trong vài trăm năm qua, không có nhiều tiến bộ cho đến khi có tính toán điện tử, và trong một trăm năm qua, hãy nghĩ về hàng nghìn tỷ phép tính đang diễn ra tại bất kỳ thời điểm nào để phục vụ bạn – con người. Tất cả công việc đó, tất cả công việc nhận thức đó đang diễn ra để phục vụ chúng ta tại bất kỳ thời điểm nào. Hàng nghìn tỷ phép tính. Chúng tôi tin rằng mạng thần kinh là làn sóng lớn tiếp theo và trong tương lai gần, 99.9% công việc nhận thức trên Trái đất sẽ được thực hiện bởi máy móc.

Sự song song này khá rõ ràng. Và tin tốt là chúng ta đã trải qua một cuộc cách mạng như thế này. Cuộc cách mạng nhận thức sẽ rất giống với Cách mạng Công nghiệp, chỉ là quy mô lớn hơn nhiều và diễn ra nhanh hơn nhiều.

Cuộc Sống Trong Tương Lai: Câu Chuyện Nhôm và Trí Tuệ

Vậy cuộc sống trong tương lai này sẽ như thế nào? Tôi muốn chia sẻ một số động lực cho tương lai này dưới dạng bốn câu chuyện ngắn.

Câu chuyện đầu tiên: Giữa những năm 1800, Mỹ muốn xây dựng một đài tưởng niệm vĩ đại cho vị tổng thống đầu tiên và anh hùng chiến tranh vĩ đại nhất của chúng ta, George Washington. Vì vậy, chúng ta đã thiết kế tòa nhà cao nhất thế giới vào thời điểm đó, Đài tưởng niệm Quốc gia Washington. Và chúng ta muốn lợp đỉnh bằng kim loại quý nhất thế giới, 100 ounce kim loại quý nhất thế giới. Nó quý giá đến mức chúng ta đã trưng bày nó tại cửa hàng Tiffany's ở Manhattan. Kim loại đó là nhôm.

Trong vòng vài thập kỷ sau khi hoàn thành Đài tưởng niệm Quốc gia Washington, một nhà phát minh trẻ đã đưa ra điện phân, quá trình tách nhôm từ đất. Và trong vòng vài thập kỷ, nhôm đã được dùng để bọc kẹo và bánh mì kẹp của chúng ta, rồi bị vứt vào thùng rác. Nhôm là trí tuệ. Điện phântrí tuệ nhân tạo. Chúng ta sắp bước vào một thế giới mà một số kỹ năng quý giá nhất, phải mất hàng thập kỷ để đạt được, những kỹ năng cấp độ Tiến sĩ, giờ đây có thể được triệu hồi tức thì đến mức ngay sau khi sử dụng, bạn có thể vò nát và vứt chúng vào thùng rác.

Thiết Kế Ngoài Hành Tinh

Câu chuyện thứ hai là về việc chúng ta đang bước vào một thế giới của alien design (thiết kế ngoài hành tinh). Thế giới mà chúng ta thấy ngày nay đều xoay quanh việc thiết kế cho con người. Bạn biết đấy, nó đã được tối ưu hóa theo cách có ý nghĩa đối với bộ não của chúng ta, bởi vì chúng ta đang thực hiện gần như tất cả các hoạt động nhận thức trên thế giới. Khi máy móc thực hiện nhận thức, mọi thứ sẽ hơi khác một chút.

Vào năm 2006, NASA đã tối ưu hóa một ăng-ten cho một sứ mệnh vệ tinh không gian lớn. Theo truyền thống, các ăng-ten của họ trông như thế này: một hình mẫu hình học đối xứng tuyệt đẹp, tối ưu hóa diện tích bề mặt theo một số ràng buộc về năng lượng. Lần này, họ quyết định giao nhiệm vụ cho máy tính và sử dụng một evolutionary algorithm (thuật toán tiến hóa), rất giống với Học tăng cường. Kết quả là ăng-ten này đã hiệu quả hơn đáng kể nhưng lại không trực quan đối với trí óc con người.

Trong kỷ nguyên AI này, khi chúng ta giao việc nhận thức cho máy móc, chúng ta sẽ nhận được những kết quả không trực quan đối với chúng ta. Khi AI thiết kế chip, ô tô, tòa nhà, chúng có thể trông khác biệt đáng kể. Thế giới mà chúng ta bước vào đòi hỏi chúng ta phải có tư duy cởi mở, bởi vì AI sẽ không tư duy như chúng ta. Nó sẽ có một alien design.

Khoa Học Tự Phát Sinh

Câu chuyện động lực thứ ba là về các emerging sciences (khoa học tự phát sinh). Không phải "khoa học mới nổi" (emerging science), chúng ta đều biết có khoa học mới nổi. Tôi đang nói về các "khoa học tự phát sinh" (emerging sciences).

Trong cuộc cách mạng công nghiệp sơ khai, chúng ta có những kỹ sư vĩ đại như Newman và Watt, những người đã hoàn thiện động cơ đốt trong. Về cơ bản, họ đưa hóa dầu vào một pít-tông, đốt cháy, hàng triệu, hàng tỷ hạt nổ tung, đẩy pít-tông hoạt động. Trong gần một trăm năm, tất cả những điều đó chỉ là mày mò. Đó là một kỹ sư nói: "À, cái này hoạt động tốt hơn một chút." Có thể là một điều gì đó bạn có thể thấy như scaling law (quy luật mở rộng quy mô), nhưng đó là các kỹ sư thử nghiệm với sản phẩm và xem cách họ có thể cải thiện nó một chút. Hơn 120 năm sau, Sadi Carnot xuất hiện và hình thức hóa điều này thành một ngành khoa học mới: thermodynamics (nhiệt động lực học). Ông nói: "Khoan đã. Có hàng triệu hoặc hàng tỷ hạt. Chúng ta thực sự có thể hình thức hóa tất cả những gì đang diễn ra."

Trong trường hợp này, có hàng tỷ nơ-ron, hàng nghìn tỷ token. Ngay bây giờ, chúng ta đang ở giai đoạn "mày mò" của AI. Ngay cả khi chúng ta nghĩ đó là một ngành khoa học đã được hiểu rõ, thì không phải vậy. Trong tương lai, chúng ta sẽ có một ngành khoa học cơ bản như thermodynamics được giới thiệu trong vài thập kỷ tới. Ai đó trong căn phòng này có thể sẽ đưa ra ngành khoa học đó. Và ngành khoa học đó sẽ được giảng dạy ở trường trung học. Nó sẽ cơ bản đến mức đó. Và nó sẽ giúp chúng ta làm chủ AI. Nó thậm chí sẽ giúp chúng ta làm chủ ý thức.

Nghệ Thuật Phi Lý Trí

Câu chuyện thứ tư là nghệ thuật phi lý trí. Trong phần lớn lịch sử nhân loại, hàng chục nghìn năm, nghệ thuật đã là một sự tiến bộ hướng tới chủ nghĩa hiện thực. Đây là bức tranh hang động khoảng 25.000 năm trước, chữ tượng hình Ai Cập, gốm Hy Lạp, các bức tranh thời Phục hưng - một sự chuyển đổi lớn hướng tới nghệ thuật hiện thực. Chỉ cần nhìn vào sự khác biệt. Trải qua hàng chục nghìn năm, đó là chiến thắng của nhân loại. Và rồi kỹ thuật xuất hiện, Daguerreotype (ảnh Daguerre) – những bức ảnh chụp đầu tiên, và đột nhiên, những gì đã mất hàng thập kỷ để hoàn thiện kỹ năng từng nét cọ hoàn hảo đã biến mất.

Vậy, thế giới đã phản ứng như thế nào? Họ nghĩ rằng hội họa đã kết thúc. "Ồ, vậy là xong. Máy móc có thể làm tốt hơn bất kỳ con người nào. Nghệ thuật đã chấm dứt." Chà, điều gì đã xảy ra? Con người đã phản ứng như thế nào? Con người đã phản ứng bằng cách nói: "Mục đích của nghệ thuật này là để ghi lại khoảnh khắc theo cách mắt nhìn thấy, hay để ghi lại khoảnh khắc theo cách trái tim và tâm hồn nhìn thấy?" Chủ nghĩa Ấn tượng, Biểu hiện, Lập thể, Tân biểu hiện. Tất cả những hình thức nghệ thuật mới này là cách nhân loại đã phản ứng với sự thay đổi đáng kể này trong khoa học.

2500 năm trước, triết gia Hy Lạp Protagoras đã viết: "Con người là thước đo của mọi vật." Ý ông là không có gì trong chân không có giá trị đối với con người. Không phải nhôm, không phải nghệ thuật, không phải trí thông minh. Nó chỉ có giá trị vì trải nghiệm. AI có thể làm việc. AI sẽ làm việc. Nhưng chỉ có kết nối con người mới có thể mang lại cho bạn lý do để quan tâm. Đó là lý do tại sao tất cả chúng ta có mặt ở đây hôm nay.

Một thập kỷ nữa, công việc sẽ thay đổi đáng kể. Mọi thứ sẽ thay đổi rất nhiều. Nhưng điều duy nhất sẽ không đổi là những mối quan hệ mà bạn tạo dựng hôm nay với người bên cạnh bạn sẽ bền vững. Đó là điều bạn sẽ nhìn lại. Đó là điều sẽ có giá trị từ ngày hôm nay. Vì vậy, tôi khuyến khích bạn hình thành những mối quan hệ đó với những người bên cạnh bạn, tận hưởng thời gian cùng nhau tại sự kiện AI này, và thực sự phát huy những gì khiến chúng ta trở nên con người nhất.

Góp ý / Báo lỗiPhát hiện sai sót hoặc có ý tưởng cải thiện?