- OpenAI hoạt động với mô hình kinh doanh đơn giản nhưng tham vọng: mua, thuê, xây dựng tài nguyên tính toán (
compute) và bán lại để đáp ứng nhu cầu vô hạn về trí tuệ nhân tạo, dù họ liên tục thiếu nguồn lực này. - Các "định luật mở rộng" (
scaling laws) cho mạng lưới thần kinh tiếp tục có hiệu lực một cách đáng ngạc nhiên, cho phép các mô hình AI trở nên mạnh mẽ hơn tỷ lệ thuận với lượng tài nguyên tính toán đầu vào mà không có giới hạn rõ ràng. - Các mô hình AI hiện tại có khả năng cao, thậm chí vượt trội con người trong việc lập trình, yêu cầu các công ty khởi nghiệp tận dụng tối đa "công cụ tác nhân" (
agentic tools) và đầu tư vào việc cung cấp "ngữ cảnh" (context) đầy đủ cho AI.
OpenAI's Greg Brockman: Why Human Attention Is the New BottleneckOpenAI's
- Tài nguyên tính toán là trọng tâm: Mô hình kinh doanh của OpenAI xoay quanh việc đảm bảo và phân phối tài nguyên tính toán, nhấn mạnh rằng đây là nút thắt cổ chai và tài sản chiến lược quan trọng nhất trong phát triển AI.
- Định luật mở rộng tiếp tục đúng: Khả năng của các mô hình AI tăng lên đáng kể khi được cung cấp thêm tài nguyên tính toán, cho thấy tiềm năng phát triển không ngừng bằng cách tăng quy mô cơ sở hạ tầng.
- Đổi mới liên tục trong kiến trúc và thuật toán: Ngoài việc mở rộng quy mô các ý tưởng cũ, sự tiến bộ còn đến từ các đổi mới nhỏ (
micro tweaks), chuyển đổi mô hình kiến trúc (paradigm shifts) như Transformer, và nghiên cứu dài hạn về thuật toán. - AI vượt trội trong lập trình: Các mô hình AI hiện tại (ví dụ: GPT 5.4) đã có khả năng đáng kinh ngạc trong việc viết phần mềm, tối ưu hóa hệ thống phức tạp và tự động hóa các tác vụ kỹ thuật cấp thấp.
- "Ngữ cảnh" là khoản đầu tư then chốt: Các công ty khởi nghiệp nên tập trung vào việc đảm bảo AI có đủ ngữ cảnh về các hoạt động của người dùng và hệ thống để có thể giải quyết vấn đề hiệu quả mà không cần giải thích liên tục.
- Tận dụng tối đa công cụ tác nhân: Các công cụ lập trình tác nhân (
agentic coding tools) đang nhanh chóng chuyển từ hỗ trợ 20% sang 80% công việc viết mã, trở thành yếu tố cốt lõi trong quy trình phát triển. - Tái cấu trúc tổ chức trong kỷ nguyên AI: Chi phí tạo nguyên mẫu (
prototype) giảm đáng kể, thúc đẩy sự cần thiết của quản trị (governance) tốt hơn, đặc biệt về nguồn gốc dữ liệu (data provenance) và theo dõi các tạo phẩm phái sinh (derived artifacts). - Tương lai của công việc với AI: AI sẽ tạo ra một kỷ nguyên mới cho "doanh nhân đơn độc" (
solopreneur), làm cho công việc thú vị hơn nhưng cũng cạnh tranh hơn, và có thể dẫn đến các đội nhóm nhỏ hơn, phẳng hơn.
Compute— Tài nguyên tính toánScaling Laws— Định luật mở rộngNeural Networks— Mạng lưới thần kinhAGI— Trí tuệ nhân tạo tổng quátContext— Ngữ cảnhAgentic Tools/Workflows— Công cụ/luồng công việc tác nhânCodex— Codex (công cụ lập trình AI)Data Provenance— Nguồn gốc dữ liệuSolopreneur— Doanh nhân đơn độc
Giới Thiệu và Vai Trò
Greg, cảm ơn anh đã quay lại đây. Tôi không nghĩ chúng tôi đã tính phí thuê chỗ của anh bao giờ, nên có lẽ chúng tôi sẽ gửi hóa đơn sau. Nhưng Greg, anh đã là một phần của hai công ty thực sự ấn tượng. Stripe với tư cách là nhân viên số bốn và sau đó là CTO đầu tiên. Tôi mới đây nghe nói rằng họ xử lý 1.6% tổng GDP toàn cầu. Anh chắc hẳn phải rất tự hào về điều đó.
Greg: Thật tuyệt vời. Anh hẳn còn tự hào hơn nữa khi OpenAI hiện có gần một tỷ hoặc có thể hơn một tỷ người dùng hoạt động hàng tuần.
Người phỏng vấn: Tôi nghĩ tất cả đều rất thú vị. Điều đó cho thấy công nghệ có thể làm được những gì. Và anh không chỉ là đồng sáng lập và chủ tịch, mà còn là "kiến trúc sư trưởng" (chief builder) tại OpenAI. Tôi nghe nói đó là một trong những chức danh của anh.
Greg: Tôi không chắc đó có phải là một chức danh chính thức hay không, nhưng tôi đã được gọi bằng nhiều tên khác. Cứ cho là vậy đi.
Người phỏng vấn: Anh đang có một lượng khán giả gồm những nhà xây dựng (builder) tuyệt vời ở đây. Vì vậy, chúng ta sẽ bắt đầu từ phần dưới cùng của Software Stack. OpenAI có nhiều stack trong hoạt động kinh doanh, một trong số đó là compute. Và các bạn đã rất quyết liệt, rất quyết liệt trong việc đảm bảo compute. Tại sao vậy?
Nhu Cầu Tính Toán (Compute) Không Giới Hạn
Greg: Về nhiều mặt, chúng tôi có một mô hình kinh doanh rất đơn giản. Chúng tôi mua, thuê, xây dựng compute và bán lại với một biên lợi nhuận. Chỉ vậy thôi. Miễn là biên lợi nhuận dương, thì bạn muốn mở rộng quy mô nó, bởi vì nhu cầu giải quyết vấn đề, nhu cầu về trí tuệ nhân tạo, là vô hạn. Và các AI mà chúng tôi có hiện nay thực sự có thể đáp ứng thách thức của bất kỳ loại vấn đề nào mà bạn muốn giao cho chúng.
Người phỏng vấn: Các bạn có đủ compute không?
Greg: Không.
Người phỏng vấn: Thật sao?
Greg: Vâng, chắc chắn là không.
Người phỏng vấn: Tôi vừa nói chuyện với Matt Garman và anh ấy nói rằng tính khả dụng của GPU compute vào năm 2026 sẽ về 0. Các bạn không có tất cả sao?
Greg: Ý tôi là, chúng tôi, chúng tôi rất muốn có thêm. Thành thật mà nói, chúng tôi liên tục tìm kiếm thêm compute. Và tôi sẽ kể cho anh nghe, khi chúng tôi lần đầu ra mắt ChatGPT, tôi nhớ mình đã có một cuộc gọi với nhóm và họ hỏi: "Được rồi, chúng ta nên mua bao nhiêu compute?" Và tôi nói: "Mua tất cả." Và họ nói: "Không, không, không, nghiêm túc đấy, chúng ta nên mua bao nhiêu?" Tôi nói: "Dù chúng ta có cố gắng tăng cường compute nhanh đến đâu, tôi đảm bảo chúng ta sẽ không thể đáp ứng được nhu cầu." Và điều đó đã đúng kể từ đó.
Kiến Trúc và Định Luật Mở Rộng (Scaling Laws)
Người phỏng vấn: Ừm, điều đó thật hấp dẫn. Chuyển sang phần compute, vì tôi không biết liệu phần lớn khán giả này có thể giúp các bạn đảm bảo thêm compute hay không, vì hầu hết họ là những nhà sáng lập startup. Về kiến trúc và scaling laws (định luật mở rộng), chúng ta đang ở đâu trong các scaling laws? Chúng vẫn tăng gấp đôi mỗi năm ư? Các bạn đang thay đổi kiến trúc chứ? Các bạn đang đẩy mạnh những gì ở ranh giới nghiên cứu?
Greg: Vâng, tôi sẽ nói trước hết là các scaling laws là một bí ẩn sâu sắc và rất đẹp. Chúng có vẻ rất cơ bản. Giống như một chân lý khoa học mà bạn nghĩ về vật lý, luật Newton và những thứ tương tự, chúng bằng cách nào đó là một chân lý của vũ trụ và chúng mang tính thực nghiệm. Chúng ta không nhất thiết phải có tất cả lý thuyết để giải thích chính xác tại sao chúng hoạt động. Nhưng đối với tôi, điều tuyệt vời nhất là mạng lưới thần kinh (neural networks) thực sự được thiết kế từ những năm 1940, trước khi có máy tính. Và bằng cách nào đó, chúng ta đã có thể lấy những ý tưởng chính xác được phát triển từ thời đó và áp dụng lượng tính toán (computation) ngày càng tăng, và khi bạn đổ nhiều compute hơn vào các mô hình, chúng trở nên có khả năng hơn tương ứng và nó cứ tiếp tục như vậy. Không có bức tường nào cả. Và đó, tôi nghĩ đó là một điều tuyệt vời.
Người phỏng vấn: Điều đó khá tuyệt. Có thêm nghiên cứu hoặc thuật toán nào đang được triển khai không, bởi vì, như anh đã nói, trong quá khứ chúng ta có mạng lưới thần kinh vào những năm 1940 nhưng chúng ta không có compute cho nó. Bây giờ chúng ta có compute rồi, chúng ta chỉ đang đẩy mạnh những thứ cũ hay có những kiến trúc và ý tưởng mới đang xuất hiện?
Greg: Vâng. Vì vậy, tôi sẽ nghĩ rằng chúng tôi hoàn toàn có những ý tưởng mới liên tục thúc đẩy những gì chúng tôi làm. Sẽ rất đơn giản hóa nếu nói, à, chúng ta hãy lấy một mạng lưới thần kinh từ những năm 1940 và đặt nó vào một trung tâm dữ liệu gigawatt, đúng không? Chúng tôi đã tạo ra rất nhiều đổi mới và chúng tôi liên tục cải thiện mọi thứ. Và đôi khi đây là những micro tweaks (điều chỉnh nhỏ), ví dụ bạn nhận ra cách bạn đã định dạng dữ liệu không hoàn toàn đúng và điều đó thực sự có thể rất quan trọng. Đôi khi nó lớn hơn. Bạn nghĩ về sự chuyển đổi từ LSTM sang Transformer, và tôi không nghĩ Transformer là, bạn biết đấy, mọi người đã vượt qua Transformer như được mô tả trong bài báo năm 2018. Vì vậy, luôn có sự đổi mới liên tục diễn ra, và tôi nghĩ về những nơi có lẽ đã đầu tư nhiều nhất vào nghiên cứu dài hạn về cách cải thiện kiến trúc, cách cải thiện các thuật toán cơ bản và cách tạo ra các paradigm shifts (chuyển đổi mô hình). Tôi nghĩ OpenAI đã dẫn đầu trong lĩnh vực đó và đó là điều chúng tôi tiếp tục đầu tư và tôi thấy rất nhiều thành quả hứa hẹn ở phía trước. Được rồi.
Định Nghĩa AGI và Khả Năng Hiện Tại Của Mô Hình
Người phỏng vấn: Và về các mô hình, OpenAI có định nghĩa chính thức cho AGI không? Chúng ta có gần đạt được nó không? Hay không? Pat và Sonia đã công bố rằng chúng ta đã đạt đến AGI về mặt chức năng. Anh có đồng ý với điều đó không? Anh có không đồng ý không?
Greg: Vâng, chúng tôi có một định nghĩa chính thức, nhưng ở một mức độ nào đó, một điều tôi đã học được là mọi người đều có những nhận định riêng về AGI là gì. Và có lẽ anh có thể coi nó như, theo quan điểm của tôi về vị trí hiện tại của chúng ta, tôi nghĩ chúng ta đã đi được khoảng 80% chặng đường ở chỗ chúng ta có những mô hình thông minh. Chúng rất có khả năng. Chúng có thể, nếu bạn cung cấp...
Người phỏng vấn: Chúng có thông minh hơn anh không?
Greg: Ý tôi là, chúng chắc chắn có khả năng hơn tôi trong việc viết phần mềm, đúng không? Nếu bạn cung cấp cho nó tất cả ngữ cảnh, thì vâng, tôi, tôi, tôi nghĩ rằng chúng rất có khả năng. Thật sự đáng kinh ngạc. Ví dụ, có ai ở đây cảm thấy mình viết phần mềm tốt hơn GPT 5.4 không?
Người phỏng vấn: Ồ!
Greg: Được rồi. Viết kernel. Ừm, ngay cả ở đó chúng ta cũng thấy những tiến bộ lớn từ. Chính xác. Và đối với một số kết quả nội bộ của chúng tôi, ở đó chúng tôi thực sự thấy rằng nếu bạn cung cấp đúng loại, bạn biết đấy, nếu bạn có thiết lập phù hợp cho vấn đề của mình, thì bạn có thể đạt được những kết quả thực sự lớn từ những tác vụ rất cấp thấp, thậm chí là tác vụ cấp thấp. Và chỉ để đưa ra một ví dụ về xu hướng phát triển, một trong những kỹ sư hệ thống của tôi cũng tương tự nói rằng: "Này, tôi đã không thể nhận được giá trị từ các mô hình GPT 5 cho 5.1, cho 5.2 cũng như cho 5.3." Anh ấy đã chuẩn bị một tài liệu thiết kế cho một tối ưu hóa hệ thống rất phức tạp mà anh ấy sắp thực hiện. Anh ấy đưa nó cho mô hình, đi ngủ, thức dậy với ý định giao việc này cho nhóm của mình làm trong tuần tới, và khi anh ấy thức dậy, nó đã hoàn thành. Mô hình đã thực sự triển khai thông số kỹ thuật ban đầu, đã nhận thấy nó chậm, đã thêm instrumentation (công cụ đo đạc), đã thực sự chạy mã, sử dụng profiler (công cụ phân tích hiệu suất) để tìm ra những điểm chậm và lặp lại nhiều lần cho đến khi đạt được kết quả được tối ưu hóa. Và điều đó thật đáng kinh ngạc. Đó là nơi chúng ta đang ở.
Lời Khuyên Cho Các Startup: Tận Dụng AI và Cung Cấp Ngữ Cảnh
Người phỏng vấn: Vậy thì anh sẽ khuyên tất cả các startup ở đây nên làm gì, bởi vì các mô hình ngày càng trở nên có khả năng hơn? Tôi đã hỏi Sam về điều này trong quá khứ, và bạn biết đấy, nếu bạn đang xây dựng hôm nay, bạn có cần phải xây dựng lại trong hai năm nữa khi một mô hình mới ra mắt không, bởi vì tất cả chức năng và khả năng đều thay đổi xung quanh bạn. Ừm, bạn có cần đảm bảo rằng bạn không cản đường OpenAI không, bởi vì các bạn sẽ vượt qua các startup vì các mô hình có khả năng hơn rất nhiều. Ừm, anh sẽ khuyên một nhóm các nhà sáng lập startup xây dựng trong môi trường này như thế nào?
Greg: Vâng, trước hết, tôi sẽ nói rằng hãy tận dụng tối đa công cụ. Các công cụ hiện nay đã trở nên vô cùng hữu ích. Và nếu bạn nhìn vào ngay cả trong tháng 12, tôi nghĩ rằng chúng ta đã đi từ những công cụ lập trình tác nhân (agentic coding tools) kiểu như, bạn biết đấy, chúng viết 20% mã của bạn, đến việc viết 80% mã của bạn, điều đó có nghĩa là chúng chuyển từ việc chỉ là một phần phụ trợ sang là thứ chính mà bạn đang làm. Và tôi nghĩ chúng ta sẽ làm điều đó trên tất cả các công việc mà mọi người làm với máy tính, tất cả các công việc máy tính trong năm nay. Và bạn có thể nhìn vào những tiến bộ gần đây về Codecs, thực sự thay đổi từ một công cụ dành cho kỹ sư phần mềm sang một công cụ cho bất kỳ ai làm việc với máy tính. Và chỉ trong tuần qua, chúng tôi đã phát hành một loạt các tính năng giúp nó mạnh mẽ và có khả năng hơn rất nhiều. Ừm, và một điều chúng tôi vừa công bố hôm nay là một công cụ mới có tên là Chronicle tích hợp vào Codecs, nơi nó thực sự có thể nhìn thấy mọi thứ bạn đang làm với máy tính của mình và có thể hình thành ký ức về những gì đang diễn ra. Và vì vậy, bạn hỏi nó một câu hỏi, nó sẽ ngay lập tức biết bạn đang nói về điều gì. Bạn hỏi: "À, năm phút trước tôi đang làm gì?" Nó biết, đúng không? Bạn hỏi: "Ồ, người này đang nói về cái gì?" Nó biết. Đối với tôi, đó là một tiếng chuông cảnh tỉnh thực sự để nhận ra rằng bạn dành rất nhiều công sức hiện nay chỉ để giải thích cho máy tính của mình những gì đang diễn ra. Tại sao bạn lại giải thích cho máy tính của mình những gì đang diễn ra? Điều đó không có lý.
Và vì vậy, tôi nghĩ điều sẽ xảy ra trong những năm tới là các mô hình sẽ trở nên có khả năng hơn nhiều. Chúng ta sẽ có những bộ harness (công cụ hỗ trợ) tốt hơn. Chúng ta sẽ có thể giải quyết những vấn đề ngày càng khó hơn, tạo ra kiến thức mới, tất cả những điều này. Nhưng có một sự thay đổi diễn ra một lần đang xảy ra hiện nay, thực sự là về ngữ cảnh (context). Nó thực sự là về việc AI của bạn có thể... bạn có tất cả những cuộc họp này, bạn không bao gồm AI, bạn biết đấy, điều đó không tử tế lắm với AI. Giống như bạn đang yêu cầu nó giúp bạn những việc mà nó không có thông tin. Vì vậy, tôi nghĩ thực sự hãy tập trung vào cách bạn đảm bảo AI thậm chí có đủ thông tin trên lý thuyết để giải quyết vấn đề, và sau đó tin tưởng rằng các mô hình sẽ thực sự đạt được điều đó và cải thiện. Vì vậy, tôi nghĩ đó sẽ là một chu kỳ cải tiến và lặp lại liên tục và tận dụng các công cụ và nói chuyện với bạn bè để tìm hiểu cách họ đang sử dụng nó. Nhưng có một khoản đầu tư là đầu tư một lần mà bây giờ là thời điểm để thực hiện.
Cách OpenAI Sử Dụng Codex
Cách OpenAI đang sử dụng Codex có gì khác biệt so với cách mọi người bên ngoài đang dùng nó?
"Một trong những điều tuyệt vời khi làm việc tại OpenAI là bạn được sống trong tương lai. Bạn thực sự được nhìn thấy hình dạng của những gì đang nổi lên, và chúng ta có thể đồng thiết kế. Chúng tôi có thể thực sự thay đổi các mô hình, kết hợp mọi thứ lại với nhau để phục vụ tốt hơn các nhu cầu mà chúng tôi nhận thấy.
Rất nhiều phương pháp tiếp cận mà chúng tôi đã thực hiện là: chúng tôi bắt đầu với kỹ thuật phần mềm và đặt ra một số nguyên tắc rõ ràng. Chẳng hạn, chúng tôi vẫn muốn con người phải chịu trách nhiệm về tất cả các mã được hợp nhất. Vì vậy, cuối cùng, việc hợp nhất đoạn mã này có phải là một điều tốt không? Nó có được cấu trúc tốt không? Nó có làm cho codebase của chúng tôi dễ bảo trì hơn không? Chúng tôi muốn đảm bảo có một con người ký duyệt. Và đó, tôi nghĩ, là sự thận trọng, không chỉ nói, "Ồ, Codex, cứ sử dụng cái này một cách mù quáng" hay "Ồ, chúng tôi hoàn toàn không muốn sử dụng cái này." Tôi nghĩ cả hai thái cực đều không hoàn toàn đúng.
Sau đó, chúng tôi cũng đang đi theo từng lĩnh vực chuyên môn dọc (vertical by vertical) trong OpenAI để áp dụng các công cụ này: trong tài chính, trong kinh doanh, trong CNTT. Ở đó, chúng tôi có một đội ngũ nhỏ chuyên trách, những người thực sự hiểu sâu về lĩnh vực đó, làm việc với những chuyên gia để xây dựng các kỹ năng, để sửa đổi giao diện Codex UI — bất cứ điều gì cần thiết để làm cho nó tốt. Và đó là điều mà chúng tôi có thể làm, một khi nó ở trạng thái tốt, chúng tôi sẽ triển khai ra bên ngoài (externalize). Và chúng tôi có thể gửi nó đến tất cả các bạn. Vì vậy, chúng tôi cũng đang bắt đầu làm việc với một số khách hàng nhất định. Đối với những người muốn đi đầu về Trí tuệ nhân tạo (AI forward) và muốn trở thành một phần của việc định nghĩa cuộc cách mạng này, thì có một vị trí cho điều đó. Tôi rất muốn thảo luận sau. Nhưng vâng, tôi nghĩ rằng mong muốn này là, "Này, chúng tôi thực sự muốn đi đầu về Trí tuệ nhân tạo, thực sự sống trong tương lai và trải nghiệm nó sẽ như thế nào đối với mọi người khác trong một năm, hai năm, ba năm tới."
Tái cấu trúc Tổ chức trong Kỷ nguyên Trí tuệ nhân tạo
Các bạn có cấu trúc công ty hay các nhóm kỹ thuật khác đi vì việc "sống trong tương lai" không? Ý tôi là, nếu quay ngược thời gian, khi cha tôi học khoa học máy tính, ông ấy chỉ là một mình. Sau đó, chúng ta có những bản phát hành phần mềm dài hơi theo mô hình waterfall. Rồi khi web và điện toán đám mây xuất hiện, chúng ta có các two-pizza team và phương pháp scrum. Giờ đây, khi có các tác nhân lập trình (coding agents), các bạn cấu trúc mọi thứ khác đi như thế nào?
"Tôi nghĩ chúng tôi vẫn đang tìm hiểu, và có những nơi bạn thực sự thấy được điều đó. Ví dụ, chi phí để xây dựng một prototype giờ đây rất rẻ. Thật sự rất rẻ. Và nếu bạn muốn xây dựng một dashboard mà trước đây phải mất một tuần để hoàn thành, giờ bạn chỉ cần làm nó ngay lập tức. Và thực tế, rất nhiều nút thắt cổ chai đã chuyển sang những thứ như chia sẻ. Làm thế nào để... Và vì vậy, chúng tôi thực sự có một số công việc nội bộ về vấn đề này, mà một lần nữa, chúng tôi sẽ triển khai ra bên ngoài: Làm thế nào để mọi người trong doanh nghiệp của bạn có thể dễ dàng xây dựng một dashboard, một widget, một bot – bất kể là gì – và sau đó chia sẻ nó với người khác?
Và điều đó bắt đầu tạo áp lực lên việc có một quản trị (governance) tốt. Ví dụ, bạn muốn tổ chức CNTT của mình có thể nhìn thấy tất cả các luồng thực thi đang diễn ra, tất cả những điều nhỏ nhặt đang được chia sẻ. Bạn muốn có một số quyền kiểm soát đối với nguồn gốc dữ liệu (data provenance), đúng không? Để thực sự đảm bảo rằng... Một ví dụ điển hình là, tôi nghĩ mọi người hiện đang bắt đầu biến các kho kiến thức nội bộ của họ thành các wiki. Chúng tôi có một hệ thống wiki rất hay như vậy trong nội bộ. Và điều bạn nghĩ ngay lập tức là, nếu ai đó có một tài liệu trong cơ sở kiến thức nội bộ mà vô tình bị cấp quyền sai, và họ nhận ra, "Ôi không, tôi không muốn thông tin này được truy cập." Làm thế nào để họ khắc phục điều đó? Thông thường, họ vào tài liệu, thay đổi quyền. Nhưng giờ đây, có những tạo phẩm phái sinh (derived artifacts). Và vì vậy, bạn cần đảm bảo có một cách nào đó để theo dõi qua hệ thống để nói rằng, "Tài liệu đầu ra này đến từ nguồn kia. Nguồn đó không còn truy cập được đối với đối tượng này. Hãy đi và hủy bỏ nó luôn." Và vì vậy, bạn phải bắt đầu thực sự xây dựng kiến trúc kỹ thuật của mình với nhận thức về cách mọi người sẽ sử dụng thông tin này. Và nó thực sự thay đổi cách các nhóm liên hệ với nhau, bởi vì nó thực sự thay đổi nơi các nút thắt cổ chai nằm và điều gì là khó khăn."
Tương lai Công việc và Cấu trúc Nhóm
Bạn có nghĩ rằng quy mô nhóm sẽ nhỏ hơn rất nhiều không? Chúng ta sẽ vẫn có các kỹ sư phần mềm là con người trong một thập kỷ nữa chứ?
"Một thập kỷ là một khoảng thời gian dài từ bây giờ, và giới hạn của công nghệ này thực sự rất khó để nắm bắt. Tôi nghĩ rõ ràng là bản chất của một công ty sẽ thay đổi theo nhiều cách. Tôi nghĩ chúng ta sẽ có khả năng cho các solopreneur (doanh nhân đơn độc) xây dựng những doanh nghiệp rất đáng kinh ngạc. Và vì vậy, bất cứ ai có tầm nhìn, tôi nghĩ sẽ có thể biến nó thành hiện thực.
Tôi nghĩ những công việc mà tất cả các bạn đang làm sẽ trở nên dễ dàng hơn rất nhiều theo nhiều cách, thú vị hơn rất nhiều. Cũng có thể sẽ cạnh tranh hơn, đúng không? Bởi vì mọi người sẽ có những công cụ tuyệt vời này. Và vì vậy, thực sự tìm ra niche (thị trường ngách) của bạn là gì, góc độ độc đáo của bạn là gì, có lẽ sẽ trở thành cốt lõi quan trọng nhất.
Nhưng rất nhiều cách chúng ta vận hành các tổ chức hiện nay—và hầu như chỉ có một cách để tổ chức các nhóm người lớn với các đội, cấu trúc quản lý, phạm vi công việc và các hệ thống phân cấp—có lẽ điều đó có thể thay đổi. Có thể bạn có thể có các đội nhỏ hơn, phẳng hơn rất nhiều, có thể làm những điều đáng kinh ngạc. Giống như chúng ta đang thấy hiện nay trong toán học, nơi những cá nhân trên internet đang sử dụng GPT-4 (hoặc GPT-5) để giải quyết những bài toán chưa được giải quyết. Thông thường, bạn cần một đội toán học, và họ chỉ đang làm điều đó."
AlphaGo và Tác động đến Sự Quan tâm của Con người
"Vâng, con trai tôi là một người mê toán. Tôi vừa bảo nó có lẽ nên học thứ gì khác ngoài toán.
Nhưng, bạn thấy đấy, đây là câu hỏi, đúng không? Là nếu bạn nhìn vào một thứ gì đó như AlphaGo, bạn biết đấy, nước đi 37—nước đi này đã thay đổi hoàn toàn sự hiểu biết của nhân loại về trò chơi. Nhưng điều đáng ngạc nhiên là nó đã làm cho trò chơi trở nên thú vị và quan trọng hơn đối với con người. Và có lẽ điều đó cũng sẽ đúng với các lĩnh vực khác."
Các Lỗi Thường Gặp trong Luồng Công Việc Tác nhân
Đúng vậy. Vậy còn những chế độ lỗi thường gặp khi bạn xây dựng với luồng công việc tác nhân (agentic workflows) trong môi trường sản xuất thì sao? Bạn thấy những điều gì mà các nhà sáng lập thường mắc lỗi và xây dựng sai cách hiện nay?
"Tôi nghĩ rằng các mô hình này có sức mạnh lớn như vậy, và thực sự hiểu cách vận hành chúng tốt cần sự cân nhắc. Vì vậy, chúng tôi đã đầu tư rất nhiều vào các primitives (nguyên lý cơ bản), security primitives (nguyên lý bảo mật), observability (khả năng quan sát), và một lần nữa, có quản trị tốt, những thứ như vậy.
Nhưng chỉ để kể cho bạn một giai thoại mà tôi nghĩ rất gợi mở: tôi đã hỏi, khi tôi đang làm việc với Codex của mình. Tôi yêu cầu nó cài đặt một gói (package) mà ai đó đã viết mã nguồn mở, sau đó gặp lỗi. Tôi nói, "Ồ, ping người đó trên Slack và nhờ họ giúp đỡ." Vì vậy, nó đã ping người đó trên Slack. Hai phút sau, nó nói, "Việc này đang mất quá nhiều thời gian. Tôi đã chuyển cho quản lý của người đó." Và nó thực sự đã ping quản lý của người đó.
Và bạn nhận ra rằng, một mặt, đó là một điều hợp lý mà mô hình làm. Nó chủ động. Nó đang cố gắng giải quyết vấn đề của tôi. Nó không chỉ ngồi yên chờ được chỉ đạo. Nhưng mặt khác, có lẽ nó nên đợi lâu hơn một chút. Có lẽ nó nên hỏi ý kiến tôi. Và vì vậy, tôi nghĩ rằng việc thực sự suy nghĩ về những câu hỏi này, nơi chúng ta vẫn đang xây dựng EQ (Chỉ số cảm xúc) của mô hình, và ở một số nơi nó đang trở nên rất tốt.
Ví dụ, việc nhấp vào "chấp thuận, chấp thuận, chấp thuận" là điều mà chúng ta đã làm. Và con người cũng không giỏi về điều đó, đúng không? Họ cứ mặc định. Và vì vậy, giờ đây chúng ta bắt đầu có các Trí tuệ nhân tạo (AIs) thực sự có thể đảm nhiệm việc gắn cờ: "Đây có phải là một hành động rủi ro cao (high-risk action) không? Này, cái này nên được leo thang. Cái này có thể tự động chấp thuận (auto-approve) được."
Và điều đó thực sự khiến bạn nhận ra rằng sự chú ý của con người (human attention) sẽ trở thành một nguồn tài nguyên cực kỳ khan hiếm, đúng không? Việc thực hiện mọi thứ giờ đây dễ dàng. Việc "Đây có phải là một điều tốt không? Đây có phải là điều tôi muốn không? Điều này có phù hợp với giá trị, với mong muốn của tôi không?"—đó sẽ trở thành nút thắt cổ chai quan trọng nhất. Và vì vậy, tôi nghĩ việc xây dựng các hệ thống tính đến điều đó và thực sự suy nghĩ về yếu tố con người như vậy là điều quan trọng nhất cần làm."
Bảo mật trong Thế giới Trí tuệ nhân tạo
Bây giờ, một yếu tố con người khác: bảo mật. Bạn sẽ khuyên mọi người suy nghĩ thế nào về bảo mật trong thế giới Trí tuệ nhân tạo này? Tôi vừa nghe về các vụ vi phạm bảo mật liên tục gần đây với Vercel, và các mô hình này có khả năng đáng kinh ngạc trong việc tìm kiếm các lỗ hổng bảo mật (security holes). Vậy, bạn khuyên mọi người ở đây nên sử dụng các mô hình này như thế nào để tìm ra những vấn đề bảo mật đó?
"Tôi nghĩ có một vài cấp độ cho câu trả lời. Tôi nghĩ rằng internet đã là một nơi mà bảo mật đã trở thành một mối quan tâm quan trọng không ngừng gia tăng theo thời gian. Bạn hãy nghĩ về nơi nó bắt đầu, đi qua thập niên 90 với virus, worms (sâu máy tính) và malware (phần mềm độc hại) và chúng ta đã vượt qua điều đó.
Tôi nghĩ chúng ta cũng đang chuyển sang một chế độ bảo mật cao hơn nhiều, nhưng nó đòi hỏi một nỗ lực trên toàn internet để đạt được điều đó. Và rất nhiều điều này, thành thật mà nói, chỉ là một lần nữa dựa vào công nghệ, có những mô hình này. Chúng có thể quét codebase của bạn. Chúng thực sự có thể được sử dụng cho red teaming đầu cuối đến đầu cuối (end-to-end red teaming). Có rất nhiều điều có thể làm được với chúng.
Và rất nhiều cách chúng tôi đang suy nghĩ về các mô hình và cải tiến tiếp theo là thực sự dựa vào cách chúng tôi thực sự tận dụng chương trình truy cập đáng tin cậy (trusted access programs)? Làm thế nào chúng ta tận dụng cộng đồng những người thực sự quan tâm đến việc trở thành người bảo vệ (defenders) và làm cho internet an toàn hơn? Tôi nghĩ đó là điều mà mọi người đều có vai trò và có thể tham gia.
Nhưng điều số một chỉ là nhận ra rằng những mô hình này rất mạnh mẽ, nhưng chúng không phải là phép thuật, đúng không? Chúng chỉ là một phần của hệ sinh thái phục hồi tổng thể (overall resilience ecosystem). Và tôi nghĩ rằng chúng ta với tư cách là một xã hội, và tôi nghĩ mọi công ty một lần nữa thực sự đóng góp vào điều này, có điều gì đó để xây dựng theo cách chúng ta kết hợp chúng theo cách mang lại sự đảm bảo cao hơn và sự chắc chắn hơn về tác động của việc liệu đó có phải là một bản vá (patch) cụ thể mà bạn đang áp dụng, liệu đó có phải là việc suy nghĩ về cách bạn đảm bảo rằng bạn chỉ đang triển khai các bản cập nhật nhanh chóng khi chúng được phát hành. Vì vậy, tôi nghĩ rằng có rất nhiều việc phải làm, nhưng tôi có rất nhiều sự lạc quan về nơi điều này sẽ đến."
Thích nghi với Tốc độ Thay đổi Nhanh Chóng
"Hãy chuyển sang tốc độ. Dường như mọi thứ đang diễn ra ngày càng nhanh hơn. Chúng ta đang sống trong một thế giới của thay đổi tăng tốc (accelerating change). Chúng ta đã nói về việc bạn đang cố gắng bắt kịp mọi thứ như thế nào khi bạn đi bộ đến đây. Làm thế nào để bạn bắt kịp với tất cả những thay đổi tăng tốc này? Bạn sẽ khuyên mọi người ở đây làm thế nào để theo kịp mọi thứ đang thay đổi?
Vâng, tôi nghĩ đây là trạng thái bình thường mới, và tôi nghĩ ở một mức độ nào đó, không hẳn là vì Trí tuệ nhân tạo (AI). Tôi nghĩ đó chỉ là xu hướng công nghệ trong hai thập kỷ qua. Có nhiều người làm mọi thứ hơn. Mọi việc dễ dàng hơn bao giờ hết. Rào cản gia nhập (barrier to entry) giảm xuống, nghĩa là cũng dễ dàng hơn rất nhiều để tạo ra giá trị, đúng không? Để có được những thành công lớn.
Và vì vậy, tôi nghĩ rằng việc thực sự cố gắng lắng nghe và hiểu những gì đang thay đổi. Và ở một mức độ nào đó, nó luôn bắt đầu với cùng một điều, đó là: tự mình trải nghiệm công nghệ. Rất khác biệt khi nghe mô tả về Trí tuệ nhân tạo (AI) so với việc tự mình sử dụng nó. Nhưng điều tuyệt vời về Trí tuệ nhân tạo (AI) là nó rất trực quan (intuitive)."
Hiểu rõ model và Kỹ năng cốt lõi
Đó là toàn bộ ý nghĩa: thay vì bạn phải tự uốn mình theo máy móc, thì máy móc lại uốn mình theo bạn, đúng không? Nó đang làm việc cho bạn và nên là thứ mà bạn hỏi, rồi nó thực hiện. Và vì vậy, tôi nghĩ rằng việc cố gắng nắm bắt được những gì đang thay đổi, những gì có thể, và những điểm mà các model còn chậm. Đó, tôi nghĩ, là kỹ năng cốt lõi sẽ thực sự quyết định rất nhiều thành công của các công ty trong tương lai.
Cân bằng giữa tốc độ và trách nhiệm
Và mặt khác, các bạn đã giữ lại các
modelđể làm việc với cácagentbảo mật. Tức là ngược lại với việc đi nhanh nhất có thể. Vậy các bạn cũng đang làm mọi thứ một cách có trách nhiệm. Làm thế nào để các bạn cân bằng điều đó, vì bạn đang ở trong một môi trường cạnh tranh, muốn triển khai nhanh nhất có thể, nhưng đồng thời cũng cố gắng làm điều đúng đắn?
Vâng, tôi nghĩ ở cấp độ giá trị, điều mà OpenAI hướng tới là chúng tôi thực sự muốn đặt sức mạnh của Trí tuệ nhân tạo vào tay mọi người. Chúng tôi tin rằng mọi người có thể – chúng tôi muốn trao quyền cho mọi người xây dựng tương lai bằng các công cụ đang được tạo ra, nhưng chúng ta cần làm điều đó một cách thận trọng, đúng không? Chúng ta thực sự phải suy nghĩ về cả hai mặt: đây là lợi ích, đây là rủi ro; làm thế nào để tối đa hóa lợi ích, làm thế nào để giảm thiểu rủi ro đó? Và tôi nghĩ rằng trong an ninh mạng (cybersecurity) và an ninh sinh học (biosecurity), đó là những lĩnh vực mà chúng tôi rất thận trọng. Chúng tôi đã xây dựng và làm việc về cả các biện pháp giảm thiểu và các chương trình tiếp cận đáng tin cậy (trusted access programs) này trong một thời gian khá dài. Và điều chúng tôi thấy đang đến là các model sẽ ngày càng mạnh mẽ và có khả năng liên tục trên mọi chiều kích của khả năng.
Và, bạn biết đấy, chúng tôi đã công bố tuần trước về việc mở rộng chương trình trusted access for cyber của mình. Tiện thể, có ai ở đây đã nộp đơn chưa? Không ai à? Ồ, tôi thấy một cánh tay, hai cánh tay. Được rồi, nhiều bạn nên đăng ký đi, nó rất tuyệt. Chúng tôi thực sự cần giúp đỡ, bởi vì rất quan trọng là những người đáng tin cậy, có trách nhiệm và thực sự muốn thúc đẩy các model này phải tham gia vào chương trình, bởi vì đó là cách nó sẽ mang lại lợi ích cho tất cả mọi người. Chúng tôi sẽ có nhiều điều để thông báo hơn trong những tuần tới về cách chúng tôi mở rộng chương trình. Nhưng đồng thời, khi chúng tôi phát hành các model cho mọi người, các biện pháp giảm thiểu mà chúng tôi có và cách chúng tôi sẽ điều chỉnh chúng để thực sự cân bằng, đúng không? Để thực sự cố gắng đưa những khả năng này đến với càng nhiều người càng tốt, đồng thời đảm bảo rằng chúng tôi đang xem xét các rủi ro và có khả năng observability (khả năng quan sát) đối với chúng, và đảm bảo rằng việc triển khai này là tích cực tối đa. Vì vậy, tôi nghĩ câu trả lời ngắn gọn là: đó là cốt lõi sứ mệnh của chúng tôi. Chúng tôi rất quan tâm đến tác động của những gì chúng tôi đang làm, không chỉ đơn thuần là xây dựng công nghệ một cách biệt lập, mà đó là nỗ lực của cả cộng đồng, cả thế giới để thực sự đạt được mục tiêu chúng ta cần.
Chiến lược tập trung của OpenAI
Và bây giờ, chuyển từ các
modellên đến lớp ứng dụng (application layer), nơi mà rất nhiều người ở đây đang xây dựng. OpenAI quyết định như thế nào về những gì sẽ xây dựng trong lớp ứng dụng và những gì sẽ bỏ qua?
Vâng, có lẽ mọi người đã thấy từ 'tập trung' được áp dụng cho OpenAI khá nhiều gần đây, có thể là lần đầu tiên trong một thời gian.
Cười
Trong một thời gian.
Và...
Nó cũng đã được áp dụng cho cô ấy.
Và điều đó khó khăn, bởi vì lĩnh vực
Trí tuệ nhân tạolà một lĩnh vực đầy cơ hội, đúng không? Giống như bất cứ điều gì bạn có thể tưởng tượng đều sẽ rất tuyệt vời. Không còn nghi ngờ gì nữa, nó sẽ rất tuyệt. Và chúng tôi, với tư cách là một công ty, một công ty duy nhất, bất kể chúng tôi xây dựng bao nhiêucompute(sức mạnh tính toán), bất kể chúng tôi có bao nhiêu người, cũng chỉ có thể làm được một phần nhất định. Vì vậy, rất nhiều điều chúng tôi đã và đang suy nghĩ là chiến lược tập trung nhất nào có thể bao quát các phần của không gian, bạn biết đấy, có thể là tỷ lệ 80/20 hoặc chỉ là những phần của không gian mà chúng tôi nghĩ rằng có thể tạo ra tác động lớn nhất.
Và tôi nghĩ hiện tại rất rõ ràng, chúng ta đang trải qua quá trình chuyển đổi sang agentic transition. Vì vậy, các sản phẩm đang... và nó không chỉ là về enterprise (doanh nghiệp) so với consumer (người tiêu dùng), đúng không? Rõ ràng là chúng tôi đang rất nghiêm túc về enterprise, chúng tôi đang bán hàng cho các công ty lớn và xây dựng một muscle (cơ chế) và sales motion (động thái bán hàng) ở đó. Nhưng consumer, consumer sẽ thay đổi, đúng không? Đó là một thuật ngữ rất rộng bao gồm nhiều thứ. Nhưng cái phần của consumer không chỉ về năng suất mà còn về mục tiêu, về việc đạt được mục tiêu của bạn, thậm chí là biết mục tiêu của bạn là gì, có thể khơi gợi điều đó và có một Trí tuệ nhân tạo có thể chủ động làm điều đó. Tất cả đều là một thứ.
Cuối cùng, chúng tôi đang cố gắng xây dựng một AGI (Trí tuệ nhân tạo tổng quát) mà bạn có thể nói chuyện, có tất cả ngữ cảnh này mà bạn có thể sử dụng trong cuộc sống cá nhân, công việc của bạn, và nó đáng tin cậy, đúng không? Mà bạn có thể tìm đến để xin lời khuyên và nó sẽ cung cấp cho bạn thông tin hữu ích, có thể là thông tin sức khỏe hoặc về tài chính, hoặc bạn biết đấy, về việc bạn đang cố gắng tìm ra việc phải làm với sự nghiệp của mình. Tất cả những điều này đều dẫn đến một mục tiêu duy nhất và điều đó có nghĩa là chúng tôi phải đưa ra một số quyết định rất đau đớn về những gì không nên làm, nhưng tôi nghĩ tôi chỉ muốn nói rằng đó là tầm nhìn mà chúng tôi nhìn nhận mọi thứ, và những điều phù hợp với tầm nhìn đơn nhất về những gì chúng tôi muốn xây dựng, bạn nên mong đợi chúng tôi sẽ theo đuổi.
Tương lai của công việc và tương tác với Trí tuệ nhân tạo
Hiểu rồi. Bạn có nghĩ rằng trong vài năm nữa, chúng ta sẽ lập trình với
command lines(dòng lệnh) vàagent(tác nhân), hay mọi thứ sẽ thay đổi hoàn toàn?
Ý tôi là, tôi nghĩ rằng chúng ta đang ở một trạng thái rất không tự nhiên về cách chúng ta làm việc. Chúng ta đều ngồi sau chiếc hộp này và gõ phím. Rõ ràng là cơ thể chúng ta không được thiết kế cho điều này. Chúng ta bị hội chứng ống cổ tay (carpal tunnel) và, bạn biết đấy, vai gù và đủ thứ. Và tôi không nghĩ chúng ta muốn điều đó. Tôi không nghĩ bất kỳ ai trong chúng ta muốn điều đó. Tôi nghĩ rằng chúng ta...
Muốn có nhiều thời gian rảnh hơn.
Chúng ta muốn nhiều hơn. Nhưng không nhất thiết là về thời gian rảnh, đúng không? Giống như bạn muốn dành nhiều thời gian hơn cho những người thân yêu của mình. Vâng. Bạn muốn dành nhiều thời gian hơn để nói chuyện với mọi người và đưa ra những ý tưởng tuyệt vời, hoặc chỉ là những gì bạn đam mê, hoặc chỉ là hiểu bản thân mình. Vì vậy, có lẽ bạn muốn trở thành CEO của một tổ chức gồm 100.000 agent? Điều đó thực sự có vẻ khá tốt. Và tôi nghĩ rằng tất cả chúng ta sẽ có thể hoàn thành nhiều việc hơn. Nhưng cơ chế của nó sẽ khác biệt như việc từ việc phải viết mọi thứ bằng tay với bút lông ngỗng hoặc thứ gì đó, đến việc có thể chỉ cần gửi một tin nhắn văn bản và nhờ người khác thực hiện công việc thay mặt bạn để đạt được mục tiêu của bạn.
Trí tuệ nhân tạo và các ranh giới khoa học
Được rồi, chúng ta đã nói về
compute, chúng ta đã nói vềmodel, an ninh,agentvà lớp ứng dụng. Hãy nói về ranh giới mới (frontier). Khi nào cácmodelsẽ đủ tốt để thúc đẩy các ranh giới của khoa học,Trí tuệ nhân tạovật lý (physical AI)? Có vẻ như chúng ta đã có Jen Fam ở đây. Có vẻ như cácLLMđã là một luậtscaling law(luật mở rộng quy mô) tuyệt vời chodigital intelligence(trí tuệ kỹ thuật số). Nó chưa mạnh mẽ như vậy đối với robot học, đối vớiphysical intelligence(trí tuệ vật lý), đối với các khía cạnh của sinh học và khoa học mà các vấn đề có lẽ khó xác minh hơn nhiều hoặc mất nhiều thời gian để xác minh. Vậy, bạn đang theo dõi khoa học vàphysical AItrong thế giới như thế nào?
Vâng, khoa học là một lĩnh vực mà chúng tôi thực sự đang dồn lực vào và chúng tôi thấy có triển vọng đạt được những tiến bộ thực sự đáng kinh ngạc. Và chúng tôi bắt đầu thấy một số dấu hiệu của sự sống, và tôi nghĩ điều quan trọng là phải luôn dựa vào những gì đang xảy ra hôm nay khi cố gắng dự đoán điều gì sẽ xảy ra trong sáu tháng, một năm tới. Ví dụ, chúng tôi đã có một kết quả vật lý, trong đó Trí tuệ nhân tạo của chúng tôi đã đưa ra một công thức rất đẹp mà các nhà vật lý đã làm việc về vấn đề này trong một thời gian khá dài cho rằng hoàn toàn bất khả thi. Họ nghĩ đó có thể là một vấn đề không thể giải quyết được, và nó khá quan trọng, đúng không? Giống như những nhà vật lý thực sự nghiêm túc, những người thực sự xem đây là một bước tiến để thực sự có thể đạt được một loại câu trả lời nào đó cho trọng lực lượng tử (quantum gravity) và tất cả những điều này. Chưa đạt được, nhưng đó là một bước tiến lớn hơn rất nhiều so với vị trí của chúng tôi chỉ vài tháng trước, và vì vậy nó khiến bạn thực sự tự hỏi một năm nữa chúng ta sẽ đi được bao xa.
Hiện tại, những thứ như sinh học thì khác với vật lý và toán học, đúng không? Bạn phải rời bỏ thế giới mô phỏng (simulated world) tuyệt đẹp của mình và, bạn biết đấy, đối phó với thực tế hỗn độn. Nhưng tôi nghĩ chúng tôi đã học cách đối phó với thực tế hỗn độn trong các lĩnh vực khác, kỹ thuật phần mềm là một ví dụ hoàn hảo, nơi chúng tôi thực sự nhận ra rằng chỉ xây dựng thứ giải quyết các cuộc thi lập trình là không đủ. Bạn cần một thứ đã thấy các code base thực tế, lộn xộn, con người can thiệp theo nhiều cách khác nhau, như việc adversarial banging (tấn công đối kháng) vào nó. Và vì vậy, tôi nghĩ rằng về khoa học, tôi kỳ vọng chúng ta sẽ thấy một thời kỳ phục hưng thực sự. Bạn biết đấy, có thể chúng ta sẽ thấy một số kết quả lớn trong năm nay. Năm tới, tôi nghĩ sẽ là một khoảng thời gian cực kỳ hoang dã (wild wild time).
Thư giãn sau AGI
Chúng ta đang sống trong những thời điểm thú vị. Tôi hứa sẽ để bạn đi đúng giờ vì bạn là một người bận rộn. Trước khi chúng tôi để bạn rời đi, chúng ta còn một phút. Khi bạn không có thời gian nhưng sớm sẽ có rất nhiều thời gian. Bạn và Anna làm gì để giải trí?
Ồ, giải trí ư? Ý tôi là, giống như bất kỳ ai khác thôi: thích xem phim, đi bộ đường dài (hikes), những thứ tương tự. Chúng tôi không có nhiều thời gian cho những việc đó như có lẽ chúng tôi sẽ có sau khi AGI ra đời. Nhưng bạn phải tận hưởng cuộc hành trình trên đường đi.
Cảm ơn Greg đã tham gia cùng chúng tôi. Cảm ơn tất cả mọi người.
TL;DR
- OpenAI hoạt động với mô hình kinh doanh đơn giản nhưng tham vọng: mua, thuê, xây dựng tài nguyên tính toán (
compute) và bán lại để đáp ứng nhu cầu vô hạn về trí tuệ nhân tạo, dù họ liên tục thiếu nguồn lực này. - Các "định luật mở rộng" (
scaling laws) cho mạng lưới thần kinh tiếp tục có hiệu lực một cách đáng ngạc nhiên, cho phép các mô hình AI trở nên mạnh mẽ hơn tỷ lệ thuận với lượng tài nguyên tính toán đầu vào mà không có giới hạn rõ ràng. - Các mô hình AI hiện tại có khả năng cao, thậm chí vượt trội con người trong việc lập trình, yêu cầu các công ty khởi nghiệp tận dụng tối đa "công cụ tác nhân" (
agentic tools) và đầu tư vào việc cung cấp "ngữ cảnh" (context) đầy đủ cho AI.
Điểm chính
- Tài nguyên tính toán là trọng tâm: Mô hình kinh doanh của OpenAI xoay quanh việc đảm bảo và phân phối tài nguyên tính toán, nhấn mạnh rằng đây là nút thắt cổ chai và tài sản chiến lược quan trọng nhất trong phát triển AI.
- Định luật mở rộng tiếp tục đúng: Khả năng của các mô hình AI tăng lên đáng kể khi được cung cấp thêm tài nguyên tính toán, cho thấy tiềm năng phát triển không ngừng bằng cách tăng quy mô cơ sở hạ tầng.
- Đổi mới liên tục trong kiến trúc và thuật toán: Ngoài việc mở rộng quy mô các ý tưởng cũ, sự tiến bộ còn đến từ các đổi mới nhỏ (
micro tweaks), chuyển đổi mô hình kiến trúc (paradigm shifts) như Transformer, và nghiên cứu dài hạn về thuật toán. - AI vượt trội trong lập trình: Các mô hình AI hiện tại (ví dụ: GPT 5.4) đã có khả năng đáng kinh ngạc trong việc viết phần mềm, tối ưu hóa hệ thống phức tạp và tự động hóa các tác vụ kỹ thuật cấp thấp.
- "Ngữ cảnh" là khoản đầu tư then chốt: Các công ty khởi nghiệp nên tập trung vào việc đảm bảo AI có đủ ngữ cảnh về các hoạt động của người dùng và hệ thống để có thể giải quyết vấn đề hiệu quả mà không cần giải thích liên tục.
- Tận dụng tối đa công cụ tác nhân: Các công cụ lập trình tác nhân (
agentic coding tools) đang nhanh chóng chuyển từ hỗ trợ 20% sang 80% công việc viết mã, trở thành yếu tố cốt lõi trong quy trình phát triển. - Tái cấu trúc tổ chức trong kỷ nguyên AI: Chi phí tạo nguyên mẫu (
prototype) giảm đáng kể, thúc đẩy sự cần thiết của quản trị (governance) tốt hơn, đặc biệt về nguồn gốc dữ liệu (data provenance) và theo dõi các tạo phẩm phái sinh (derived artifacts). - Tương lai của công việc với AI: AI sẽ tạo ra một kỷ nguyên mới cho "doanh nhân đơn độc" (
solopreneur), làm cho công việc thú vị hơn nhưng cũng cạnh tranh hơn, và có thể dẫn đến các đội nhóm nhỏ hơn, phẳng hơn.
Từ vựng
Compute— Tài nguyên tính toánScaling Laws— Định luật mở rộngNeural Networks— Mạng lưới thần kinhAGI— Trí tuệ nhân tạo tổng quátContext— Ngữ cảnhAgentic Tools/Workflows— Công cụ/luồng công việc tác nhânCodex— Codex (công cụ lập trình AI)Data Provenance— Nguồn gốc dữ liệuSolopreneur— Doanh nhân đơn độc
Nội dung chi tiết
Giới Thiệu và Vai Trò
Greg, cảm ơn anh đã quay lại đây. Tôi không nghĩ chúng tôi đã tính phí thuê chỗ của anh bao giờ, nên có lẽ chúng tôi sẽ gửi hóa đơn sau. Nhưng Greg, anh đã là một phần của hai công ty thực sự ấn tượng. Stripe với tư cách là nhân viên số bốn và sau đó là CTO đầu tiên. Tôi mới đây nghe nói rằng họ xử lý 1.6% tổng GDP toàn cầu. Anh chắc hẳn phải rất tự hào về điều đó.
Greg: Thật tuyệt vời. Anh hẳn còn tự hào hơn nữa khi OpenAI hiện có gần một tỷ hoặc có thể hơn một tỷ người dùng hoạt động hàng tuần.
Người phỏng vấn: Tôi nghĩ tất cả đều rất thú vị. Điều đó cho thấy công nghệ có thể làm được những gì. Và anh không chỉ là đồng sáng lập và chủ tịch, mà còn là "kiến trúc sư trưởng" (chief builder) tại OpenAI. Tôi nghe nói đó là một trong những chức danh của anh.
Greg: Tôi không chắc đó có phải là một chức danh chính thức hay không, nhưng tôi đã được gọi bằng nhiều tên khác. Cứ cho là vậy đi.
Người phỏng vấn: Anh đang có một lượng khán giả gồm những nhà xây dựng (builder) tuyệt vời ở đây. Vì vậy, chúng ta sẽ bắt đầu từ phần dưới cùng của Software Stack. OpenAI có nhiều stack trong hoạt động kinh doanh, một trong số đó là compute. Và các bạn đã rất quyết liệt, rất quyết liệt trong việc đảm bảo compute. Tại sao vậy?
Nhu Cầu Tính Toán (Compute) Không Giới Hạn
Greg: Về nhiều mặt, chúng tôi có một mô hình kinh doanh rất đơn giản. Chúng tôi mua, thuê, xây dựng compute và bán lại với một biên lợi nhuận. Chỉ vậy thôi. Miễn là biên lợi nhuận dương, thì bạn muốn mở rộng quy mô nó, bởi vì nhu cầu giải quyết vấn đề, nhu cầu về trí tuệ nhân tạo, là vô hạn. Và các AI mà chúng tôi có hiện nay thực sự có thể đáp ứng thách thức của bất kỳ loại vấn đề nào mà bạn muốn giao cho chúng.
Người phỏng vấn: Các bạn có đủ compute không?
Greg: Không.
Người phỏng vấn: Thật sao?
Greg: Vâng, chắc chắn là không.
Người phỏng vấn: Tôi vừa nói chuyện với Matt Garman và anh ấy nói rằng tính khả dụng của GPU compute vào năm 2026 sẽ về 0. Các bạn không có tất cả sao?
Greg: Ý tôi là, chúng tôi, chúng tôi rất muốn có thêm. Thành thật mà nói, chúng tôi liên tục tìm kiếm thêm compute. Và tôi sẽ kể cho anh nghe, khi chúng tôi lần đầu ra mắt ChatGPT, tôi nhớ mình đã có một cuộc gọi với nhóm và họ hỏi: "Được rồi, chúng ta nên mua bao nhiêu compute?" Và tôi nói: "Mua tất cả." Và họ nói: "Không, không, không, nghiêm túc đấy, chúng ta nên mua bao nhiêu?" Tôi nói: "Dù chúng ta có cố gắng tăng cường compute nhanh đến đâu, tôi đảm bảo chúng ta sẽ không thể đáp ứng được nhu cầu." Và điều đó đã đúng kể từ đó.
Kiến Trúc và Định Luật Mở Rộng (Scaling Laws)
Người phỏng vấn: Ừm, điều đó thật hấp dẫn. Chuyển sang phần compute, vì tôi không biết liệu phần lớn khán giả này có thể giúp các bạn đảm bảo thêm compute hay không, vì hầu hết họ là những nhà sáng lập startup. Về kiến trúc và scaling laws (định luật mở rộng), chúng ta đang ở đâu trong các scaling laws? Chúng vẫn tăng gấp đôi mỗi năm ư? Các bạn đang thay đổi kiến trúc chứ? Các bạn đang đẩy mạnh những gì ở ranh giới nghiên cứu?
Greg: Vâng, tôi sẽ nói trước hết là các scaling laws là một bí ẩn sâu sắc và rất đẹp. Chúng có vẻ rất cơ bản. Giống như một chân lý khoa học mà bạn nghĩ về vật lý, luật Newton và những thứ tương tự, chúng bằng cách nào đó là một chân lý của vũ trụ và chúng mang tính thực nghiệm. Chúng ta không nhất thiết phải có tất cả lý thuyết để giải thích chính xác tại sao chúng hoạt động. Nhưng đối với tôi, điều tuyệt vời nhất là mạng lưới thần kinh (neural networks) thực sự được thiết kế từ những năm 1940, trước khi có máy tính. Và bằng cách nào đó, chúng ta đã có thể lấy những ý tưởng chính xác được phát triển từ thời đó và áp dụng lượng tính toán (computation) ngày càng tăng, và khi bạn đổ nhiều compute hơn vào các mô hình, chúng trở nên có khả năng hơn tương ứng và nó cứ tiếp tục như vậy. Không có bức tường nào cả. Và đó, tôi nghĩ đó là một điều tuyệt vời.
Người phỏng vấn: Điều đó khá tuyệt. Có thêm nghiên cứu hoặc thuật toán nào đang được triển khai không, bởi vì, như anh đã nói, trong quá khứ chúng ta có mạng lưới thần kinh vào những năm 1940 nhưng chúng ta không có compute cho nó. Bây giờ chúng ta có compute rồi, chúng ta chỉ đang đẩy mạnh những thứ cũ hay có những kiến trúc và ý tưởng mới đang xuất hiện?
Greg: Vâng. Vì vậy, tôi sẽ nghĩ rằng chúng tôi hoàn toàn có những ý tưởng mới liên tục thúc đẩy những gì chúng tôi làm. Sẽ rất đơn giản hóa nếu nói, à, chúng ta hãy lấy một mạng lưới thần kinh từ những năm 1940 và đặt nó vào một trung tâm dữ liệu gigawatt, đúng không? Chúng tôi đã tạo ra rất nhiều đổi mới và chúng tôi liên tục cải thiện mọi thứ. Và đôi khi đây là những micro tweaks (điều chỉnh nhỏ), ví dụ bạn nhận ra cách bạn đã định dạng dữ liệu không hoàn toàn đúng và điều đó thực sự có thể rất quan trọng. Đôi khi nó lớn hơn. Bạn nghĩ về sự chuyển đổi từ LSTM sang Transformer, và tôi không nghĩ Transformer là, bạn biết đấy, mọi người đã vượt qua Transformer như được mô tả trong bài báo năm 2018. Vì vậy, luôn có sự đổi mới liên tục diễn ra, và tôi nghĩ về những nơi có lẽ đã đầu tư nhiều nhất vào nghiên cứu dài hạn về cách cải thiện kiến trúc, cách cải thiện các thuật toán cơ bản và cách tạo ra các paradigm shifts (chuyển đổi mô hình). Tôi nghĩ OpenAI đã dẫn đầu trong lĩnh vực đó và đó là điều chúng tôi tiếp tục đầu tư và tôi thấy rất nhiều thành quả hứa hẹn ở phía trước. Được rồi.
Định Nghĩa AGI và Khả Năng Hiện Tại Của Mô Hình
Người phỏng vấn: Và về các mô hình, OpenAI có định nghĩa chính thức cho AGI không? Chúng ta có gần đạt được nó không? Hay không? Pat và Sonia đã công bố rằng chúng ta đã đạt đến AGI về mặt chức năng. Anh có đồng ý với điều đó không? Anh có không đồng ý không?
Greg: Vâng, chúng tôi có một định nghĩa chính thức, nhưng ở một mức độ nào đó, một điều tôi đã học được là mọi người đều có những nhận định riêng về AGI là gì. Và có lẽ anh có thể coi nó như, theo quan điểm của tôi về vị trí hiện tại của chúng ta, tôi nghĩ chúng ta đã đi được khoảng 80% chặng đường ở chỗ chúng ta có những mô hình thông minh. Chúng rất có khả năng. Chúng có thể, nếu bạn cung cấp...
Người phỏng vấn: Chúng có thông minh hơn anh không?
Greg: Ý tôi là, chúng chắc chắn có khả năng hơn tôi trong việc viết phần mềm, đúng không? Nếu bạn cung cấp cho nó tất cả ngữ cảnh, thì vâng, tôi, tôi, tôi nghĩ rằng chúng rất có khả năng. Thật sự đáng kinh ngạc. Ví dụ, có ai ở đây cảm thấy mình viết phần mềm tốt hơn GPT 5.4 không?
Người phỏng vấn: Ồ!
Greg: Được rồi. Viết kernel. Ừm, ngay cả ở đó chúng ta cũng thấy những tiến bộ lớn từ. Chính xác. Và đối với một số kết quả nội bộ của chúng tôi, ở đó chúng tôi thực sự thấy rằng nếu bạn cung cấp đúng loại, bạn biết đấy, nếu bạn có thiết lập phù hợp cho vấn đề của mình, thì bạn có thể đạt được những kết quả thực sự lớn từ những tác vụ rất cấp thấp, thậm chí là tác vụ cấp thấp. Và chỉ để đưa ra một ví dụ về xu hướng phát triển, một trong những kỹ sư hệ thống của tôi cũng tương tự nói rằng: "Này, tôi đã không thể nhận được giá trị từ các mô hình GPT 5 cho 5.1, cho 5.2 cũng như cho 5.3." Anh ấy đã chuẩn bị một tài liệu thiết kế cho một tối ưu hóa hệ thống rất phức tạp mà anh ấy sắp thực hiện. Anh ấy đưa nó cho mô hình, đi ngủ, thức dậy với ý định giao việc này cho nhóm của mình làm trong tuần tới, và khi anh ấy thức dậy, nó đã hoàn thành. Mô hình đã thực sự triển khai thông số kỹ thuật ban đầu, đã nhận thấy nó chậm, đã thêm instrumentation (công cụ đo đạc), đã thực sự chạy mã, sử dụng profiler (công cụ phân tích hiệu suất) để tìm ra những điểm chậm và lặp lại nhiều lần cho đến khi đạt được kết quả được tối ưu hóa. Và điều đó thật đáng kinh ngạc. Đó là nơi chúng ta đang ở.
Lời Khuyên Cho Các Startup: Tận Dụng AI và Cung Cấp Ngữ Cảnh
Người phỏng vấn: Vậy thì anh sẽ khuyên tất cả các startup ở đây nên làm gì, bởi vì các mô hình ngày càng trở nên có khả năng hơn? Tôi đã hỏi Sam về điều này trong quá khứ, và bạn biết đấy, nếu bạn đang xây dựng hôm nay, bạn có cần phải xây dựng lại trong hai năm nữa khi một mô hình mới ra mắt không, bởi vì tất cả chức năng và khả năng đều thay đổi xung quanh bạn. Ừm, bạn có cần đảm bảo rằng bạn không cản đường OpenAI không, bởi vì các bạn sẽ vượt qua các startup vì các mô hình có khả năng hơn rất nhiều. Ừm, anh sẽ khuyên một nhóm các nhà sáng lập startup xây dựng trong môi trường này như thế nào?
Greg: Vâng, trước hết, tôi sẽ nói rằng hãy tận dụng tối đa công cụ. Các công cụ hiện nay đã trở nên vô cùng hữu ích. Và nếu bạn nhìn vào ngay cả trong tháng 12, tôi nghĩ rằng chúng ta đã đi từ những công cụ lập trình tác nhân (agentic coding tools) kiểu như, bạn biết đấy, chúng viết 20% mã của bạn, đến việc viết 80% mã của bạn, điều đó có nghĩa là chúng chuyển từ việc chỉ là một phần phụ trợ sang là thứ chính mà bạn đang làm. Và tôi nghĩ chúng ta sẽ làm điều đó trên tất cả các công việc mà mọi người làm với máy tính, tất cả các công việc máy tính trong năm nay. Và bạn có thể nhìn vào những tiến bộ gần đây về Codecs, thực sự thay đổi từ một công cụ dành cho kỹ sư phần mềm sang một công cụ cho bất kỳ ai làm việc với máy tính. Và chỉ trong tuần qua, chúng tôi đã phát hành một loạt các tính năng giúp nó mạnh mẽ và có khả năng hơn rất nhiều. Ừm, và một điều chúng tôi vừa công bố hôm nay là một công cụ mới có tên là Chronicle tích hợp vào Codecs, nơi nó thực sự có thể nhìn thấy mọi thứ bạn đang làm với máy tính của mình và có thể hình thành ký ức về những gì đang diễn ra. Và vì vậy, bạn hỏi nó một câu hỏi, nó sẽ ngay lập tức biết bạn đang nói về điều gì. Bạn hỏi: "À, năm phút trước tôi đang làm gì?" Nó biết, đúng không? Bạn hỏi: "Ồ, người này đang nói về cái gì?" Nó biết. Đối với tôi, đó là một tiếng chuông cảnh tỉnh thực sự để nhận ra rằng bạn dành rất nhiều công sức hiện nay chỉ để giải thích cho máy tính của mình những gì đang diễn ra. Tại sao bạn lại giải thích cho máy tính của mình những gì đang diễn ra? Điều đó không có lý.
Và vì vậy, tôi nghĩ điều sẽ xảy ra trong những năm tới là các mô hình sẽ trở nên có khả năng hơn nhiều. Chúng ta sẽ có những bộ harness (công cụ hỗ trợ) tốt hơn. Chúng ta sẽ có thể giải quyết những vấn đề ngày càng khó hơn, tạo ra kiến thức mới, tất cả những điều này. Nhưng có một sự thay đổi diễn ra một lần đang xảy ra hiện nay, thực sự là về ngữ cảnh (context). Nó thực sự là về việc AI của bạn có thể... bạn có tất cả những cuộc họp này, bạn không bao gồm AI, bạn biết đấy, điều đó không tử tế lắm với AI. Giống như bạn đang yêu cầu nó giúp bạn những việc mà nó không có thông tin. Vì vậy, tôi nghĩ thực sự hãy tập trung vào cách bạn đảm bảo AI thậm chí có đủ thông tin trên lý thuyết để giải quyết vấn đề, và sau đó tin tưởng rằng các mô hình sẽ thực sự đạt được điều đó và cải thiện. Vì vậy, tôi nghĩ đó sẽ là một chu kỳ cải tiến và lặp lại liên tục và tận dụng các công cụ và nói chuyện với bạn bè để tìm hiểu cách họ đang sử dụng nó. Nhưng có một khoản đầu tư là đầu tư một lần mà bây giờ là thời điểm để thực hiện.
Cách OpenAI Sử Dụng Codex
Cách OpenAI đang sử dụng Codex có gì khác biệt so với cách mọi người bên ngoài đang dùng nó?
"Một trong những điều tuyệt vời khi làm việc tại OpenAI là bạn được sống trong tương lai. Bạn thực sự được nhìn thấy hình dạng của những gì đang nổi lên, và chúng ta có thể đồng thiết kế. Chúng tôi có thể thực sự thay đổi các mô hình, kết hợp mọi thứ lại với nhau để phục vụ tốt hơn các nhu cầu mà chúng tôi nhận thấy.
Rất nhiều phương pháp tiếp cận mà chúng tôi đã thực hiện là: chúng tôi bắt đầu với kỹ thuật phần mềm và đặt ra một số nguyên tắc rõ ràng. Chẳng hạn, chúng tôi vẫn muốn con người phải chịu trách nhiệm về tất cả các mã được hợp nhất. Vì vậy, cuối cùng, việc hợp nhất đoạn mã này có phải là một điều tốt không? Nó có được cấu trúc tốt không? Nó có làm cho codebase của chúng tôi dễ bảo trì hơn không? Chúng tôi muốn đảm bảo có một con người ký duyệt. Và đó, tôi nghĩ, là sự thận trọng, không chỉ nói, "Ồ, Codex, cứ sử dụng cái này một cách mù quáng" hay "Ồ, chúng tôi hoàn toàn không muốn sử dụng cái này." Tôi nghĩ cả hai thái cực đều không hoàn toàn đúng.
Sau đó, chúng tôi cũng đang đi theo từng lĩnh vực chuyên môn dọc (vertical by vertical) trong OpenAI để áp dụng các công cụ này: trong tài chính, trong kinh doanh, trong CNTT. Ở đó, chúng tôi có một đội ngũ nhỏ chuyên trách, những người thực sự hiểu sâu về lĩnh vực đó, làm việc với những chuyên gia để xây dựng các kỹ năng, để sửa đổi giao diện Codex UI — bất cứ điều gì cần thiết để làm cho nó tốt. Và đó là điều mà chúng tôi có thể làm, một khi nó ở trạng thái tốt, chúng tôi sẽ triển khai ra bên ngoài (externalize). Và chúng tôi có thể gửi nó đến tất cả các bạn. Vì vậy, chúng tôi cũng đang bắt đầu làm việc với một số khách hàng nhất định. Đối với những người muốn đi đầu về Trí tuệ nhân tạo (AI forward) và muốn trở thành một phần của việc định nghĩa cuộc cách mạng này, thì có một vị trí cho điều đó. Tôi rất muốn thảo luận sau. Nhưng vâng, tôi nghĩ rằng mong muốn này là, "Này, chúng tôi thực sự muốn đi đầu về Trí tuệ nhân tạo, thực sự sống trong tương lai và trải nghiệm nó sẽ như thế nào đối với mọi người khác trong một năm, hai năm, ba năm tới."
Tái cấu trúc Tổ chức trong Kỷ nguyên Trí tuệ nhân tạo
Các bạn có cấu trúc công ty hay các nhóm kỹ thuật khác đi vì việc "sống trong tương lai" không? Ý tôi là, nếu quay ngược thời gian, khi cha tôi học khoa học máy tính, ông ấy chỉ là một mình. Sau đó, chúng ta có những bản phát hành phần mềm dài hơi theo mô hình waterfall. Rồi khi web và điện toán đám mây xuất hiện, chúng ta có các two-pizza team và phương pháp scrum. Giờ đây, khi có các tác nhân lập trình (coding agents), các bạn cấu trúc mọi thứ khác đi như thế nào?
"Tôi nghĩ chúng tôi vẫn đang tìm hiểu, và có những nơi bạn thực sự thấy được điều đó. Ví dụ, chi phí để xây dựng một prototype giờ đây rất rẻ. Thật sự rất rẻ. Và nếu bạn muốn xây dựng một dashboard mà trước đây phải mất một tuần để hoàn thành, giờ bạn chỉ cần làm nó ngay lập tức. Và thực tế, rất nhiều nút thắt cổ chai đã chuyển sang những thứ như chia sẻ. Làm thế nào để... Và vì vậy, chúng tôi thực sự có một số công việc nội bộ về vấn đề này, mà một lần nữa, chúng tôi sẽ triển khai ra bên ngoài: Làm thế nào để mọi người trong doanh nghiệp của bạn có thể dễ dàng xây dựng một dashboard, một widget, một bot – bất kể là gì – và sau đó chia sẻ nó với người khác?
Và điều đó bắt đầu tạo áp lực lên việc có một quản trị (governance) tốt. Ví dụ, bạn muốn tổ chức CNTT của mình có thể nhìn thấy tất cả các luồng thực thi đang diễn ra, tất cả những điều nhỏ nhặt đang được chia sẻ. Bạn muốn có một số quyền kiểm soát đối với nguồn gốc dữ liệu (data provenance), đúng không? Để thực sự đảm bảo rằng... Một ví dụ điển hình là, tôi nghĩ mọi người hiện đang bắt đầu biến các kho kiến thức nội bộ của họ thành các wiki. Chúng tôi có một hệ thống wiki rất hay như vậy trong nội bộ. Và điều bạn nghĩ ngay lập tức là, nếu ai đó có một tài liệu trong cơ sở kiến thức nội bộ mà vô tình bị cấp quyền sai, và họ nhận ra, "Ôi không, tôi không muốn thông tin này được truy cập." Làm thế nào để họ khắc phục điều đó? Thông thường, họ vào tài liệu, thay đổi quyền. Nhưng giờ đây, có những tạo phẩm phái sinh (derived artifacts). Và vì vậy, bạn cần đảm bảo có một cách nào đó để theo dõi qua hệ thống để nói rằng, "Tài liệu đầu ra này đến từ nguồn kia. Nguồn đó không còn truy cập được đối với đối tượng này. Hãy đi và hủy bỏ nó luôn." Và vì vậy, bạn phải bắt đầu thực sự xây dựng kiến trúc kỹ thuật của mình với nhận thức về cách mọi người sẽ sử dụng thông tin này. Và nó thực sự thay đổi cách các nhóm liên hệ với nhau, bởi vì nó thực sự thay đổi nơi các nút thắt cổ chai nằm và điều gì là khó khăn."
Tương lai Công việc và Cấu trúc Nhóm
Bạn có nghĩ rằng quy mô nhóm sẽ nhỏ hơn rất nhiều không? Chúng ta sẽ vẫn có các kỹ sư phần mềm là con người trong một thập kỷ nữa chứ?
"Một thập kỷ là một khoảng thời gian dài từ bây giờ, và giới hạn của công nghệ này thực sự rất khó để nắm bắt. Tôi nghĩ rõ ràng là bản chất của một công ty sẽ thay đổi theo nhiều cách. Tôi nghĩ chúng ta sẽ có khả năng cho các solopreneur (doanh nhân đơn độc) xây dựng những doanh nghiệp rất đáng kinh ngạc. Và vì vậy, bất cứ ai có tầm nhìn, tôi nghĩ sẽ có thể biến nó thành hiện thực.
Tôi nghĩ những công việc mà tất cả các bạn đang làm sẽ trở nên dễ dàng hơn rất nhiều theo nhiều cách, thú vị hơn rất nhiều. Cũng có thể sẽ cạnh tranh hơn, đúng không? Bởi vì mọi người sẽ có những công cụ tuyệt vời này. Và vì vậy, thực sự tìm ra niche (thị trường ngách) của bạn là gì, góc độ độc đáo của bạn là gì, có lẽ sẽ trở thành cốt lõi quan trọng nhất.
Nhưng rất nhiều cách chúng ta vận hành các tổ chức hiện nay—và hầu như chỉ có một cách để tổ chức các nhóm người lớn với các đội, cấu trúc quản lý, phạm vi công việc và các hệ thống phân cấp—có lẽ điều đó có thể thay đổi. Có thể bạn có thể có các đội nhỏ hơn, phẳng hơn rất nhiều, có thể làm những điều đáng kinh ngạc. Giống như chúng ta đang thấy hiện nay trong toán học, nơi những cá nhân trên internet đang sử dụng GPT-4 (hoặc GPT-5) để giải quyết những bài toán chưa được giải quyết. Thông thường, bạn cần một đội toán học, và họ chỉ đang làm điều đó."
AlphaGo và Tác động đến Sự Quan tâm của Con người
"Vâng, con trai tôi là một người mê toán. Tôi vừa bảo nó có lẽ nên học thứ gì khác ngoài toán.
Nhưng, bạn thấy đấy, đây là câu hỏi, đúng không? Là nếu bạn nhìn vào một thứ gì đó như AlphaGo, bạn biết đấy, nước đi 37—nước đi này đã thay đổi hoàn toàn sự hiểu biết của nhân loại về trò chơi. Nhưng điều đáng ngạc nhiên là nó đã làm cho trò chơi trở nên thú vị và quan trọng hơn đối với con người. Và có lẽ điều đó cũng sẽ đúng với các lĩnh vực khác."
Các Lỗi Thường Gặp trong Luồng Công Việc Tác nhân
Đúng vậy. Vậy còn những chế độ lỗi thường gặp khi bạn xây dựng với luồng công việc tác nhân (agentic workflows) trong môi trường sản xuất thì sao? Bạn thấy những điều gì mà các nhà sáng lập thường mắc lỗi và xây dựng sai cách hiện nay?
"Tôi nghĩ rằng các mô hình này có sức mạnh lớn như vậy, và thực sự hiểu cách vận hành chúng tốt cần sự cân nhắc. Vì vậy, chúng tôi đã đầu tư rất nhiều vào các primitives (nguyên lý cơ bản), security primitives (nguyên lý bảo mật), observability (khả năng quan sát), và một lần nữa, có quản trị tốt, những thứ như vậy.
Nhưng chỉ để kể cho bạn một giai thoại mà tôi nghĩ rất gợi mở: tôi đã hỏi, khi tôi đang làm việc với Codex của mình. Tôi yêu cầu nó cài đặt một gói (package) mà ai đó đã viết mã nguồn mở, sau đó gặp lỗi. Tôi nói, "Ồ, ping người đó trên Slack và nhờ họ giúp đỡ." Vì vậy, nó đã ping người đó trên Slack. Hai phút sau, nó nói, "Việc này đang mất quá nhiều thời gian. Tôi đã chuyển cho quản lý của người đó." Và nó thực sự đã ping quản lý của người đó.
Và bạn nhận ra rằng, một mặt, đó là một điều hợp lý mà mô hình làm. Nó chủ động. Nó đang cố gắng giải quyết vấn đề của tôi. Nó không chỉ ngồi yên chờ được chỉ đạo. Nhưng mặt khác, có lẽ nó nên đợi lâu hơn một chút. Có lẽ nó nên hỏi ý kiến tôi. Và vì vậy, tôi nghĩ rằng việc thực sự suy nghĩ về những câu hỏi này, nơi chúng ta vẫn đang xây dựng EQ (Chỉ số cảm xúc) của mô hình, và ở một số nơi nó đang trở nên rất tốt.
Ví dụ, việc nhấp vào "chấp thuận, chấp thuận, chấp thuận" là điều mà chúng ta đã làm. Và con người cũng không giỏi về điều đó, đúng không? Họ cứ mặc định. Và vì vậy, giờ đây chúng ta bắt đầu có các Trí tuệ nhân tạo (AIs) thực sự có thể đảm nhiệm việc gắn cờ: "Đây có phải là một hành động rủi ro cao (high-risk action) không? Này, cái này nên được leo thang. Cái này có thể tự động chấp thuận (auto-approve) được."
Và điều đó thực sự khiến bạn nhận ra rằng sự chú ý của con người (human attention) sẽ trở thành một nguồn tài nguyên cực kỳ khan hiếm, đúng không? Việc thực hiện mọi thứ giờ đây dễ dàng. Việc "Đây có phải là một điều tốt không? Đây có phải là điều tôi muốn không? Điều này có phù hợp với giá trị, với mong muốn của tôi không?"—đó sẽ trở thành nút thắt cổ chai quan trọng nhất. Và vì vậy, tôi nghĩ việc xây dựng các hệ thống tính đến điều đó và thực sự suy nghĩ về yếu tố con người như vậy là điều quan trọng nhất cần làm."
Bảo mật trong Thế giới Trí tuệ nhân tạo
Bây giờ, một yếu tố con người khác: bảo mật. Bạn sẽ khuyên mọi người suy nghĩ thế nào về bảo mật trong thế giới Trí tuệ nhân tạo này? Tôi vừa nghe về các vụ vi phạm bảo mật liên tục gần đây với Vercel, và các mô hình này có khả năng đáng kinh ngạc trong việc tìm kiếm các lỗ hổng bảo mật (security holes). Vậy, bạn khuyên mọi người ở đây nên sử dụng các mô hình này như thế nào để tìm ra những vấn đề bảo mật đó?
"Tôi nghĩ có một vài cấp độ cho câu trả lời. Tôi nghĩ rằng internet đã là một nơi mà bảo mật đã trở thành một mối quan tâm quan trọng không ngừng gia tăng theo thời gian. Bạn hãy nghĩ về nơi nó bắt đầu, đi qua thập niên 90 với virus, worms (sâu máy tính) và malware (phần mềm độc hại) và chúng ta đã vượt qua điều đó.
Tôi nghĩ chúng ta cũng đang chuyển sang một chế độ bảo mật cao hơn nhiều, nhưng nó đòi hỏi một nỗ lực trên toàn internet để đạt được điều đó. Và rất nhiều điều này, thành thật mà nói, chỉ là một lần nữa dựa vào công nghệ, có những mô hình này. Chúng có thể quét codebase của bạn. Chúng thực sự có thể được sử dụng cho red teaming đầu cuối đến đầu cuối (end-to-end red teaming). Có rất nhiều điều có thể làm được với chúng.
Và rất nhiều cách chúng tôi đang suy nghĩ về các mô hình và cải tiến tiếp theo là thực sự dựa vào cách chúng tôi thực sự tận dụng chương trình truy cập đáng tin cậy (trusted access programs)? Làm thế nào chúng ta tận dụng cộng đồng những người thực sự quan tâm đến việc trở thành người bảo vệ (defenders) và làm cho internet an toàn hơn? Tôi nghĩ đó là điều mà mọi người đều có vai trò và có thể tham gia.
Nhưng điều số một chỉ là nhận ra rằng những mô hình này rất mạnh mẽ, nhưng chúng không phải là phép thuật, đúng không? Chúng chỉ là một phần của hệ sinh thái phục hồi tổng thể (overall resilience ecosystem). Và tôi nghĩ rằng chúng ta với tư cách là một xã hội, và tôi nghĩ mọi công ty một lần nữa thực sự đóng góp vào điều này, có điều gì đó để xây dựng theo cách chúng ta kết hợp chúng theo cách mang lại sự đảm bảo cao hơn và sự chắc chắn hơn về tác động của việc liệu đó có phải là một bản vá (patch) cụ thể mà bạn đang áp dụng, liệu đó có phải là việc suy nghĩ về cách bạn đảm bảo rằng bạn chỉ đang triển khai các bản cập nhật nhanh chóng khi chúng được phát hành. Vì vậy, tôi nghĩ rằng có rất nhiều việc phải làm, nhưng tôi có rất nhiều sự lạc quan về nơi điều này sẽ đến."
Thích nghi với Tốc độ Thay đổi Nhanh Chóng
"Hãy chuyển sang tốc độ. Dường như mọi thứ đang diễn ra ngày càng nhanh hơn. Chúng ta đang sống trong một thế giới của thay đổi tăng tốc (accelerating change). Chúng ta đã nói về việc bạn đang cố gắng bắt kịp mọi thứ như thế nào khi bạn đi bộ đến đây. Làm thế nào để bạn bắt kịp với tất cả những thay đổi tăng tốc này? Bạn sẽ khuyên mọi người ở đây làm thế nào để theo kịp mọi thứ đang thay đổi?
Vâng, tôi nghĩ đây là trạng thái bình thường mới, và tôi nghĩ ở một mức độ nào đó, không hẳn là vì Trí tuệ nhân tạo (AI). Tôi nghĩ đó chỉ là xu hướng công nghệ trong hai thập kỷ qua. Có nhiều người làm mọi thứ hơn. Mọi việc dễ dàng hơn bao giờ hết. Rào cản gia nhập (barrier to entry) giảm xuống, nghĩa là cũng dễ dàng hơn rất nhiều để tạo ra giá trị, đúng không? Để có được những thành công lớn.
Và vì vậy, tôi nghĩ rằng việc thực sự cố gắng lắng nghe và hiểu những gì đang thay đổi. Và ở một mức độ nào đó, nó luôn bắt đầu với cùng một điều, đó là: tự mình trải nghiệm công nghệ. Rất khác biệt khi nghe mô tả về Trí tuệ nhân tạo (AI) so với việc tự mình sử dụng nó. Nhưng điều tuyệt vời về Trí tuệ nhân tạo (AI) là nó rất trực quan (intuitive)."
Hiểu rõ model và Kỹ năng cốt lõi
Đó là toàn bộ ý nghĩa: thay vì bạn phải tự uốn mình theo máy móc, thì máy móc lại uốn mình theo bạn, đúng không? Nó đang làm việc cho bạn và nên là thứ mà bạn hỏi, rồi nó thực hiện. Và vì vậy, tôi nghĩ rằng việc cố gắng nắm bắt được những gì đang thay đổi, những gì có thể, và những điểm mà các model còn chậm. Đó, tôi nghĩ, là kỹ năng cốt lõi sẽ thực sự quyết định rất nhiều thành công của các công ty trong tương lai.
Cân bằng giữa tốc độ và trách nhiệm
Và mặt khác, các bạn đã giữ lại các
modelđể làm việc với cácagentbảo mật. Tức là ngược lại với việc đi nhanh nhất có thể. Vậy các bạn cũng đang làm mọi thứ một cách có trách nhiệm. Làm thế nào để các bạn cân bằng điều đó, vì bạn đang ở trong một môi trường cạnh tranh, muốn triển khai nhanh nhất có thể, nhưng đồng thời cũng cố gắng làm điều đúng đắn?
Vâng, tôi nghĩ ở cấp độ giá trị, điều mà OpenAI hướng tới là chúng tôi thực sự muốn đặt sức mạnh của Trí tuệ nhân tạo vào tay mọi người. Chúng tôi tin rằng mọi người có thể – chúng tôi muốn trao quyền cho mọi người xây dựng tương lai bằng các công cụ đang được tạo ra, nhưng chúng ta cần làm điều đó một cách thận trọng, đúng không? Chúng ta thực sự phải suy nghĩ về cả hai mặt: đây là lợi ích, đây là rủi ro; làm thế nào để tối đa hóa lợi ích, làm thế nào để giảm thiểu rủi ro đó? Và tôi nghĩ rằng trong an ninh mạng (cybersecurity) và an ninh sinh học (biosecurity), đó là những lĩnh vực mà chúng tôi rất thận trọng. Chúng tôi đã xây dựng và làm việc về cả các biện pháp giảm thiểu và các chương trình tiếp cận đáng tin cậy (trusted access programs) này trong một thời gian khá dài. Và điều chúng tôi thấy đang đến là các model sẽ ngày càng mạnh mẽ và có khả năng liên tục trên mọi chiều kích của khả năng.
Và, bạn biết đấy, chúng tôi đã công bố tuần trước về việc mở rộng chương trình trusted access for cyber của mình. Tiện thể, có ai ở đây đã nộp đơn chưa? Không ai à? Ồ, tôi thấy một cánh tay, hai cánh tay. Được rồi, nhiều bạn nên đăng ký đi, nó rất tuyệt. Chúng tôi thực sự cần giúp đỡ, bởi vì rất quan trọng là những người đáng tin cậy, có trách nhiệm và thực sự muốn thúc đẩy các model này phải tham gia vào chương trình, bởi vì đó là cách nó sẽ mang lại lợi ích cho tất cả mọi người. Chúng tôi sẽ có nhiều điều để thông báo hơn trong những tuần tới về cách chúng tôi mở rộng chương trình. Nhưng đồng thời, khi chúng tôi phát hành các model cho mọi người, các biện pháp giảm thiểu mà chúng tôi có và cách chúng tôi sẽ điều chỉnh chúng để thực sự cân bằng, đúng không? Để thực sự cố gắng đưa những khả năng này đến với càng nhiều người càng tốt, đồng thời đảm bảo rằng chúng tôi đang xem xét các rủi ro và có khả năng observability (khả năng quan sát) đối với chúng, và đảm bảo rằng việc triển khai này là tích cực tối đa. Vì vậy, tôi nghĩ câu trả lời ngắn gọn là: đó là cốt lõi sứ mệnh của chúng tôi. Chúng tôi rất quan tâm đến tác động của những gì chúng tôi đang làm, không chỉ đơn thuần là xây dựng công nghệ một cách biệt lập, mà đó là nỗ lực của cả cộng đồng, cả thế giới để thực sự đạt được mục tiêu chúng ta cần.
Chiến lược tập trung của OpenAI
Và bây giờ, chuyển từ các
modellên đến lớp ứng dụng (application layer), nơi mà rất nhiều người ở đây đang xây dựng. OpenAI quyết định như thế nào về những gì sẽ xây dựng trong lớp ứng dụng và những gì sẽ bỏ qua?
Vâng, có lẽ mọi người đã thấy từ 'tập trung' được áp dụng cho OpenAI khá nhiều gần đây, có thể là lần đầu tiên trong một thời gian.
Cười
Trong một thời gian.
Và...
Nó cũng đã được áp dụng cho cô ấy.
Và điều đó khó khăn, bởi vì lĩnh vực
Trí tuệ nhân tạolà một lĩnh vực đầy cơ hội, đúng không? Giống như bất cứ điều gì bạn có thể tưởng tượng đều sẽ rất tuyệt vời. Không còn nghi ngờ gì nữa, nó sẽ rất tuyệt. Và chúng tôi, với tư cách là một công ty, một công ty duy nhất, bất kể chúng tôi xây dựng bao nhiêucompute(sức mạnh tính toán), bất kể chúng tôi có bao nhiêu người, cũng chỉ có thể làm được một phần nhất định. Vì vậy, rất nhiều điều chúng tôi đã và đang suy nghĩ là chiến lược tập trung nhất nào có thể bao quát các phần của không gian, bạn biết đấy, có thể là tỷ lệ 80/20 hoặc chỉ là những phần của không gian mà chúng tôi nghĩ rằng có thể tạo ra tác động lớn nhất.
Và tôi nghĩ hiện tại rất rõ ràng, chúng ta đang trải qua quá trình chuyển đổi sang agentic transition. Vì vậy, các sản phẩm đang... và nó không chỉ là về enterprise (doanh nghiệp) so với consumer (người tiêu dùng), đúng không? Rõ ràng là chúng tôi đang rất nghiêm túc về enterprise, chúng tôi đang bán hàng cho các công ty lớn và xây dựng một muscle (cơ chế) và sales motion (động thái bán hàng) ở đó. Nhưng consumer, consumer sẽ thay đổi, đúng không? Đó là một thuật ngữ rất rộng bao gồm nhiều thứ. Nhưng cái phần của consumer không chỉ về năng suất mà còn về mục tiêu, về việc đạt được mục tiêu của bạn, thậm chí là biết mục tiêu của bạn là gì, có thể khơi gợi điều đó và có một Trí tuệ nhân tạo có thể chủ động làm điều đó. Tất cả đều là một thứ.
Cuối cùng, chúng tôi đang cố gắng xây dựng một AGI (Trí tuệ nhân tạo tổng quát) mà bạn có thể nói chuyện, có tất cả ngữ cảnh này mà bạn có thể sử dụng trong cuộc sống cá nhân, công việc của bạn, và nó đáng tin cậy, đúng không? Mà bạn có thể tìm đến để xin lời khuyên và nó sẽ cung cấp cho bạn thông tin hữu ích, có thể là thông tin sức khỏe hoặc về tài chính, hoặc bạn biết đấy, về việc bạn đang cố gắng tìm ra việc phải làm với sự nghiệp của mình. Tất cả những điều này đều dẫn đến một mục tiêu duy nhất và điều đó có nghĩa là chúng tôi phải đưa ra một số quyết định rất đau đớn về những gì không nên làm, nhưng tôi nghĩ tôi chỉ muốn nói rằng đó là tầm nhìn mà chúng tôi nhìn nhận mọi thứ, và những điều phù hợp với tầm nhìn đơn nhất về những gì chúng tôi muốn xây dựng, bạn nên mong đợi chúng tôi sẽ theo đuổi.
Tương lai của công việc và tương tác với Trí tuệ nhân tạo
Hiểu rồi. Bạn có nghĩ rằng trong vài năm nữa, chúng ta sẽ lập trình với
command lines(dòng lệnh) vàagent(tác nhân), hay mọi thứ sẽ thay đổi hoàn toàn?
Ý tôi là, tôi nghĩ rằng chúng ta đang ở một trạng thái rất không tự nhiên về cách chúng ta làm việc. Chúng ta đều ngồi sau chiếc hộp này và gõ phím. Rõ ràng là cơ thể chúng ta không được thiết kế cho điều này. Chúng ta bị hội chứng ống cổ tay (carpal tunnel) và, bạn biết đấy, vai gù và đủ thứ. Và tôi không nghĩ chúng ta muốn điều đó. Tôi không nghĩ bất kỳ ai trong chúng ta muốn điều đó. Tôi nghĩ rằng chúng ta...
Muốn có nhiều thời gian rảnh hơn.
Chúng ta muốn nhiều hơn. Nhưng không nhất thiết là về thời gian rảnh, đúng không? Giống như bạn muốn dành nhiều thời gian hơn cho những người thân yêu của mình. Vâng. Bạn muốn dành nhiều thời gian hơn để nói chuyện với mọi người và đưa ra những ý tưởng tuyệt vời, hoặc chỉ là những gì bạn đam mê, hoặc chỉ là hiểu bản thân mình. Vì vậy, có lẽ bạn muốn trở thành CEO của một tổ chức gồm 100.000 agent? Điều đó thực sự có vẻ khá tốt. Và tôi nghĩ rằng tất cả chúng ta sẽ có thể hoàn thành nhiều việc hơn. Nhưng cơ chế của nó sẽ khác biệt như việc từ việc phải viết mọi thứ bằng tay với bút lông ngỗng hoặc thứ gì đó, đến việc có thể chỉ cần gửi một tin nhắn văn bản và nhờ người khác thực hiện công việc thay mặt bạn để đạt được mục tiêu của bạn.
Trí tuệ nhân tạo và các ranh giới khoa học
Được rồi, chúng ta đã nói về
compute, chúng ta đã nói vềmodel, an ninh,agentvà lớp ứng dụng. Hãy nói về ranh giới mới (frontier). Khi nào cácmodelsẽ đủ tốt để thúc đẩy các ranh giới của khoa học,Trí tuệ nhân tạovật lý (physical AI)? Có vẻ như chúng ta đã có Jen Fam ở đây. Có vẻ như cácLLMđã là một luậtscaling law(luật mở rộng quy mô) tuyệt vời chodigital intelligence(trí tuệ kỹ thuật số). Nó chưa mạnh mẽ như vậy đối với robot học, đối vớiphysical intelligence(trí tuệ vật lý), đối với các khía cạnh của sinh học và khoa học mà các vấn đề có lẽ khó xác minh hơn nhiều hoặc mất nhiều thời gian để xác minh. Vậy, bạn đang theo dõi khoa học vàphysical AItrong thế giới như thế nào?
Vâng, khoa học là một lĩnh vực mà chúng tôi thực sự đang dồn lực vào và chúng tôi thấy có triển vọng đạt được những tiến bộ thực sự đáng kinh ngạc. Và chúng tôi bắt đầu thấy một số dấu hiệu của sự sống, và tôi nghĩ điều quan trọng là phải luôn dựa vào những gì đang xảy ra hôm nay khi cố gắng dự đoán điều gì sẽ xảy ra trong sáu tháng, một năm tới. Ví dụ, chúng tôi đã có một kết quả vật lý, trong đó Trí tuệ nhân tạo của chúng tôi đã đưa ra một công thức rất đẹp mà các nhà vật lý đã làm việc về vấn đề này trong một thời gian khá dài cho rằng hoàn toàn bất khả thi. Họ nghĩ đó có thể là một vấn đề không thể giải quyết được, và nó khá quan trọng, đúng không? Giống như những nhà vật lý thực sự nghiêm túc, những người thực sự xem đây là một bước tiến để thực sự có thể đạt được một loại câu trả lời nào đó cho trọng lực lượng tử (quantum gravity) và tất cả những điều này. Chưa đạt được, nhưng đó là một bước tiến lớn hơn rất nhiều so với vị trí của chúng tôi chỉ vài tháng trước, và vì vậy nó khiến bạn thực sự tự hỏi một năm nữa chúng ta sẽ đi được bao xa.
Hiện tại, những thứ như sinh học thì khác với vật lý và toán học, đúng không? Bạn phải rời bỏ thế giới mô phỏng (simulated world) tuyệt đẹp của mình và, bạn biết đấy, đối phó với thực tế hỗn độn. Nhưng tôi nghĩ chúng tôi đã học cách đối phó với thực tế hỗn độn trong các lĩnh vực khác, kỹ thuật phần mềm là một ví dụ hoàn hảo, nơi chúng tôi thực sự nhận ra rằng chỉ xây dựng thứ giải quyết các cuộc thi lập trình là không đủ. Bạn cần một thứ đã thấy các code base thực tế, lộn xộn, con người can thiệp theo nhiều cách khác nhau, như việc adversarial banging (tấn công đối kháng) vào nó. Và vì vậy, tôi nghĩ rằng về khoa học, tôi kỳ vọng chúng ta sẽ thấy một thời kỳ phục hưng thực sự. Bạn biết đấy, có thể chúng ta sẽ thấy một số kết quả lớn trong năm nay. Năm tới, tôi nghĩ sẽ là một khoảng thời gian cực kỳ hoang dã (wild wild time).
Thư giãn sau AGI
Chúng ta đang sống trong những thời điểm thú vị. Tôi hứa sẽ để bạn đi đúng giờ vì bạn là một người bận rộn. Trước khi chúng tôi để bạn rời đi, chúng ta còn một phút. Khi bạn không có thời gian nhưng sớm sẽ có rất nhiều thời gian. Bạn và Anna làm gì để giải trí?
Ồ, giải trí ư? Ý tôi là, giống như bất kỳ ai khác thôi: thích xem phim, đi bộ đường dài (hikes), những thứ tương tự. Chúng tôi không có nhiều thời gian cho những việc đó như có lẽ chúng tôi sẽ có sau khi AGI ra đời. Nhưng bạn phải tận hưởng cuộc hành trình trên đường đi.
Cảm ơn Greg đã tham gia cùng chúng tôi. Cảm ơn tất cả mọi người.